Варшавский В. И., Поспелов Д. А
Вид материала | Документы |
СодержаниеГ л а в а 4 КОГДА "ВСЕ ПО СПРАВЕДЛИВОСТИ" |
- Герберт Александер Саймон Исследователи ии: Лотфи Заде Исследователи ии: А. А ляпунов,, 9.34kb.
- «Как привлечь средства государственных институтов развития» Варшавский Владислав Римович, 48.54kb.
- Аннотация к научно-образовательному материалу, 114.81kb.
- 141. Поспелов В. И., Стальнов В. С. Содружественная аккомодация глаз при дисбинокулярной, 167.36kb.
- Тезисы докладов участников III международного конгресса «Россия и Польша: память империй, 1372.37kb.
- Д. А. Поспелов, Г. С. Осипов, 487.33kb.
- Варшавский А. С. Следы на дне, 1828.32kb.
- Рабочая программа учебной дисциплины Для направления 080100. 62 «Экономика» (программа, 562.39kb.
- Диспут с Пирром: прп. Максим Исповедник и христологические споры VII столетия / Отв, 73.89kb.
- Программа дисциплины: Имитационные модели для направления Прикладная математика и информатика, 120.53kb.
D животном мире и мире растений неоднородность помогает регулировать соотношение тех или иных видов в биоценозах и фитоценозах. В качестве иллюстрации приведем две простенькие модели, хорошо известные в экологии.
На рис. 3.19,а показана ситуация, сложившаяся в среде, где живут бактерии, изображенные в виде овалов. В некоторые из них проникли частицы, называемые плазмидами. Эти органические образования стоят на грани живого и неживого. Плазмиды самовоспроизводятся и имеют обмен с внешней для них средой. Этой средой служат для них тела бактерий. В условиях неперенаселенности, когда бактерии имеют достаточное количество пищи, плазмиды выделяют в окружающую их среду вещество, называемое иммунопротеином. На рис. 3.19, а плазмиды показаны зачерненными кружками, а иммунопротеин — точками. Но вот количество бактерий увеличилось на
108
с
только, что они начинают испытывать голод. Голодают и плазмиды. Это приводит к тому, что плазмиды, оказавшиеся за граничным значением голодания, начинают вырабатывать не иммунопротеин, безвредный для бактерии-хозяина, а комицин. На рис. 3.19,6 показана такая ситуация, когда одна из плазмид начинает вырабатывать комицин (зачерненные квадратики в теле бактерии). Комицин убивает бактерию и плазмиду. Но комицин, попадая во внешнюю среду, убивает в определенной окрестности все бактерии, не содержащие в своем теле иммунопротеин (рис. 3.19, б), после чего в среде остается уже меньшее число бактерий (рис. 3.19,г), Если их все еще слишком много, то найдется такая плазмида, которая опустится ниже «порога жизни" и начнет срабатывать комицин, что приведет к дальнейшему сокращению популяции бактерий. Плазмиды же делятся вместе с бактериями только тогда, когда пищи становится «слишком много", выше некоторого
109
порога, превышение которого вызывает деление у «чистых» бактерий.
Эту реальную модель саморегулирования численности организмов можно представить и в виде неоднородного коллектива автоматов, живущего в некоторой среде, в которой поддерживается постоянный уровень пищи. Вся пища делится поровну между членами коллектива. Автоматы - плазмидоносители делятся в том случае, когда количество поглощаемой ими пищи превышает некоторый порог Q1. Остальные автоматы производят деление при более низком пороге Q2. Когда автомат - плазмидоноситель получает пищи меньше, чем Q3 < Q2, то он погибает и уничтожает все обычные автоматы, которые находятся от него на определенном расстоянии (например, на торе в клетках, отстоящих от данной на расстоянии, не превышающем 5-кратного размера клетки). Для того чтобы одновременно не погибли все автоматы - плазмидоносители в модели, случайным образом выбирается один из них. Если после этого уровень пищи все еще не превосходит Q3, то случайным образом выбирается еще один автомат, способный уменьшить величину популяции. Моделирование такого процесса на ЭВМ показало почти точное совпадение процесса регулирования с тем, что происходит в природе у бактерий.
Вторая модель регулирования численности чуть-чуть сложнее. Пусть члены коллектива могут использовать друг относительно друга при столкновениях (например, при случайных парных взаимодействиях) две стратегии: агрессивную и угрожающую. Если оба члены коллектива применяют агрессивную стратегию, то это напоминает драку двух петухов или схватку оленей. Оба противника наращивают усилия и не желают уступать друг другу. И лишь гибель или позорное бегство одного из них выявляет победителя. Если один из членов коллектива применяет агрессивную стратегию, а другой лишь угрожающую, то при достижении определенного уровня агрессивности тот, кто придерживался угрожающей стратегии, спасается бегством. Встреча собаки и кошки — яркий пример этой ситуации. Собака сначала всегда придерживается агрессивной стратегии, а кошка отвечает ей угрожающей (выгибает спину, издает шипение и т. д.). Если собака пугается и переходит на угрожающую страте-
110
гию, то после взаимных угрожающих поз животные расходятся. Если же собака продолжает наращивать усилия в рамках агрессивной стратегии, то кошка спасается бегством.
Противники с самого начала могут оба придерживаться угрожающих стратегий. Они принимают различные ритуальные угрожающие позы, и этот процесс продолжается до тех пор, пока один из них не признает себя побежденным (для этого он, как правило, принимает специальную ритуальную позу подчинения). Подобное соперничество можно наблюдать у собак, серых гусей, тетеревов и многих других животных.
Рассмотрим модель подобного соперничества. Агрессивную и угрожающую стратегии будем обозначать соответственно буквами А и У. Составим таблицу, в которой оценены все возможные комбинации парного соперничества (табл. 3.6).
Таблица 3.6
-
Вто
рой
А
У
Первый
А
(-5, -5)
(+10, 0)
У
(0, +10)
(+2, +2)
На пересечении строк и столбцов таблицы стоят пары чисел. Это условные оценки выигрышей — проигрышей соперников при выборе той или иной стратегии поведения. Если, например, один из них (первый) выбрал стратегию А, а второй — стратегию У, то первый получает выигрыш, равный 10 условным единицам, а второй остается при «своем интересе». Поясним теперь, как возникли эти оценки. Сначала мы условно оцениваем победу при соперничестве как выигрыш, равный +10, серьезное повреждение или гибель, которые могут произойти при наращивании усилий в стратегиях А, оцениваем как (—20). Поскольку при встрече двух агрессоров исход поединка мы считаем равновероятным, то математические ожидания поощрения — наказания при паре стратегий (А,А) есть 0,5*10+0,5*(—20)= --5. Аналогично для встречи со стратегиями (У,У) это ожидание
111
вычисляется как 0,5*10+(—3)=2. Здесь оценка (—3) есть плата за нервное напряжение в длительном конфликте при стратегии У. Эта стратегия приводит к значительному расходу нервных и других ресурсов животного. Таким образом, таб. 3,6 задает платежную матрицу некоторой игры.
Рассмотрим организм, который может по своему желанию менять свою стратегию в зависимости от обстоятельств. Этот организм можно смоделировать в виде автомата с двумя состояниями, соответствующими стратегиям А и У, использование которых определяется вероятностями РA и Ру. При этом, конечно, РA+Ру=1. Рассмотрим коллектив, состоящий из подобных автоматов, и предположим, что он неоднороден, причем неоднородность задается различными значениями РA. В частности, при РA==1 автомат является чистым агрессором. Он во всех случаях жизни придерживается стратегии А. При РA==0 автомат всегда придерживается стратегии У.
Как и в предшествующей модели, зададим некоторые пороги Q1 и Q2. Если автомат накапливает выигрыш, превышающий Q1, то он «размножается». Вместо него появляются два автомата с тем же значением РA у каждого. Если же накопленное наказание становится по абсолютной величине больше Q2, то автомат «вымирает». Возникает вопрос об оптимальном значении РA при случайном парном взаимодействии автоматов в коллективе. При моделировании на ЭВМ было показано, что коллектив из достаточно большого количества описанных автоматов, в котором значения РA имели распределение, близкое к равномерному, эволюционирует в сторону однородного коллектива, для которого РA приближается к значению 8/13. Из теории игр следует, что смешанная стратегия, при которой стратегии А и У выбираются с вероятностями 8/13 и 5/13, является для игрока в определенном смысле наилучшей. Она обеспечивает игроку максимально возможный гарантированный выигрыш (при самых наихудших для него действиях противника). Интересно было бы получить экспериментальные данные из наблюдений за животными (например, кошками), которые давали бы оценки частоты выбора ими стратегий А и У при встрече с противником, равным по силе. К сожалению, такими данными мы не располагаем.
112
Вернемся к тому, с чего мы начали настоящую главу. События в Арбатове побудили нас рассмотреть ряд моделей коллективного взаимодействия и соглашений. Эти модели, будь дети лейтенанта Шмидта образованными в области децентрализованного управления, позволили бы им извлекать из участков куда больший доход, чем тот, которого они достигли. И в этом сила моделей, с которыми мы познакомились.
В заключение укажем еще на одну модель распределения участков, которой можно было бы воспользоваться при экспансии детей лейтенанта Шмидта на территориях, на которых они никогда не бывали и сведений о которых у них нет. Такие участки кажутся равноценными, и распределение их вряд ли кого-нибудь взволнует. Жеребьевка их чисто формальна. Но вот участники дележа разъехались на места и начали «работу». Через некоторое время они уже могут оценить средний доход с доставшегося им участка. Повторный съезд участников конвенции должен восстановить справедливость (например, за счет отступных или общей кассы). Но владельцам богатых участков этого не хочется. Они не альтруисты. Тогда можно использовать механизм направленной лжи. При вопросе о среднем доходе с участка спрашиваемый говорит истинную цифру лишь тем, чей доход выше, или тем, кому невыгодно переходить на его участок. Остальным он врет, снижая истинный доход до того уровня, когда переход для спрашивающего становится невыгодным. В этой модели участники должны располагать различной информацией о реальных доходах других участников.
При этом увеличение объема информация способствует улучшению условий функционирования данного автомата. Обратим внимание читателей на это важное свойство обсуждаемой модели. В модели рефлексивного поведения такая прямая зависимость не наблюдается.
Все модели, которые мы предложили в данной главе, обладают одной особенностью. Если рассматривать коллектив автоматов как прообраз некоторой биологической, социальной или технической системы, то эта система функционирует в параллельном режиме, все ее подсистемы действуют независимо друг от друга и им не приходится ждать каких-либо
113
результатов работы других подсистем. Такое положение дел встречается не столь уж часто. В сложных системах работа подсистем часто взаимоувязана, существуют определенные временные зависимости, отражающие порядок срабатывания подсистем. Эти зависимости могут носить как вероятностный, так и детерминированный характер. Поэтому в последующих двух главах мы рассмотрим децентрализованное управление, осуществляемое при таких дополнительных ограничениях.
Г л а в а 4 КОГДА "ВСЕ ПО СПРАВЕДЛИВОСТИ"
«Мы холодны душой к нелепым чудесам.
И лишь возможное всегда по вкусу нам».
Буало
§ 4.1. Прав ли был Остап Бендер?
«..у окошечка администратора господствовало оживление. Там стояла цветная очередь. Молодые люди, в фасонных пиджаках и брюках того покроя, который провинциалу может только присниться, уверенно размахивали записочками от знакомых режиссеров, артистов, редакций, театрального костюмера, начальника района милиции и прочих, тесно связанных с театром лиц, как то: членов ассоциации теа- и киноработников, общества «Слезы бедных матерей», школьного совета «Мастерской циркового эксперимента» и какого-то «Фортинбраса при УМСЛОПОГАСЕ». Человек восемь стояли с записками от Эспера Эклеровича.
Остап врезался в очередь, растолкал фортинбрасовцев и, крича:—«Мне только справку, вы же видите, что я даже калош не снял!», пробился к окошечку и заглянул внутрь».
Прав ли был герой романа «Двенадцать стульев», когда считал, что с коротким делом можно прорываться без очереди, или великий комбинатор заблуждался? Как должна была вести себя очередь? И как себя должен был вести администратор?
Очередь! Очередь становится таким же спутником нашего быта, как еда, сон, развлечения. Впрочем, как не вспомнить здесь очередь за едой в столовой, очередь за сном в гостинице, очередь за развлечением в театральной кассе. Временами нам кажется, что очередь является порождением чьей-то злой воли, результатом деятельности враждебных сил. Однако в действительности, возникновение очередей — такая же закономерность, как выпадение снега зимой и дождя летом. Плохая, неразумная организация не порождает очередь, а лишь увеличивает ее длину.
116
Понятие очереди безусловно предполагает наличие тех, кто в ней стоит. Заметим, что в очереди могут стоять не только люди, а, например, коровы, ожидающие, когда их будут доить. Не только одушевленные предметы, а, например, радиоприемники, ожидающие починки, или месторождения полезных ископаемых, ожидающие, когда их разведают, а разведанные — когда их освоят. Очередь могут образовывать и объекты не материальной природы, например научные идеи, ожидающие, когда их разработают и внедрят.
Объекты, стоящие в очереди, независимо от их природы, мы будем называть клиентами. При этом очередью мы будем именовать не всякую совокупность клиентов, а лишь совокупность клиентов, связанных общей целью. Такой целью является стремление быть обслуженным.
Обслуживание не обязательно должно быть активным. Например, без двух минут восемь вы встали в очередь, чтобы расписаться в книге прихода на работу. Вы расписались, но «с точки зрения» очереди, эта книга обслужила вас
Весь комплекс обслуживающих средств: место обслуживания, обслуживающий персонал и т. п. в совокупности с правилами обслуживания мы будем называть каналом обслуживания*).
Совокупность клиентов, каналов обслуживания и правил взаимодействия между клиентами и каналами, клиентов между собой и каналов между собой мы будем называть системой обслуживания.
Для изучения системы обслуживания мы должны знать, каким способом клиенты попадают в систему или каковы механизмы, или модели механизмов, порождающие у клиентов потребность в обслуживании. Должны знать, каковы характеристики процесса обслуживания. Должны знать, как организовано или как может быть организовано поведение клиентов в очереди и их взаимодействие друг с другом. Как клиенты попадают из очереди в канал обслуживания и как каналы обслуживания получают клиентов.
*) Для читателей, знакомых с терминологией теории массового обслуживания, отметим, что введенное нами понятие «канал обслуживания» для классических моделей этой теории эквивалентно понятию «обслуживающий прибор». Но наше понимание моделей обслуживания шире, чем в рамках упомянутой теории.
116
И, наконец, мы должны представлять себе возможные механизмы взаимодействия каналов обслуживания друг с другом как в процессе получения клиентов, так и в процессе их обслуживания.
У внимательного читателя может возникнуть сомнение в логичности наших определений. С одной стороны, мы включаем клиентов в качестве элементов в систему обслуживания, а, с другой стороны, говорим, о том, что клиенты попадают откуда-то в эту систему. Но противоречие это чисто внешнее. Клиенты действительно попадают в систему обслуживания извне, но затем становятся ее элементами. И дрова в отопительной системе могут проиллюстрировать эту мысль.
Для организации управления в системе обслуживания мы, кроме правил поведения системы, с помощью которых можно осуществлять управление, должны также уметь оценивать качество функционирования этой системы. Нетрудно понять, что здесь могут существовать явно противоречивые критерии, Как правило, в системах обслуживания критерий повышения рентабельности обслуживания вступает в противоречие с критериями качества обслуживания. Повышение рентабельности функционирования городского транспорта путем повышения загрузки транспортных средств вряд ли будет встречено с пониманием пассажирами. Именно противоречивость оценок качества функционирования делает системы обслуживания наиболее интересными с точки зрения организации в них оптимального управления.
Как клиенты поступают в систему? Самый простой способ — поступление клиентов через равные промежутки времени. Если время обслуживания меньше этого промежутка или равно ему, то очередь возникать не будет. Если же время обслуживания превышает интервал между появлениями клиентов, то очередь будет неограниченно возрастать.
Максимальное число клиентов, которое может обслужить канал за фиксированный отрезок времени, будем называть пропускной способностью канала. Доля времени, в течение которой система занята обслуживанием, будет определять нагрузку канала. При постоянном интервале поступления клиентов, или, как мы иногда будем говорить, поступлением заявок на обслуживание, и постоянном времени
117
обслуживания очередь не возникает, если нагрузка не превышает пропускной способности канала.
Если темп поступления клиентов или длительность обслуживания подвергаются случайным колебаниям, то очередь будет возникать всегда! Даже если пропускная способность системы больше, чем нагрузка. Очередь будет тем больше, чем больше разброс длительности интервала между поступлениями клиентов и чем больше разброс длительности обслуживания. Очередь также возрастает по мере приближения нагрузки к пропускной способности системы. При приближении нагрузки к пропускной способности очередь начинает расти неограниченно. Зная, как характеристики очереди зависят от параметров системы, мы можем искать пути их изменения, приводящие, например, к уменьшению очереди.
Работая над гл. 3, мы в один из дней решили посмотреть кинофильм и начали звонить в ближайший кинотеатр, чтобы узнать репертуар и время начала сеансов. Телефон кинотеатра, как всегда, был непрерывно занят. Непрерывно набирая номер в течение 20 мин, мы наконец услышали:
— «Здравствуйте! Вам отвечает автоответчик кинотеатра «Прометей». Сегодня смотрите в нашем кинотеатре: на детском утреннике в 9 ч утра кинофильм «Внимание, черепаха!». На сеансах 11 и 13 ч новая кинокомедия «Мимино». Новый художественный фильм «Приезжая» на сеансах 15 ч, 16 ч 40 мин, 18 ч 30 мин, 20 ч 20 мин и 22 ч 10 мин. Приглашаем посетить наш кинотеатр. Наш адрес: проспект Просвещения, д. 20». На часах было 16 ч, и нам казалось, что половину сообщения, которое мы прослушали, можно было бы опустить — нас мало интересовало, что показывали в кинотеатре до 16 ч. Нам казалось, что можно было опустить также две первых и предпоследнюю фразы — сокращение времени, необходимого для того, чтобы дозвониться до кинотеатра, с лихвой компенсировало бы некоторое отсутствие избыточной вежливости в ответе. Мы взялись за карандаши.
Оказалось, что сокращение длительности текста, приводящее к увеличению пропускной способности, так изменяет отношение пропускной способности к нагрузке, что среднее время ожидания уменьшается почти в 5 раз. Нам, чтобы дозвониться до кинотеат-
118
pa, потребовалось бы 4 мин вместо 20 мин. Этот выигрыш оправдывает затраты на смену пленки в автоответчике после начала каждого сеанса. Ведь если нам просто не повезло и среднее время, которое необходимо затратить, чтобы дозвониться в справочное бюро кинотеатра, равно не 20, а только 10 мин., то и в этом случае уменьшение вдвое времени обслуживания дает в час экономию около десяти человеко-часов, проведенных у телефона. Трудности ликвидации такого положения заключаются в том, что тысячи человеко-часов в месяц, затрачиваемые у телефонов в бесплодных попытках дозвониться в справочные службы кинотеатров, дополнительные нагрузки на каналы телефонной связи и коммутационное оборудование телефонных станций ни в коей мере не влияют на оценку эффективности функционирования кинотеатров и их справочных служб. Аналогичные выводы, кстати, можно сделать о большинстве телефонных систем обслуживания, куда чрезвычайно сложно дозвониться.
Моральный и материальный ущерб, приносимый очередями людям, очевиден. Но, быть может, он не столь уж важен, если речь идет о неодушевленных предметах? К чему в этом случае сводится ущерб, приносимый очередью?
Во-первых, и это относится ко всем очередям независимо от того, кто или что является клиентом, очередь должна где-то располагаться. Чем больше очередь, тем большего размера хранилища для клиентов следует создавать. Причем мы не можем ориентироваться на среднюю длину очереди — грубо говоря, в половине случаев действительная очередь будет больше средней. Создание помещений для расположения очереди (складов для хранения, стоящих в очереди изделии, буферной памяти для стоящих в очереди на обработку информационных массивов и т. п.) существенно удорожает системы обслуживания. В ряде случаев снижение объема хранилищ для очереди оправдывает расходы на введение дополнительных каналов обслуживания.
Во-вторых, клиенты, стоящие в очереди, изъяты из употребления. Люди, стоящие в очереди в магазине, в это время не работают, не читают книги, не воспитывают своих детей. Автомобили, стоящие в очереди на ремонт, не перевозят грузы. Стоимость
119
всего, что стоит в очереди, входит в стоимость системы обслуживания. Если большой магистральный нефтепровод заполнен нефтью, то эта нефть изъята из употребления и является составной частью нефтепровода, ее стоимость входит в стоимость нефтепровода, Так же и в системе обслуживания. Детали, стоящие в очереди на обработку, изъяты из употребления и в размере, равном средней длине очереди, входят в определение стоимости системы обработки. Среднее число автомашин, ожидающих своей очереди на ремонт, является составной частью системы автосервиса, и их стоимость входит в стоимость системы автосервиса.
Из сказанного ясно, что задача снижения средней длины очереди имеет явный экономический смысл.
Выше мы уже видели на примере, что среднюю длину очереди можно снизить, если уменьшить время обслуживания или, что эквивалентно, увеличить пропускную способность системы. Однако очень часто мы не в состоянии влиять на этот параметр. Можем ли мы вместе с тем уменьшить среднюю длину очереди?
Выше уже говорилось, что система обслуживания, кроме всего прочего, характеризуется взаимодействием клиентов в очереди, иначе говоря, договоренностью об их взаимном поведении в очереди. Такую договоренность мы будем называть дисциплиной обслуживания. Какие существуют дисциплины обслуживания?
Самая привычная для нас дисциплина носит название «первым пришел — первым обслужен». Это обычная, так называемая живая очередь. Существуют и экзотические дисциплины. Например,— последним пришел — первым обслужен. Смысл использования такой дисциплины может определяться различными соображениями, например конструкцией помещения для очереди. Порождающие указанную дисциплину хранилища для очереди называются магазином по аналогии с магазином для патронов в пистолете. Отсюда и название «магазинная память» в вычислительных устройствах. Дисциплина «последним пришел — первым обслужен» часто используется в системах противовоздушной обороны. Клиент (самолет), появившийся последним в зоне обслуживания, имеет большую вероятность быть обслуженным
120
(сбитым), так как он дольше других клиентов (самолетов) будет находиться в зоне обслуживания.
Дисциплины обслуживания предусматривают наличие различных приоритетов, что разрешает клиенту нарушить основную дисциплину очереди. Типичный пример установленного приоритета — табличка:
«Инвалиды Отечественной войны обслуживаются без очереди». Приоритетные правила чрезвычайно разнообразны и каждый раз связаны с конкретными условиями функционирования системы. Если мы не можем изменять нагрузку на систему и характеристики каналов обслуживания, т. е. их пропускную способность, то приоритетные правила остаются единственной возможностью вмешиваться в функционирование системы, т. е. управлять ее поведением. При этом возникают следующие вопросы. Существуют ли способы улучшить качество функционирования системы за счет введения приоритетов? Если существуют, то какие характеристики системы могут быть улучшены и за счет каких приоритетов? Существуют ли способы организации коллективного поведения клиентов или каналов обслуживания, обеспечивающие выработку системы приоритетов, оптимизирующей качество функционирования системы?
На все эти вопросы мы попытаемся ответить в следующих параграфах данной главы.