Варшавский В. И., Поспелов Д. А
Вид материала | Документы |
- Герберт Александер Саймон Исследователи ии: Лотфи Заде Исследователи ии: А. А ляпунов,, 9.34kb.
- «Как привлечь средства государственных институтов развития» Варшавский Владислав Римович, 48.54kb.
- Аннотация к научно-образовательному материалу, 114.81kb.
- 141. Поспелов В. И., Стальнов В. С. Содружественная аккомодация глаз при дисбинокулярной, 167.36kb.
- Тезисы докладов участников III международного конгресса «Россия и Польша: память империй, 1372.37kb.
- Д. А. Поспелов, Г. С. Осипов, 487.33kb.
- Варшавский А. С. Следы на дне, 1828.32kb.
- Рабочая программа учебной дисциплины Для направления 080100. 62 «Экономика» (программа, 562.39kb.
- Диспут с Пирром: прп. Максим Исповедник и христологические споры VII столетия / Отв, 73.89kb.
- Программа дисциплины: Имитационные модели для направления Прикладная математика и информатика, 120.53kb.
Каждый раз, говоря о коллективном поведении, мы имеем ввиду коллективное поведение объектов в некой системе. При организации такого поведения нас интересует, безусловно, достижение определенных системных целей, удовлетворение общесистемных критериев качества функционирования. При этом (и здесь основной смысл организации децентрализованного управления) отдельный объект не имеет информации об общих целях системы. Объект знает только свои локальные цели, локальные критерии, локальные функции предпочтения. Управление системой организуется путем формирования таких локальных условий и, быть может, таких правил локального взаимодействия, при которых удовлетворение локальных интересов отдельных объектов, составляющих систему, приводило бы к удовлетворению общесистемных целей. И здесь возникает естественный вопрос о том, что же является тем объектом в системе, локальное поведение которого мы организуем.
В предыдущих параграфах данной главы мы рассмотрели две игры — игру в размещения и игру в распределения (игру Гура). В обеих играх эффективность функционирования системы зависела от распределения ограниченного числа участников игры по стратегиям. В качестве примера мы говорили о распределении трудового ресурса по местам работы. Ресурсом в этих задачах могли служить объекты самой различной природы, например, задания, выполняемые в многопроцессорной вычислительной система. Существенным здесь было то, что мы
80
«персонифицировали» типы ресурса- и занимались организацией их коллективного поведения.
Вместе с тем, в качестве объектов, составляющих систему, можно рассматривать и потребителей ресурса. Тогда нас будет интересовать проблема организации их совместного поведения, обеспечивающего оптимизацию общесистемного эффекта использования ресурса.
З
адача об оптимальном распределении ресурса между потребителями имеет смысл только тогда, когда этот ресурс ограничен. В качестве ресурса могут выступать самые различные объекты: деньги, энергия, сырье, машины ч т. п. Существенно здесь то обстоятельство, что каждый потребитель, используя некоторое количество ресурса, добивается определенного эффекта. Для того чтобы задача о распределении ресурса имела смысл, необходимо также, чтобы в пределах всей системы эти эффекты были соизмеримы. Поиск такой общей меры является самостоятельной задачей и в ряде случаев (если не в большинстве), не привносится в систему «сверху», а также порождается совместным функционированием подсистем. Здесь, однако, мы будем предполагать, что такая мера существует.
Рассмотрим несколько примеров. Пусть у нас имеется система, состоящая из k объектов и одного обслуживающего устройства (рис. 3.10). Обслуживающее устройство периодически с периодом длительности Т через коммутатор подключается к каждому обслуживаемому объекту и работает с ним в течение
времени tk. При этом очевидно, что Сумма( tk )=Т. Длительность периода Т выступает здесь в качестве ограниченного ресурса, распределяемого между объектами обслуживания. На каждом объекте в результате обслуживания его в течение времени tk достигается эффект, равный Фиk(tk). Заметим опять, что все эффекты соизмеримы, т. е. измерены в одних и тех же
81
единицах. При этом могут существовать различные системные критерии качества функционирования.
Предположим, что в качестве объектов выступают следящие устройства с импульсным регулированием через один и тот же регулятор (обслуживающее устройство). Качество функционирования каждого следящего устройства, зависящее при заданном периоде от скважности сигналов регулятора, определяется, например, среднеквадратичным отклонением от отслеживаемой величины. Поведение системы определяется среднеквадратичным отклонением наихудшего устройства. В этом случае наилучшее поведение системы получается при достижении min max Фиk(tk). Нетрудно понять, что этот критерий удовлетворяется в том случае, когда среднеквадратичные ошибки во всех устройствах одинаковы. Действительно, если при определенном распределении времен обслуживания в течение периода в одном из каналов слежения ошибка больше, чем в других, то имеет смысл увеличить время обслуживания этого следящего устройства путем некоторого увеличения ошибки в других каналах. Здесь мы исключаем из рассмотрения такие экзотические случаи, когда распределение времен обслуживания, обеспечивающее равные ошибки во всех следящих устройствах, вообще недостижимо. Для этого. достаточно предположить, что ошибки в этих устройствах монотонно уменьшаются при уменьшении скважности регулирования. Оптимальное распределение ресурса в таком случае определяется решением системы уравнений
Фиk(tk) - Лямбда = 0, (k=1, k); Сумма (tk) = T.
В качестве общесистемного критерия может выступать и просто арифметическая сумма эффектов, которые возникают у потребителей ресурса, как, например, было с лесозаготовительными участками в приведенном выше примере (см. § 3.2). В системе, структура которой изображена на рис. 3.10, такой эффект функционирования системы может определяться суммарным достигаемым эффектом и поведением системы, обеспечивающем приближение к Сумма[Фиk(tk)]. В этом случае, как следует из теории нелинейного программирования, оптимальное распределение достигается в ситуации,. определяемой решением систе-
82
м
ы уравнений
где К имеет смысл цены на единицу используемого ресурса. В дальнейшем мы ограничимся указанными двумя типами задачи о распределении ресурса, хотя могут рассматриваться весьма разнообразные ее постановки. Например, имеет самостоятельный интерес задача о минимизации общего количества используемого ресурса при фиксированной сумме эффектов, достигаемых потребителями ресурса.
Как мы уже говорили, нас в задаче о распределении ресурса интересует организация коллективного поведения в условиях децентрализации, обеспечивающая решение, состоящее в удовлетворении общесистемного критерия функционирования. В этом параграфе мы займемся рассмотрением организации коллективного поведения потребителей ресурса.
При такой организации поведения мы, однако, не можем исключить из рассмотрения еще одного участника — владельца ресурса. О какой же децентрализации может идти речь при наличии центрального объекта, который располагает ресурсом и раздает его потребителям?
З
аметим, что мы рассматриваем децентрализацию. поведения при оптимизации и, следовательно, ресур-содержатель не должен решать никаких оптимизационных задач. Более того, мы будем стремиться к тому, чтобы обмен информацией в системе был достаточно простым, например, сводился бы к тому, чтобы потребители ресурса посылали в центр заявку на желательное количество ресурса, а центр достаточно простым способом на основании полученных заявок делил бы его между потребителями. Наиболее простой способ такого распределения—распределение всего ресурса пропорционально поступившим заявкам. Тогда, если хk — количество указанного в заявке k-го потребителя ресурса, то количество выделяемого ему ресурса равно
Теперь возникает естественный вопрос — существуют ли локальные правила формирования заявок на
83
ресурс при описанном способе его распределения, обеспечивающие оптимизацию поведения системы по общесистемному критерию?
Р
ассмотрим задачу с минимаксным критерием. Допустим вначале, что центральное устройство назначает величину л и сообщает ее всем потребителям ресурса, а потребители ресурса указывают свои заявки на ресурс так, чтобы сделать получаемый локальный эффект равным Лямбда. Тогда, если у потребителя эффект меньше Лямбда, он увеличивает заявку, а если больше — уменьшает ее. Если все потребители уменьшают свои заявки, то это означает, что Лямбда меньше, чем необходимо, а если увеличивают, то Лямбда больше, чем необходимо. В связи с этим центр ведет себя следующим образом: уменьшает Лямбда, если сумма заявок меньше наличного количества ресурса, и увеличивает Лямюда, если наличное количество ресурса меньше суммы заявок на него. В ситуации, когда все эффекты равны Лямбда и сумма запрошенного ресурса равна наличному его количеству, система находится в устойчивом равновесии. Заметим, однако, что мы нарушили анонсированный выше принцип — центральное устройство занимается регулированием значения Лямбда. Кроме того, центральное устройство должно сообщать потребителям текущее значение Лямбда. С другой стороны, если весь ресурс распределяется пропорционально поданным заявкам, то количество выделяемого потребителю ресурса несет информацию о соотношении суммы запросов и наличного запаса ресурса. Этой информацией можно воспользоваться и находить свои запросы на шаге (Тау + 1) следующим образом:
П
ри этом ситуацией равновесия будет ситуация, в которой весь ресурс распределяется между потребителями и достигаемые эффекты у всех потребителей одинаковы и равны
Коэффициент Альфа определяет «чувствительность» потребителя, т. е. степень его инерционности. В этом смысле он некоторым образом аналогичен глубине Памяти автоматов в рассмотренных выше моделях поведения. Точность достижения оптимума растет с
84
уменьшением Альфа, но при этом падает способность оперативно реагировать на изменение условий функционирования.
Мы уже отмечали выше, что в случае максимизации суммарного эффекта от распределения ресурса, Лямбда имеет содержательный смысл цены единицы ресурса и условие системного максимума выполняется тогда, когда достигают максимума локальные функции пользы, представляющие собой разность между эффектом от использования ресурса и стоимостью последнего. При этом количество запрашиваемого ресурса мы можем интерпретировать, как некую сумму денег, направляемую в центр для его приобретения. Осуществив распределение ресурса между потребителями пропорционально присланным деньгам, центр тем самым устанавливает и цену единицы ресурса, равную отношению общей суммы присланных денег к числу распределенных единиц ресурса. Таким образом, количество запрашиваемого ресурса выражается в стоимости полученного ресурса. Тогда общесистемный критерий удовлетворяется, если каждый потребитель формирует свой запрос так, чтобы максимизировать разность между достигнутым от использования ресурса эффектом и посылаемой заявкой на ресурс. При этом в принципе безразлично, какие алгоритмы и какие вычислительные средства применяет потребитель для поиска своего локального экстремума. Важно, что мы сформулировали простые и однозначные правила поведения центра и локальные критерии, следование которым обеспечивает децентрализованный поиск общесистемного экстремума.
Демонстрация таких возможностей и была целью настоящего параграфа.
§ 3.4. Что дает случайное взаимодействие
Во всех рассмотренных в данной главе моделях участник игры воспринимал результат поведения остальных участников только как реакцию на его поведение некоторой более или менее сложно организованной внешней среды. Никакой информацией не только о поведении, но даже о наличии других участников автомат (или игрок) не располагал. Как было показано выше, в ряде ситуаций в дополнительной информации не было никакой необходимости, так как
85
и без нее автоматы добивались целесообразного и даже оптимального поведения. Вместе с тем мы сталкивались и с рядом не очень приятных характеристик поведения — требования роста сложности процедуры принятия решений (глубины памяти автоматов), весьма быстрого роста времени достижения оптимального поведения и т. п. И вообще термин «коллективное поведение» мало подходил к описываемым ситуациям — речь скорее всего шла о моделях совокупного поведения, о поведении некоторого «автоматного газа». Когда мы произносим слово «коллектив», мы обычно подразумеваем некоторую структуру отношений, наличие обмена информацией, организацию взаимодействия между членами коллектива. Можно надеяться, что учет указанных свойств в рассматриваемых нами совокупностях автоматов может, с одной стороны, улучшить характеристики поведения и, с другой, оценить возможности и эффективность различных типов организации взаимодействия.
При попытках построить модели поведения со взаимодействием следует постоянно помнить, что только достаточно простые модели, зависящие от небольшого числа параметров, позволяет разобраться в эффектах, возникающих в этих моделях и моделируемых ими ситуациях.
Какие же типы взаимодействия мы можем отнести к простейшим? К таким типам с нашей точки зрения следует отнести случайное парное взаимодействие и однородное взаимодействие с ограниченным числом соседей.
Случайное парное взаимодействие состоит в том, что в каждый момент времени (в каждой партии игры) весь коллектив, вся совокупность автоматов случайным образом разбивается на пары. Б каждой паре может быть реализован акт обмена информацией, в результате которого происходит изменение действия или внутреннего состояния автомата. На следующем такте разбиение коллектива на пары происходит заново, также случайным и независимым от предыдущего разбиения способом.
При взаимодействии с ограниченным числом соседей для каждого члена коллектива указывается его окрестность — список участников игры, называемых соседями данного автомата по игре, с которыми он
86
может осуществлять взаимодействие. Взаимодействие это может быть односторонним — автомат воспринимает информацию от своих соседей ко игре или его выигрыш зависит от поведения его соседей по игре, но обратное в общем случае может быть неверным. Однородность ограниченного взаимодействия заключается в том, что размеры окрестности для всех автоматов одинаковы. Таким образом, однородное взаимодействие задается однородным ориентированным графом отношений.
Начнем изучение возможностей взаимодействия со случайных парных встреч.
При рассмотрении игры в размещения мы уже отмечали, что для обеспечения возможности договориться и, тем самым, обеспечить максимально возможный выигрыш можно организовать общую кассу, а можно, распределившись по одному на самых выгодных участках, например циклически меняться местами. Аналогичного эффекта нетрудно добиться, если повторять жеребьевку, например, каждый месяц. Однако трудности организации ежемесячных встреч не привыкших к дисциплине детей лейтенанта Шмидта отчетливо демонстрируют все сложности такого способа централизованного управления. Столь же большие трудности (если не большие) встречаются на пути заочной жеребьевки и организации общей кассы. Однако эффект, эквивалентный эффекту введения общей кассы, мог бы быть достигнут, если бы в конвенцию был включен пункт, обязывающий отпрысков героя при любой случайной встрече обмениваться участками. Если такие парные встречи действительно случайны и равновероятны, то механизм подобного взаимодействия обеспечивает каждому участнику (естественно, при достаточном времени) пребывание в среднем одинаковое время на каждом участке, т. е. выравнивает доходы всех участников игры. Для максимизации выигрыша при этом достаточно обеспечить первоначальное распределение всех игроков по одному на наиболее выгодных стратегиях и реализовать процедуру случайного парного обмена стратегиями.
Нетрудно видеть, что и в игре в распределения, если мы зададим некоторое начальное распределение игроков по стратегиям и организуем случайный парный обмен стратегиями (первый тип взаимодействия).
87
то начальное распределение будет поддерживаться сколь угодно долго, так как при парном обмене, порожденным любым механизмом разбиения на пары, число игроков, покидающих стратегию, будет равно числу игроков, выбирающих ее. С другой стороны, если разбиение на нары случайно и равновероятно, то средний выигрыш у игроков выравнивается. Указанные соображения позволяют предположить, что таким образом организованная процедура взаимодействия должна приводить к эффектам, эквивалентным введению общей кассы. Здесь, однако, представляет интерес зависимость поведения автоматов в эквивалентной игре от глубины их памяти.
Обратимся снова к игре в распределения. Если автоматы, участвующие в игре, имеют минимальную глубину памяти, то указанное взаимодействие не изменяет их поведения и, следовательно, автоматы разыгрывают партию Антоса. С ростом глубины памяти таких автоматов их поведение стремится к поведению в игре с общей кассой, а разыгрываемая партия — к партии Мора. Наиболее существенный эффект, возникающий здесь, как показывает анализ и моделирование поведения, состоит в том, что при данном типе взаимодействия и при любой глубине памяти средний выигрыш автоматов не меньше, чем максимальный выигрыш для данной глубины памяти в обычной игре и игре с общей кассой.
Первый тип взаимодействия, улучшая результаты поведения автоматов в игре и реализуя процедуру общей кассы без специального центрального устройства, собирающего все выигрыши и делящего их поровну между игроками, не улучшает между тем динамики поведения коллектива. Сходимость к точке Мора остается столь же медленной.
Мы уже говорили выше, что в игре Гура чрезвычайно медленная сходимость объясняется тем, что при любой глубине памяти точкой динамического равновесия является точка, при которой автоматы равномерно распределены по стратегиям. Более того, в любой другой партии опять-таки при любой глубине памяти математическое ожидание изменения распределения автоматов по стратегиям направлено в сторону точки равномерного распределения. Можно предложить сравнительно простую процедуру случайного парного взаимодействия (взаимодействие второ-
88
го типа), которая делает все партии игры Гура партиями безразличного равновесия по математическому ожиданию смены распределения автоматов по стратегиям. Тогда опять средний выигрыш будет определяться временами выбора автоматом данной стратегии.
Подобное взаимодействие, обеспечивающее описанный выше эффект, состоит в том, что когда автомат должен изменить свое действие в качестве нового выбирается действие, которое осуществляет партнер по паре. Если же в силу логики своей работы, автомат не должен изменять свое действие, то он не обращает никакого внимания на своего партнера по паре.
Эффект, достигаемый при этом типе случайного парного взаимодействия, оказывается замечательным. Если участвующие в игре автоматы имеют глубину памяти, равную п, то их средний выигрыш будет равен выигрышу автоматов, имеющих глубину памяти 2n, в игре Гура без случайного парного взаимодействия, а скорость сходимости к стационарному выигрышу будет такой же, как у автоматов с памятью п в обычной игре Гура. Заметим, что два связанных друг с другом автомата, каждый из которых имеет п состояний, образуют систему с n2 состояниями. Учитывая, что такая пара автоматов имеет четыре, а не две комбинации выигрыша и проигрыша, мы можем утверждать, что образование постоянных каолиций из автоматов дает степенное улучшение качества функционирования, тогда как случайное парное взаимодействие обеспечивает экспоненциальное улучшение.
Совместное использование обоих типов случайного парного взаимодействия в игре в распределения обеспечивает проявление обоих указанных выше эффектов при достаточно большой глубине памяти. Однако введение второго типа случайного парного взаимодействия изменяет характер поведения в этой игре простейших автоматов.
Рассмотрим следующую ситуацию, моделируемую игрой в распределения. Пусть имеется несколько курортов. Привлекательность каждого курорта для отдыхающего там человека зависит от числа людей, выбирающих этот курорт одновременно с ним. Обычно в среднем привлекательность курорта падает по
мере роста числа находящихся там курортников. Падение привлекательности курорта приводит к тому, что возрастает вероятность в будущем году поехать в новое место. Каждый из нас знает, как мучительна смена привычного места и сколь случайна процедура выбора нового. Однако, как правило, мы не бросаем монету и не тычем с закрытыми глазами пальцем в карту СССР, а начинаем интересоваться, где отдыхают другие люди. Окончательное решение приходит, когда жена сообщает вам, что Эльвира Евсеевна прекрасно провела лето под Мариуполем. Самое удивительное при этом, что, в общем, с учетом самых различных факторов, удовлетворенность провес денным отпуском в среднем во всех местах одинакова. Это наводит на мысль, что указанная процедура обеспечивает выход на точку Нзша, а способ выбора нового места весьма напоминает последний способ организации случайного парного взаимодействия.
Действительно, если читатель согласен не забивать себе голову аналитическими выкладками и готов поверить нам на слово, то оказывается, что в «игре в распределения» случайное парное взаимодействие, состоящее в том, что в случае смены действия в качестве нового действия выбирается действие партнера по паре, обеспечивает выход простейших автоматов на партию Нэша. Этот факт также замечателен, тах как без взаимодействия для обеспечения выхода на точку Нэша необходимы автоматы с бесконечно большой глубиной памяти. Резкое снижение требуемого объема памяти играющих автоматов столь же существенно снижает время, необходимое для выхода на стационарное распределение, и значительно улучшает характеристики поведения в случае изменения внешних условий. На рис. 3.11, 3.12 и 3.13 (на них 1 — случайное парное взаимодействие, 2—общая касса, 3—обычная игра) приведены зависимости среднего выигрыша автоматов от глубины их памяти при комбинированном способе случайного парного взаимодействия для игр, рассмотренных на рис. 3.7, 3.8 и 3.9.
В
структурированных коллективах, т. е. в коллективах, для которых определена структура взаимодействия, эффективность функционирования каждого участника зависит от того, что он делает сам и что делают его непосредственные соседи по игре. Подобная ситуация возникает, например, тогда, когда члены коллектива располагаются в узлах некоторой сети связи или сети распределения некоторого ресурса, Примерами подобных ситуаций могут служить сети связи или сети вычислительных машин, где мы хотим организовать децентрализованное поведение, оптимизирующее некоторые параметры системы. В качестве таких параметров могут выступать производительность или пропускная способность, реактивность системы или среднее время ожидания, стоимость и т. п. Децентрализованное поведение при решении задач такого рода мы будем рассматривать в следующей главе. Здесь же нас будут интересовать некоторые эффекты, связанные собственно со взаимодействием, порождаемым структурой связей в системе. Введенные выше требования ограниченности взаимодействия и его однородности вызваны следующими причинами: ограниченность связана с тем, что в большинстве реальных технических сетей узлы сети имеют ограниченное число связей друг с другом, а однородность (так же, как и ограниченность) существенно упрощает изучение моделей.
В
качестве примеров управляющих систем с сетевой структурой могут выступать также системы
91
управления энергетическими или газораспределительными сетями.
Мы будем говорить, что на однородном графе задана однородная игра с ограниченным взаимодействием, если задана функция, определяющая доход игрока в зависимости от того, какое действие выбрал он сам и какие действия выбрали его соседи по игре. Естественно, что эта функция может зависеть и от внешних неконтролируемых участниками игры параметров. В силу однородности графа взаимодействия для задания игры достаточно задать всего одну такую функцию.
Рассмотрим некоторую условную ситуацию. Пусть у нас имеется водопроводная сеть, состоящая из распределительных станций, соединенных между собой водоводами. Станция регулирует отпуск воды потребителям. Ее доход, с одной стороны, растет с увеличением общего объема отпускаемой потребителям воды, но, с другой стороны, увеличение этого объема может привести к падению давления в магистралях, что вызовет определенные убытки и, следовательно, снижение дохода. При этом указанные зависимости определяются не только поведением самой станции, но и отбором воды из системы, осуществляемым ближайшими соседями станции. Аналогичные отношения возникают и в оросительных системах.
Приведенная содержательная интерпретация модели игры с ограниченным взаимодействием весьма и весьма приблизительно описывает реальную ситуацию в подобных системах, но авторы надеются на снисходительность читателя. В принципе функции выигрыша могут учитывать все сложности оценки эффективности функционирования узла. Например, отказ станции включать насосы, обеспечивающий экономию электроэнергии. Существенно здесь лишь то обстоятельство, что доход каждого участника определяется только поведением его самого и его соседей из ближайшей окрестности.
В
такой игре существуют устойчивые по Нэшу ситуации, когда никому из участников игры невыгодно в одиночку изменять свое поведение. Аналогично рассмотренным выше играм, доход в точке Нэша всей системы может быть весьма далек от возможного максимума. Для достижения партии максимальной цены можно организовать общую кассу, однако не-
93
трудно понять, что в достаточно больших сетях ее введение практически лишает участников оперативной информации о реакции системы на их собственное поведение. Вместе с тем, именно с ростом сети возрастают сложности централизованного управления и увеличивается привлекательность децентрализованных систем.
Рассмотрим простенький численный пример. Пусть участники игры имеют по два соседа каждый, т. е. их графом взаимодействия является окружность (рис; 3.14). Выигрыш каждого участника определяется его действием и действиями его правого и левого соседей. Каждый участник может делать одно из двух действий, которые мы обозначим через А и Б. Величины выигрыша автомата в зависимости от действий его правого и левого соседей приведены ниже
-
Ситуация Выигрыш
ААА
— 2
БАА 2
АБА 0
ББА
10
ААБ 10
БАБ 0
АББ 2
БББ —2
Отсюда видно, что среднему игроку выгодно изменять свое действие на другое, если он находится в ситуациях ААА, БАА, АББ и БББ, и невыгодно в остальных ситуациях. Рассмотрим ситуацию ББАА, в которой третьему игроку выгодно изменить свое действие, что приводит нас к конфигурации БББА, в которой становится выгодным изменить свое действие второму игроку. Ситуацией равновесия по Нэшу здесь является партия АБАБАБ ... АБ. Средний выигрыш в партии Нэша для этой игры равен 0. С другой стороны, партия ААББААББ ... ААББ обеспечивает средний выигрыш, равный 6, но, как мы видели, она неустойчива.
Обратим внимание на следующий факт: если один из участников игры изменяет свое действие, то это приводит к изменению только его выигрыша и выигрыша его ближайших соседей, но не затрагивает остальных участников игры. Следовательно, если мы организуем общие кассы между соседями по игре, то изменение своего действия, приводящее к уменьше
93
нию суммарного выигрыша в своей окрестности, а, значит, и во всем коллективе, становится для участника невыгодным. Тогда и партия максимальной цены становится устойчивой по Нэшу, т. е. становится Таблица 3.2
-
Фрагмент партии Мора
Выигрыш
Фрагмент новой партии
Выигрыш
ААББА
22/3
АААБА
8/3
АББАА
14/3
АБААА
0
ББААБ
22/3
БББАБ
8/3
БААББ
14/3
БАБББ
0
партией Мора. Проиллюстрируем сказанное на нашем примере. Обратимся к табл. 3.2. В ней в первом столбце приведены фрагменты партии максимальной цены, во втором столбце — выигрыш среднего во фрагменте игрока при наличии локальной общей кассы, в третьем столбце—фрагмент, образующийся при смене действия средним игроком, и, в четвертом — выигрыш среднего во фрагменте игрока при наличии локальной общей кассы в новой ситуации.
Из табл. 3.2 видно, что ни одному из участников игры при использовании процедуры локальной общей кассы в партии максимальной цены невыгодно изменять свое действие.
Организация локальной общей кассы сводится к равномерному распределению дохода в узле между всеми узлами его окрестности и, с одной стороны, не требует сложных организационных мероприятий, а с другой, в силу небольшого числа соседей слабо маскирует зависимость получаемого дохода от результатов собственной деятельности. Еще раз подчеркнем, что указанный эффект достигается на сети независимо от ее размеров.