Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Экономика

С. Л. Печерский, А. А. Беляева. Теория игр для экономистов, 2001

1.11. Дополнение. Решение биматричных игр 2x2


В этом параграфе мы подробно остановимся на анализе решений биматричных игр, в которых у каждого из игроков есть только две стратегии. Разумеется, эти игры представляют собой частный случай рассмотренных ранее игр, но здесь появляется возможность дать наглядную графическую интерпретацию поиска равновесных ситуаций в игре. (Наше изложение здесь следует книге Воробьева, 1985.)
Рассмотрим биматричную игру 2 X 2 с матрицей
/ (ац,Ьц) (л12,^12) А V (л21,^21) (л22,^22) /
или, как мы уже отмечали, игру, выигрыши в которой можно задать с помощью двух матриц:
/ an, ai2 \ ( Ьц,Ь12 \ V л21, л22 / ' V Ь21, Ь22 / '
первая из которых описывает выигрыши игрока 1, а вторая - выигрыши игрока 2.
Очевидно, что смешанные стратегии игроков в случае игр 2x2 полностью описываются вероятностями р и q выбора игроками своих первых чистых стратегий. (Вторые чистые стратегии выбираются, соответственно, с вероятностями 1 Чр и 1 - q.) Поэтому, поскольку 0 < р, q < 1, каждая ситуация в смешанных стратегиях в биматричной игре 2x2 представляется как точка на единичном квадрате.
Напомним, что пара смешанных стратегий а^ = (р*, 1 Чр*) и а2 = (q*, 1 ~q*) является равновесием по Нэшу, если смешанная стратегия а* одного игрока является лучшим ответом на смешанную стратегию а* другого игрока, т.е. выполняются следующие неравенства:
MI(cti, 0-2) < Ui(al, 0-2) VCTI И
^2(0-1,0-2) < Z7i(cr*,cr2) Vcr2.
Рассмотрим уже знакомый нам пример Орел или Решка (см. рис. 23, п. 1.8). Пусть игрок 1 считает, что игрок 2 будет выбирать Орла с вероятностью q и Решку с вероятностью 1 - q . Ожидаемый выигрыш игрока 1 от разыгрывания Орла будет ( - l)g+l-(l - q) = 1 - 2q , а от разыгрывания Решки l-g+(-l)-(l-g) = 2gЧ 1 . Если 1 - 2g > 2gЧ 1 , т.е. q < \
ТО
2 '
лучшей чистой стратегией игрока 1 будет Орел, а если q > ^ , то Решка, и игроку 1 будет все равно, что разыгрывать, если q = i . Рассмотрим возможные смешанные стратегии игрока 1. Пусть (р, 1 - р) обозначает смешанную стратегию, в которой игрок 1 разыгрывает Орла с вероятностью р. Для каждого значения q мы можем вычислить значения р = p*(q) , такие что (р, 1Ч р) будет являться лучшим ответом игрока 1 на (q, 1 - q) игрока 2 .
Ожидаемый выигрыш игрока 1 от разыгрывания (р, 1 - р) , когда игрок 2 разыгрывает (q, 1 - q), будет
(-l)p Х q + 1 Х р Х (1 - q) + 1 Х (1 - р) ж q + (-1) Х (1 - р){1 - q) =
= (2g - 1) + p Х (2 - 4g).
Ожидаемый выигрыш игрока 1 повышается (в зависимости от р), если 2 - 4д > 0 и уменьшается, если 2 - 4д < 0 , поэтому лучший ответ игрока 1 (среди всех стратегий, как чистых, так и смешанных) есть р = 1 (т.е. Орел), если q < ^ , но р = 0 (т.е. Решка), если q > Этим значениям р соответствуют два горизонтальных отрезка на рис. 29.
Так как при q = \ ожидаемый выигрыш игрока 1 не зависит от его стратегии, мы получаем, что игроку 1 безразлично, выбрать ли одну из своих чистых стратегий, или же выбрать какую-нибудь смешанную стратегию (р, 1 - р) . орел 1
решка
решка
1
орел
Рис. 29.
ное отображение (поскольку при q = \ мы имеем целый отрезок) лучших ответов (в зависимости от q ).
Это означает, что если g = i , то смешанная стратегия (р,1 Чр) является лучшим ответом на смешанную стратегию (q, 1 - q) при любом значении р от 0 до 1. Поэтому р*{\) представляет собой вертикальный отрезок, изображенный на рис.29. Таким образом, ломаная линия на рис. 29 представляет собой многознач- Похожими рассуждениями и в силу симметрии матрицы выигрышей игрока 2 получаем аналогичное отображение лучших ответов игрока 2 . На рис. 30 это ломаная q*(p) .
орел
q*(p)
1 2
решка
Рис. 30 показывает, что равновесие по Нэшу в игре Орел или Решка воз-никает, если игрок 1 разыгрывает смешанную стратегию Х1 U Д 2
q
1
орел
V2,2у и игрок разыгрывает такую же стратегию, что, по-видимому, было естественно ожидать в силу симме-тричности игры.
решка
Рис. 30.
Важно заметить, что этот пример иллюстрирует, что неслучайно, если один из игроков выбирает свои стратегии равновероятно (т.е. придерживается своей равновесной стратегии), то второму игроку при этом абсолютно безразлично, как играть. Это следует из свойства, доказанного ранее (см. п. 1.7) в общем случае:
U1(s1,a*) = t/lK,(T2*),
(11.1)
^ (a*,s2) =
для тех Si , которые входят в равновесную ситуацию с ненулевыми вероятностями. Для тех же si , которые входят в равновесную ситуацию с нулевой вероятностью, верны неравенства:
Ui(s't,a*) < C/iKVD,
(11.2)
Ui(a*,st) < Ui(a*,a*).
Формулы (11.1), (11.2) дают действенный способ определения равновесных ситуаций в произвольных биматричных играх 2x2.
Ожидаемый выигрыш игрока 1 от разыгрывания о\ = (р, 1 - р) , когда игрок 2 разыгрывает а2 = (q,l - q) :
Ui(oi, <т2) = p{anq + (1 - q)a2i + a22))(p - 1),
Ui(ai, <72) - C/i(si, Введем обозначения: С = ацЧ а\2 - a2i+a22, а = <222 - л12 Х
Лучший ответ игрока 1 на произвольную стратегию а2 игрока 2 можно получить из условий неотрицательности:
Ui(oi,o2) - ?/i(si, <72) > 0;
Ui(oi,o2) - C/i(s2, <72) > 0.
С учетом введенных обозначений они выглядят следующим образом:
(р- 1) (Cq - а) > 0,
(11.3)
p(C'q - а) > 0.
Аналогично можно поступить для нахождения лучшего ответа игрока 2.
Ожидаемый выигрыш игрока 2 от игры = (q, 1 - q) , когда игрок 1 играет а\ = (р, 1 - р) :
U2{= Ь22 + (b12 - b22)p + (621 - ь22 + p(bu - Ь\2 - Ь21 + b22))q.
Из условий (неотрицательности)
и2(аг,а2) - C/I(cti, SI) > О,
Ui(oi, а2) - ?/1(0-1, s2) > О,
обозначив D = Ьц - Ь\2 - Ь2\ + Ь22, /3 = Ь22 - Ь2\ , получаем аналогичные неравенства для нахождения лучшего ответа игрока 2 на произвольную стратегию а = (р, 1 - р) игрока 1:
(q-l)(Dp-(i) > О,
(11.4)
q(Dp - (3) > 0.
Тогда, для того чтобы пара о\ = (р, 1 - р), а2 = (q, 1 - q) определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение систем неравенств (11.3), (11.4) , а также 0 < р < 1, 0 < g < 1.
Рассмотрим лучшие ответы каждого игрока, которые, разумеется, зависят от того, как устроены матрицы выигрышей игрока 1 и игрока 2. Начнем с неравенств (11.3).
Возможны три случая:
р = 1, C'q > а;
0 < р < 1, Cq = а; (11.5)
р = 0, C'q < а.
В свою очередь, в зависимости от соотношений между С и а возможны следующие случаи и соответствующие лучшие ответы игрока 1 в каждом из них. рис. 31-33: Р
I. Если С > 0 , а > 0 , то лучшие ответы изображены на
Р а/С= 1 Рис. 32.
q
1 а/С а/С > 1 Рис. 31.
р
q
а/С < 1 Рис. 33.
II. Если С < 0, а < 0 , то лучшие ответы изображены на рис. 34-36: р
р
а/С > 1 Рис. 34.
1 а/С q
1 -
а/С= 1 Рис. 35. Р
а/С < 1 q
а/С 1 Рис. 36. III. При С > 0, а < О лучший ответ игрока 1 изображен на рис. 37, если, наоборот, С < 0, а > 0 , то этому случаю соответствует рис. 38: Р
Р
q
q
а/С
а/С Рис. 38.
Рис. 37. Рассмотрение случаев, когда либо С, либо а, либо они вместе равны нулю, мы оставляем читателю.
Аналогично можно построить лучшие ответы игрока 2.
Равновесным ситуациям графически соответствуют точки пересечений множеств лучших ответов игроков. Совмещая графики лучших ответов игрока 1 с любым графиком наилучших ответов игрока 2 , можно получить всевозможные ва-рианты множеств равновесных ситуаций биматричной игры 2x2.
Рассмотрим геометрический смысл условий (11.3) и (11.4) на примере описанной выше игры Дилемма Заключенного. Напомним, что ситуация, сложившаяся в этой игре, задается матрицей Молчать Сознаться
молчать сознаться (-1,-1) (-10,0) (0,-10) (-6-6) Имеем С = -1 - (-10) -0+(-6) =3, ot= -6-(-10) =4, D = -1 - 0 - (-10) + (-6) = 3, /3 = -6 = (-10) = 4.
Тогда условия (11.3), (11.4) выглядят следующим образом:
(р- 1)(3д- 4) > 0, (g - 1)(3р - 4) > 0,
p(3q - 4) > 0, д(3р - 4) > 0.
Отсюда получаем, что при р = 1 q > | , при 0 < р < 1 q = | , при р = 0 q < | ; при g = 1 р > | , при 0<д<1 р=|, при g = 0 g < | . Полученные лучшие ответы изображены на рис. 39.
Рис. 39.
Из рисунка видно, что существует единственная ситуация равновесия р = 0, g = 0 . Это ситуация, в которой каждый из игроков выбирает вторую чистую стратегию - Сознаться.
Отметим несколько возможных качественных особенностей существующих равновесий.
1) Существует единственное равновесие по Нэшу в чистых стратегиях - например, рис. 40 дает равновесную точку р = 1, q = 0. Дилемма Заключенного относится к такому случаю (здесь р = 1, q = 1).
Р
? D
q С
Рис. 40. Существует единственное равновесие по Нэшу в смешанных стратегиях. Игра Орел или Решка является примером такого случая (см. рис.30).
Существует три равновесия по Нэшу - два в чистых стратегиях и одно - в смешанных. Такого типа ситуация возникает в игре Семейный спор (см. рис. 41).
Р q
а/С Рис. 41. 4) Существует два равновесия по Нэшу в чистых стратегиях. Такая ситуация возникает, в частности, когда в матрице А выигрышей игрока 1 = л22 , а в матрице В выигрышей игрока 2 612 = 622 (см. рис.42).
Р С > О
Рис. 42.
5) Существует континуум равновесий по Нэшу (в смешанных стратегиях). Примеров такого рода равновесий можно предложить очень много (см. рис.43).
а/С ; Ч
Рис. 43.
Замечание 1.11.1. Следует отметить интересное свойство, присущее некоторым типам равновесий. А именно, в случаях 1), 2), 3), когда равновесных ситуаций в игре нечетное число, при достаточно малых изменениях элементов матриц выигрышей зигзаги также слегка лпошевелятся, но их общая форма и характер их взаимного расположения не изменятся, а значит, не изменится и число равновесных ситуаций.
Этого нельзя сказать о случаях четного и бесконечного числа равновесных ситуаций. В этих случаях малейшее изменение элементов матриц выигрышей может приводить к совершенно иным качественным ситуациям. Например, ситуация, изображенная на рис. 42, может перейти в ситуацию либо с одним чистым равновесием, если а = О, /3 < О (622 < 621) (см. рис. 44)> либо в ситуацию с тремя равновесиями, если а > О, /3 > О (л22 < a2i) (см- рис.45), либо в ситуацию с континуумом равновесий, если а > О, /3 = 0 (см. рис.46).
Р
Р
q
1 Рис. 44
Рис. 45.
Р
Рис. 46
Замечание 1.11.2
случай, когда С
Рассмотрим наиболее интересный и D не равны нулю. Тогда равновесная ситуация определяется двумя формулами р = q = ^ , из которых следует, что в равновесной ситуации выбор игрока 1 определяется элементами матрицы выигрышей игрока 2 и не зависит от элементов собственной матрицы, а выбор игрока 2 в равновесной ситуации полностью определяется элементами матрицы игрока 1 и не зависит от элементов собственной матрицы. Иными словами, равновесная стратегия обоих игроков определяется не столько стремлением увеличить собственный выигрыш, сколько держать под контролем выигрыш другого игрока (минимизировать его). Таким образом, в биматричной игре мы сталкиваемся не с антагонизмом интересов, а с антагонизмом поведения.
<< Предыдушая Следующая >>
= К содержанию =
Похожие документы: "1.11. Дополнение. Решение биматричных игр 2x2"
  1. ///. Выводы
    дополнением. так как в подобном случае народ разделится на две партии: одна партия - партия верховной власти будет утверждать, что договор нарушен, а другая партия, - партия обвиняемого, будет это отрицать. И потому необходимо, чтобы некто третий установил истинное положение дел. Нужен судья, решения которого не подлежали бы обжалованию и состояли бы в простом подтверждении или отрицании
  2. 3.5. ОРГАНИЗАЦИОННО-ПРАВОВЫЕ ФОРМЫ ХОЗЯЙСТВОВАНИЯ ЮРИДИЧЕСКИХ ЛИЦ, И
    дополнения в устав или утверждение нового устава; реорганизация общества; ликвидация АО, назначение ликвидационной комиссии и утверждение ликвидационных балансов; определение численности совета директоров (наблюдательного совета), избрание его членов и досрочное прекращение их полномочий; установление предельного количества объявленных акций; утверждение или уменьшение уставного капитала;
  3. 4.4. КОНЦЕНТРАЦИЯ И МОНОПОЛИЗАЦИЯ В ЭКОНОМИКЕ, ИХ ВЗАИМОСВЯЗЬ
    дополнений в Единый государственный реестр юридических лиц) о: создании, слиянии и присоединении некоммерческих организаций (ассоциаций, союзов, некоммерческих партнерств), если в состав участников (членов) этих организаций входит не менее двух коммерческих организаций; изменении состава участников (членов) некоммерческих организаций (ассоциаций, союзов, некоммерческих партнерств), если в состав
  4. 10.4. ОСНОВЫ ЦЕНООБРАЗОВАНИЯ В СТРОИТЕЛЬСТВЕ
    дополнениями к ним (письма Минстроя России от 30.10.1992 г. № НФ-907/12, от 13.11.1996 г. № ВБ-26/12-368) с учетом Перечня статей затрат накладных расходов, приведенного в Методических указаниях по определению стоимости строительной продукции на территории РФ МДС 81-1.99. Сметная прибыль определяется в локальных сметах в соответствии с Методическими рекомендациями (письмо Минстроя России от
  5. 11.7. АМОРТИЗАЦИЯ ОСНОВНЫХ ФОНДОВ
    дополнением № 3 к перечню машин, оборудования и транспортных средств (активной части основных производственных фондов), по которым предприятия и организации транспортно-дорожного комплекса имеют право применять механизм ускоренной амортизации, утвержденный Минтрансом России 20 февраля 1995 г.); О перечне машин, оборудования и транспортных средств для применения механизма ускоренной амортизации,
  6. 2.4. Инновационные предпринимательские сети: технологические парки, полисы
    дополнение к структурам университета, которые созданы в интересах взаимодействия с инновационными организациями парка, на его базе действует ряд промышленных секций, созданных крупными организациями г. Манчестера для координации исследований и разработок. Созданный Манчестерским университетом, при поддержке Национального Вестминстерского банка, центр сформировал банк данных о возможностях научно-
  7. 2.5. Региональные предпринимательские сети: бизнес-центры, бизнес-инкубаторы
    дополнение и возможность эффекта синергии. Кроме вновь созданных, в бизнес-инкубатор могут входить на ограниченный срок и уже существующие, успешно функционирующие организации, если они отвечают хотя бы одному из следующих требований: ? стабильность и прибыльность, обеспечивающая поступление средств в бизнес- инкубатор за предоставленные ей услуги; ? опыт, полезный для других участников
  8. 3.2. Организационно-правовые формы коммерческих организаций
    дополнение к слабой и, возможно, обратной реакции на рыночные сигналы в краткосрочном плане они склонны к лнедоинвестированию, т. е. к проеданию своих прибылей; в долгосрочной перспективе они консервативны в рискованных проектах и внедрении технических новшеств. Акционерное общество (АО) - это общество, уставный капитал которого состоит из номинальной стоимости акций общества, приобретенных
  9. 3.3. Факторы, влияющие на выбор организационно-правовой формы организации
    дополнений в устав общества); 3) вопросы, которые из ведения общего собрания могут быть переданы либо совету директоров, либо исполнительному (коллегиальному или единоличному) органу; 4) вопросы, решения по которым наряду с общим собранием могут принимать и другие органы общества (например, решение о проверке финансово-хозяйственной деятельности общества ревизионной комиссией или аудитором). В
  10. 5.3. Противостояние рейдерству (захватнической политике)
    дополнений, необходимых для организации защиты. Поэтому целесообразно говорить о принятии в обществе защищающего от поглощения устава. Единого рецепта, защищающего устав на все случаи жизни и для любого общества, быть не может. Однако имеются общие принципы, лежащие в основе разработки такого документа. Начинать надо с определения организационно-правовой формы предприятия. По своей правовой