Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Экономика

С. Л. Печерский, А. А. Беляева. Теория игр для экономистов, 2001

1.2. Игры в нормальной форме


Итак, игра в нормальной (или стратегической) форме - это тройка {I,S = ПДМгеЛ и = iuiип)}, где I = {1 ,...,п} - множество игроков; Si - множество стратегий (ходов) , доступных игроку г = 1,..., га , щ : S = П,-е/ у Ч функция выигрышей игрока
i, ставящая в соответствие каждому набору стратегий s = (si, ..., sn) , называемому также ситуацией, выигрыш
4
этого игрока .
Стандартный пример здесь - дуополия по Бертрану и по Курно, когда стратегии - это цены или объемы выпуска, соответственно, а выигрыши - это прибыль (см. п. 1.9).
Важным предположением, которое играет ключевую роль в теории, является предположение о том, что все игроки рациональны, в том смысле, что каждый игрок рассматривает имеющиеся в его распоряжении альтернативы, формирует представления относительно неизвестных параметров, имеет четко определенные предпочтения и выбирает свои действия в результате некоторого процесса оптимизации (максимизации своей целевой функции). Более того, не менее существенным является факт общеизвестности (общего знания) рациональности игроков, т.е. все игроки не только рациональны, но и знают, что другие игроки рациональны, знают, что все игроки знают, что они рациональны и т.д. Формальное определение общеизвестности см. Aumann (1976).
Замечание 1.2.1. В последние годы появилось значительное число работ, посвященных исследованию моделей ограниченной рациональности. Основная мотивация этих работ - не-удовлетворенность теорией, оперирующей с лсовершенно рациональным человеком, поскольку мы является свидетелями весьма частого несоответствия реального поведения людей предположению лсовершенной рациональности. Идея моделирования ограниченной рациональности восходит к рабо-там Герберта Саймона (Simon, 1955, 1956;, см. также Simon, 1972, 1976). Обсуждение проблем, связанных с модели- ровнием ограниченной рациональности, можно найти, например, в книге Rubinstein (1998). Различные взгляды на проблемы моделирования рациональных и ограниченных рациональных игроков изложены в работах Binmore (1987, 1988), Aumann (1996).
Обратимся к тому случаю, когда I = {1,2} и множества стратегий каждого из двух игроков конечны. В этом случае игру можно лизобразить с помощью матрицы (см. рис. 6), где М = | Si | - число возможных стратегий игрока 1, К = l^l -
Г> / (т) (к)\
число возможных стратегии игрока 2, amk = ui(s\ , sx2 '), bmk = u2{sipi\ 4fc)), k = 1,..., К, m = 1,..., M. 1 (К)
жs2 S2
1
(ац,Ьц) ... (а1К,Ь1К) \ {амъЬм\) жжж (амк,Ьмк Рис. 6.
Эту же игру можно представить в виде двух матриц (поэтому такие игры называются часто биматричными), элемен-тами которых являются элементы amk и bmk , соответственно.
Для конечной антагонистической игры, т.е. игры двух лиц, такой, что tti(si,s2) = ~u2(si,s2) Для всех G Si, i = 1,2, справедливо равенство amk = Чbmk для всех т и к , а поэтому такая игра может быть задана только одной матрицей (amk) m=i,...,м , и поэтому конечные антагонистические
к=1,...,К
игры называются матричными (см. подробнее Раздел 1.8).
Смешанная стратегий щ - это вероятностное распределение на множестве чистых стратегий Si. (Мотивацию введения смешанных стратегий мы оставляем на будущее.) Рандомизация каждым игроком своих стратегий статистически независима от рандомизаций его оппонентов, а выигрыши, соответствующие профилю (набору) смешанных стратегий, - это ожидаемое значение выигрышей соответствующих чистых стратегий (т.е. речь здесь идет об ожидаемой полезности). Одна из причин, по которой мы сосредоточиваемся на конечном случае, - стремление избежать лосложнений, связанных с теорией меры.
Будем обозначать пространство смешанных стратегий i- го игрока через ^ - , a aЧ вероятность того, что выбирается стратегия . Пространство наборов смешанных стра-тегий - = Пг?/j элементы которого мы будем обозначать через а. Носитель смешанной стратегии аг- - это множество тех чистых стратегий, которым лприписана положительная вероятность.
3 Mixed strategy.
Определение 1.2.1. Если Si - конечное множество чистых стратегий игрока i, то смешанная стратегия Oi : Si Чт- [0,1] ставит в соответствие каждой чистой стратегии Si ? Si вероятность <7;(s;) > 0 того, что она будет играться, причем Yls-eS- ai(si) = 1 Х
(Обратим внимание на то, что индекс i означает здесь, что речь идет о стратегии игрока i. Поэтому, если мы будем говорить о разных стратегиях игрока i, то мы будем обозначать их Si, s'-, s'-',....) Нетрудно заметить, что множество сме-шанных стратегий игрока i - это (ki - 1) -мерный симплекс, где ki - число чистых стратегий г-го игрока.
(2.1)
(поскольку на наборах чистых стратегий значения этой функции совпадают со значениями исходной функции выигрышей Ui , мы сохраняем то же обозначение).
Важно отметить, что выигрыш г-го игрока есть линейная функция от вероятностей <7г-, а также является полиномом от профиля, а потому непрерывен. Наконец, чистые стратегии являются вырожденными смешанными стратегиями, приписывающими вероятность 1 данной чистой стратегии и вероятность 0 - остальным.
Определение 1.2.2. Смешанным расширением игры Г = {/, S, и} называется игра Г = {/, и}, где = Пг'е/^г'; а и(а) > гс*е ? > определяется равенством (2.1).
Выигрыш игрока i, соответствующий профилю (набору) стратегий а, есть Пример. Рассмотрим игру, изображенную на рис. 7. L м Р и ( (4,3) (5,1) (6,2) т (2,1) (8,4) (3,6) d V (з,о) (9,6) (2,8) Рис. 7.
Пусть 01 = ^J (это означает, что смешанная стра
тегия игрока 1 предписывает ему играть стратегии и, т и d с вероятностями 1/3), а2 = ^0, ^ (эта смешанная стратегия игрока 2 предписывает играть стратегии М и R с равными вероятностями и не играть стратегию L вовсе).
В данном случае мы получаем
щ (ст) = l(0-4+i.5 + i-6) + + (0-2+-8 + -3] +
и2{а) = f.
<< Предыдушая Следующая >>
= К содержанию =
Похожие документы: "1.2. Игры в нормальной форме"
  1. 2.Аинамические игры с совершенной информацией
    игры.? Игра 7. л'Jileppoрист В самолет, который должен лететь из Майами в Нью-Йорк, сел террорист. Террорист требует, чтобы пилот летел на Кубу, угрожая в противном случае взорвать самолет. Предположим, что террорист не может определить, куда действительно летит самолет. Первый ход в этой игре тогда делает пилот. Он может лететь либо на Кубу, либо в Нью-Йорк. Если пилот посадит самолет на
  2. 16.3 Динамические игры с совершенной информацией
    игры. Игра 7. Террорист В самолет, который должен лететь из Майами в Нью-Йорк, сел террорист. Террорист требует, чтобы пилот летел на Кубу, угрожая в противном случае взорвать самолет. Предположим, что террорист не может определить, куда действительно летит самолет. Первый ход в этой игре тогда делает пилот. Он может лететь либо на Кубу, либо в Нью-Йорк. Если пилот посадит самолет на Кубе, то
  3. 1.10. Равновесие лдрожащей руки
    игры в нормальной форме , определение которого восходит к работе Рейнхарда Зельтена (Selten, 1975). Такое равновесие лвыдерживает возможность того, что с некоторой очень небольшой вероятностью игроки делают ошибки (грубо говоря, лдрожащей рукой не попадая на нужные кнопки). Для произвольной игры в нормальной форме Г = {/, (?лХ), (Ui)} можно определить лвозмущенную игру Ге = {/,(??), (иг-)},
  4. 3.2. Альтернативный взгляд на смешанные стратегии
    игрышей друг друга. В частности, пред-положим, что Его (ему будет далее соответствовать индекс с) выигрыш, когда оба идут на футбол, есть 2 + tc, причем tc приватно известно ему; Ее выигрыш (ей соответствует индекс р), если оба идут на балет, есть 2 + tp , что известно приватно ей. Будем считать, что tc и tp равномерно распределены на [0, х]. (В действительности равномерность не по существу, но
  5. 1.3.1. Неформальные правила
    игры будет (0;0) - А не станет доверять В, справедливо полагая, что тот его обманет. Предположим, что игра повторяется неопределенное ко личество раз, и норма дисконта равна 0. Если В злоупотребляет доверием в первом раунде игры, то его выигрыш в двух раундах равен 15, а если оправдывает доверие, то 20. Поэтому В выберет стратегию оправдывать доверие. Таким образом, между игроками возникает
  6. 2.2.4. Издержки контроля за соблюдением контракта и предупреждения оппортунистического поведения
    игрыш ИгрокА Инвестировать 0,5; 0,5 -1,0 ; 1,0 Не инвестировать 0; 0 0;0 Игрок А должен принять решение, инвестировать ли ему средства в данную сделку. Если он принимает решение о том, что он не инвестирует средства, то игра заканчивается и игроки не получают ничего, их выигрыши равны 0. Если игрок принимает решение об инвестициях, то игрок В должен принять решение, выбрать ли ему стратегию
  7. 2.1.2. Методы экономического побуждения
    игры; 2) государство является самым богатым, мощным, ресурсно-обеспеченным участником экономической деятельности; 3) государство обладает ладминистративным ресурсом, намного превосходящим аналогичный ресурс других участников. В научной и учебной литературе методы стимулирования называют экономическими методами управления в связи с тем, что в них используются побудители экономической природы,
  8. 12.5. СИСТЕМЫ ОБМЕННОГО КУРСА ВАЛЮТ
    игры рыночных сил спроса и предложения. Если стоимость национальной валюты падает, говорят, что валюта обесценивается (depreciates), когда ее стоимость повышается - валюта "растет в цене" (appreciates). Однако на практике "чистый" плавающий курс почти не встречается. Более распространен вариант, при котором ЦБ время от времени вмешивается в рыночные операции с целью повлиять на обменный курс, но
  9. 9.4. ГОСУДАРСТВЕННОЕ РЕГУЛИРОВАНИЕ СЭЗ
    игры, которые каждое государство устанавливает на своей территории. Эти правила обязательны для всех участни ков СЭЗ, поскольку при достигнутой степени интеграции произ-водительных сил и разделении труда без определенной регламен-тации и упорядочения взаимоотношений им не обойтись. В пос-ледние годы все чаще в мирохозяйственной практике получают распространение СЭЗ, охватывающие территорию
  10. з 1. ДИНАМИКА МЕХАНИЗМА ГОСУДАРСТВЕННОГО УПРАВЛЕНИЯ
    игры соблюдаются; в) уведомительный - режим, связанный с необходимостью поставить государство в известность о выбранном поведении; г) договорный - поведение участников государственного управления строится в соответствии с условиями соглашения, заключенного между ними; д) регистрационный - обязанность зарегистрировать выбранное поведение; е) разрешительный - обязанность получить разрешение