Образовательный портал | 1.7. Равновесие по Нэшу в смешанных стратегиях

Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Экономика

С. Л. Печерский, А. А. Беляева. Теория игр для экономистов, 2001
1.7. Равновесие по Нэшу в смешанных стратегиях
Примеры, которые мы рассмотрели выше, продемонстрировали, что даже в очень простых играх равновесие по Нэшу в чистых стратегиях может быть не единственным. Однако, как мы увидим сейчас, равновесия в чистых стратегиях может не существовать вообще. Пример. Игра в орлянку или Орел или решка. 2 игрока одновременно, независимо выбирают либо лрешку, либо лорла. Если их выбор различен, то первый игрок платит второму 1 рубль (доллар, и т.д.), если их выбор одинаков, то наоборот - второй платит первому столько же. Соответствующая игра имеет следующий вид (рис.21): О р о ((i,-i) (-i,i)' р U-M) (1,-1) Рис. 21. Легко видеть, что в этой игре нет равновесия по Нэшу в чистых стратегиях, так как в любой ситуации одному из игроков выгодно отклониться от выбранной стратегии. Однако, как мы увидим, пара смешанных стратегий а\ = ^ , (72 = ^ , в которых каждый из игроков играет свои чистые стратегии с равными вероятностями, образует равновесие по Нэшу в смешанных стратегиях. Определение 1.7.1. Ситуация (набор смешанных стратегий) (7 = ((7г,..., (7га) является равновесием по Нэшу в игре Г = {/, {Sj-}, {ui}} , если для любого i = 1,..., п иг(аг,а_г) > иг(а'г,а_г) V о'% G ?г. Предложение 1.7.1. Пусть Sf С Si - множество чистых стратегий, которые игрок i играет с положительной веро-ятностью в ситуации а = (<7i,..., ап) . Ситуация а является р.Н. в смешанном расширении Г игры Г тогда и только тогда, когда для всех i = 1,... ,п Ui(si,a_i) = ut(s't,Ui(si,a_i) > ut(s't,Доказательство. Необходимость. Если бы одно из этих условий не выполнялось для некоторого i, то нашлись бы две стратегии G Sf и s[ G Si : Ui(s[, (Т_г) > Ui(si, (Т_г) , a значит, это не р.Н. Достаточность. Предположим теперь, что (1) и (2) выполнены, но а - не р.Н. Тогда существуют игрок i и стратегия а[ такие, что иг(а[, ст_г) > щ(аг, ст_г). Но если это так, то существует чистая стратегия s' , которая играется с положительной вероятностью при а[ и для которой Ui(s[,(j-i) > щ(аг, ст_г) . Так как щ(аг,а_г) = ut(st,a_t) для любой Si G Sf , это противоречит (1) и (2). Таким образом, необходимые и достаточные условия того, что ситуация а - Р-Н., состоят в том, что: 1) каждый игрок при данном распределении стратегий, которые играют его противники, безразличен между чистыми стратегиями, которые он играет с положительной вероятностью; 2) эти чистые стратегии не хуже тех, которые он играет с нулевой вероятностью. Это свойство можно использовать для нахождения смешанного равновесия по Нэшу (т.е. равновесия по Нэшу в смешанных стратегиях). Пример. Рассмотрим следующую игру (рис.22): А В A f (1000,1000) (0,0) \ В V (0,0) (100,100) ) Рис. 22. Очевидно, что ситуации (А,А) и (В,В) являются равновесными по Нэшу (в чистых стратегиях). Найдем равновесия по Нэшу в смешанных стратегиях. Предположим, что в таком равновесии игрок 1 играет смешанную стратегию (р, 1 - р), а второй - (q, 1 - q) , причем 0 < p,q < 1. Тогда, учитывая приведенное предложение, мы получаем, что ожидаемый выигрыш игрока 2 от игры А есть ЮООр + 0(1 - р) , а от игры В есть 100 Х (1 - р) + Ор, а значит, ЮООр + (1 - р) ж 0 = 100 Х (1 - р) + 0 Х р. Отсюда 1100р = 100 и, следовательно, р= 1/11. Аналогично q = 1/11. Заметим, что в соответствии с предложением 1.7.1 у игроков в данном примере нет предпочтений относительно вероятностей, которые они приписывают своим стратегиям. Эти вероятности определяют лравновесное рассмотрение: необходимость сделать другого игрока безразличным относительно его стратегий. Пример. Вернемся к игре Семейный спор. Поступая, как и в предыдущем примере, мы получаем, что Она, играя Ф, получает 1-р+0(1Ч р) , а играя Б, получает 0-р+2(1Ч р) . Следовательно, 2(1 Чр) = р . Отсюда Зр = 2 , а следовательно, р = 2/3 . Аналогично получаем 2q + (1 - q) ж 0 = 0 Х q + (1 - q)l, а значит, 3q = 1 и q = 1/3. Таким образом, в смешанном равновесии Он играет Ф с вероятностью 2/3, а Она играет Ф с вероятностью 1/3. Замечание 1.7.1. В определении смешанного расширения или равновесия в смешанных стратегиях мы предполагаем, что игроки осуществляют рандомизацию своих чистых стратегий независимо. Иными словами, мы можем считать, например, что Природа передает игрокам индивидуальные, независимо распределенные сигналы (в 1,02, Х Х Х ,@п) ? [ОД] X [0,1] X ... X [0,1], а каждый игрок i принимает решение в зависимости от различных возможных реализаций его сигнала О; . Предположим, однако, что есть некий общий сигнал в G [0,1], который могут наблюдать все игроки. В этом случае появляются новые возможности. Так, к примеру, в упомя-нутой только что игре Семейный спор оба игрока могут, например, решить идти на футбол, если, скажем, в < ^ , и идти на балет, если в > ^ . Выбор стратегии каждым игроком остается случайным, тем не менее здесь мы имеем дело со вполне скоординированными действиями (Он и Она оказываются вместе), явно имеющими равновесный характер, причем если один игрок решает следовать этому правилу, то и для второго оптимально придерживаться этого же правила. Это дает нам пример коррелированного равновесия (совместного равновесия) , введенного Р. Ауманом (Aumann, 1974). Формально такое равновесие - это специальный случай равновесия по Байесу-Нэшу, которое мы рассмотрим в главе 3. Далее мы приведем важные результаты о существовании равновесий по Нэшу. Предложение 1.7.2. В смешанном расширении Г любой игры Г с конечными множествами стратегий Si,...,Sn существует равновесие по Нэшу в смешанных стратегиях. Это предложение непосредственно следует из следующего более общего результата, так как в игре Г множества страте-гий игроков - это симплексы в соответствующем пространстве Мм . Теорема 1.7.1. Debreu, 1952; Glicksberg, 1952; Fan Ky, 1952) . Если для каждого i = 1,..., п Si - непусто, выпукло и компактно (в некотором Мм); Ui(s\,..., sn) - непрерывна по (si,...,sn) и квазиво- гнута по Si, то в игре Г = {/, {Si}, {иг}} существует равновесие по Нэшу в чистых стратегиях. Напомним, что функция / : Ч> IR называется квазивогнутой, если для любого а множество {х : f(x) > а} выпукло. Доказательство этого предложения опирается на следующую лемму. Лемма 1.7.1. Если выполнены условия Теоремы 1.7.1, то отображение лучших ответов bi непусто, выпукло- значно (т.е. множества bi(s_i) - непусты и выпуклы) и полунепрерывно сверху . Доказательство леммы 1.7.1. Во-первых, заметим, что bi(s_i) Чэто множество тех стратегий г-го игрока, которые максимизируют на компакте Si. Его непу стота следует из непрерывности иг-. Выпуклость множества bi(s_i) следует из квазивогнутости функции иг(-, s_8). Чтобы проверить полунепрерывность сверху, мы должны показать, что для любой последовательности (s^, s^J Ч> (s;, такой, что sG bi^s^^yk, мы имеем G b(s_i) . Заметим, что Mk ui(si,s-i) > ui(si,s-i) V s'i ? Х В силу непрерывности иг(-), Ui(si, 5_г) > Ut(s't, S_i) . Доказательство Теоремы. Определим отображение b : S Ч> S формулой b(s1, ...,sn) = bi(s_i) X b2{s-2) X Х Х Х X b(s_n). Ясно, что b(-) Чмногозначное отображение S = S\X - ж -xSn в себя. По лемме &(Х) непусто, выпукло-значно, полунепрерывно сверху. Следовательно, по Т.Какутани о неподвижной точке, существует неподвижная точка, т.е. набор стратегий s ? S : s ? b(s) . Этот набор стратегий является равновесием по Нэшу, т. к. по построению Si ? V г = 1, . . ., га. Пример. Голосование. Рассмотрим следующую ситуацию - три игрока 1, 2, 3 и три альтернативы - A, D , С. Игроки голосуют одновременно за одну из альтернатив, воздержаться невозможно. Таким образом, пространство стратегий Si = {А, В, С}. Альтернатива, получившая большинство, побеждает. Если ни одна из альтернатив не получает большинства, то выбирается альтернатива А. Функции выигрышей таковы: щ(А) = и2(В) = и3(с) = 2, щ(В) = и2(С) = и3(А) = 1, и1(С) = и2(А) = и3(В) = 0. В этой игре три равновесных исхода (в чистых стратегиях): А , В и С . Теперь посмотрим на равновесия (их больше 3): если игроки 1 и 3 голосуют за А, то игрок 2 не изменит исход, как бы он ни голосовал, и игроку 3 безразлично, как он голосует. (А, А, А) и (А, В, А) - р.Н., но (А, А, В) - не р.Н., т.к. второму лучше голосовать за В .
<< Предыдушая	Следующая >>
= К содержанию =
Похожие документы: "1.7. Равновесие по Нэшу в смешанных стратегиях"
1.6. Равновесие по Нэшу равновесие по Нэшу (или ситуация s = (si,.. ., sn) является равновесной по Нэшу) в игре Г = {/, {Si}, {иг}} , если для любого i = 1, .. .п щ(.зг, s_i) > ut(s't, s_i) V s't e Si. Иными словами, если игрок в одиночку решает отклониться от выбранной стратегии, то он разве лишь ухудшит свое положение. В ситуации равновесия по Нэшу выбранная каждым игроком стратегия является лучшим ответом на 1.12. Задачи равновесия по Нэшу. L С R Г / (2Д) (1,1) (4,2) м (3,4) (1,2) (2,3) в V (1,3) (0,2) (3,0) 2. Игроки I и II торгуются по поводу того, как поделить один доллар. Оба игрока одновременно называют доли, которые они бы хотели иметь, 5*1 и , где 0 < Si , S2 < 1. Если S1+S2 < 1, то игроки получают названные доли; если Si + S2 > 1, то оба игрока ничего не получают. Каковы равновесия по Нэшу в этой 2.6. Задачи равновесие этой игры. Показать, что зарплаты, занятость и прибыль (и поэтому также полезность профсоюза и потребительский излишек) увеличиваются, по мере исчезновения тарифных ставок. 7. Статическая игра с одновременными ходами (см. рис. 22) разыгрывается дважды, причем исход первого шага наблюдается перед началом второго шага. Предположим, что нет дисконтирования. Переменная х > 4, поэтому 3.2. Альтернативный взгляд на смешанные стратегии равновесие по Нэшу в смешанных стратегиях в игре с полной информацией (почти всегда) может интерпретироваться как БН-равновесие в чистых стратегиях в некоторой лблизкой игре с лчуть-чуть неполной информацией. (лПочти всегда в том смысле, что можно игнорировать те редкие случаи, когда такая интерпретация неуместна.) Основная черта равновесия по Нэшу в смешанных стратегиях - это даже не то, что 5.2. Эволюционно устойчивые стратегии равновесию по Нэшу. Это свойство является необходимым условием для любой осмысленной модели социального обучения. Предположим, что у нас есть модель, в которой поведение лсходится к чему-то, что не является равновесием по Нэшу. Поскольку обстановка в конечном счете становится стационарной и есть стратегия (тип поведения), доступная какому-либо агенту, дающая ему больший выигрыш, то в конце Основные понятия теории игр равновесия по Нэшу, т.е. такого набора стратегий (по одной для каждого игро ка), при котором ни один из игроков не имеет стимула в односто роннем порядке поменять свою стратегию. Или, выражаясь более просто, можно сказать, что игроки будут находиться в равнове сии по Нэшу, если, узнав о выборе другого игрока, каждый из них остается довольным своим выбором. Рассмотрим следующую игру: Таблица 11 Равновесие Нэша в смешанных стратегиях равновесие Нэша отсутствует. Следующая игра представляет пример такой си-туации. Игра 6. Инспекция В этой игре первый игрок (проверяемый) поставлен перед выбором - платить или не платить подоходный налог. Второй - налоговой инспектор, решает, проверять или не проверять именно этого налогоплательщика. Если инспектор лловит недобросовестного налогоплательщика, то взимает в него штраф и получает 3. Линамические игры с несовершенной информацией равновесия Нэша на динамические игры с несовершенной информацией. Определение ничем не будет отличаться от ранее данного. Определение совершенного в подыграх равновесия в играх с несовершенной информацией совпадает с данным выше определением для игр с совершенной информацией. Однако, в играх с несовершенной информацией следует дать несколько другое определение подыгры. Отличие состоит в том, 16.2.5 Равновесие Нэша в смешанных стратегиях равновесие Нэша отсутствует. Следующая игра представляет пример такой ситуации. Игра б. Инспекция В этой игре первый игрок (проверяемый) поставлен перед выбором - платить или не платить подоходный налог. Второй - налоговой инспектор, решает, проверять или не проверять именно этого налогоплательщика. Если инспектор лловит недобросовестного налогоплательщика, то взимает в него штраф и получает 16.4 Динамические игры с несовершенной информацией равновесия Нэша на динамические игры с несовершенной информацией. Определение ничем не будет отличаться от ранее данного. Определение совершенного в подыграх равновесия в играх с несовершенной информацией совпадает с данным выше определением для игр с совершенной информацией. Однако, в играх с несовершенной информацией следует дать несколько другое определение подыгры. Отличие состоит в том, что

1.7. Равновесие по Нэшу в смешанных стратегиях

Похожие документы: "1.7. Равновесие по Нэшу в смешанных стратегиях"