Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Экономика
С. Л. Печерский, А. А. Беляева. Теория игр для экономистов, 2001 | |
Модель случайного выбора пар. |
|
В каждом периоде все игроки случайным образом разбиваются на пары. В конце раунда каждый игрок наблюдает только исход своего собственного матча. То, как игрок играет сегодня, будет влиять на то, как его оппонент будет играть завтра, но маловероятно, чтобы игрок снова попал в пару к своему текущему оппоненту или кому-то, кто играл с текущим оппонентом. Снова близорукая игра лпочти оптимальна в конечной, но большой по сравнению с дисконтирующим множителем, популяции. Этот подход наиболее часто используется в теоретико-игровых экспериментах. С технической точки зрения есть два типа обычно исполь-зуемых моделей больших популяций - конечные популяции и континуальные популяции. Важный модельный момент связан с тем, каким образом популяции, из которых выбираются игроки, соотносятся с числом лигровых ролей в игре. Можно различать агента в игре, соответствующего определенной ро-ли игрока, и действительного игрока, принимающего на себя роль агента в конкретном матче. Если игра симметрична, то можно считать, что есть одна популяция, из которой выбираются два агента. В этом случае говорят об однородной популяции. С другой стороны, мы можем считать, что каждый агент выбирается из отдельной популяции. В этом случае говорят об асимметричной популяции. В симметричной игре, в дополнение к крайним случаям однородных и неоднородных популяций, можно также рассматривать смесь этих двух случаев, когда каждый игрок имеет какие-то шансы встретиться в матче с оппонентом из другой популяции и какие-то шансы - с оппонентом из той же популяции. Мы остановимся сейчас (весьма кратко) на одном специфическом процессе динамического приспособления - так называемом фиктивном разыгрывании, полностью основанном на идее обучения, а затем перейдем к модели, основанной на идее эволюции. В процессе фиктивного разыгрывания агенты ведут себя так, как будто они считают, что они сталкиваются со стационарным, но неизвестным распределением на множестве стратегий агентов. Итак, предположим, что мы имеем бескоалиционную игру {{1, 2}, {Si, S2} , {ui, и2}} ж Модель фиктивного разыгрывания предполагает, что игроки выбирают свои ходы в каждом периоде из условия максимизации ожидаемого выигрыша в этом периоде при данной их оценке распределения действий оппонента в этом периоде, причем эта оценка имеет следующий специальный вид: у игрока i есть экзогенно заданная начальная функция весов кг0 : S_; Ч> IR+ . Эти веса модифицируются путем добавления 1 каждой стратегии оппонента каждый раз, как только эта стратегия играется, то есть k\(8-i) = kUs-i) + \1' еСЛИ5-"1=^' [0, в противном случае. Вероятность того, что игрок i предсказывает оппоненту игру s_i в момент t, есть ft(s_i) = . 5_г kl(s-i) Фиктивное разыгрывание - это правило p\{lt) 1 так что Ptilt) ? BR(jI) (здесь BR - best response). Важно заметить, что такое правило может быть не единственным, поскольку может существовать более одного лучшего ответа на каждую оценку. Ключевой вопрос, возникающий здесь, состоит в том, сходится ли такой процесс. Состояние процесса фиктивного разыгрывания есть вектор оценок игроков, а не стратегии, играемые в период t, поскольку их хватает для определения будущей эволюции системы. Тем не менее, несколько пренебрегая формальностями терминологии, будем говорить, что набор стратегий является устойчивым состоянием, если он играется в каждом периоде начиная с некоторого конечного момента времени Т. Предложение 5.1.1. (Fudenberg, Kreps, 1990). 1) Если s - строгое равновесие по Нэшу и s играется в момент t в процессе фиктивного разыгрывания, то s будет играться далее всегда. 2) Любое устойчивое состояние фиктивного разыгрывания в чистых стратегиях должно быть равновесием по Нэшу. Упомянем здесь еще один вариант фиктивного разыгрывания. Милгром и Роберте (Milgrom, Roberts, 1991) рассматривают адаптивное обучение. Прогноз (относительно выбора стратегий оппонентом) называется адаптивным, если этот прогноз приписывает очень малую вероятность любой стратегии оппонента, которая не игралась длительное время. Формально прогноз адаптивен, если для любого е > 0 и любого t существует T(e,t) такой, что для любого t' > T(e,t) и любой истории до момента t', прогноз у\ приписывает вероятность не больше е множеству чистых стратегий оппонента игрока i, которые не игрались между моментами tut'. Для адаптивного прогноза сохраняется второе утверждение предложения 5.1: если прогнозы адаптивны и разыгрывание сходится к набору чистых стратегий, то этот набор должен быть равновесием по Нэшу. Перейдем теперь от моделей, базирующихся на обучении к моделям, связанным с идеей эволюции. Основная идея эволюционного подхода состоит в том, что агенты могут не оптимизировать сознательно, но вести себя так, как если бы они были рациональны, поскольку (экономическая) конкуренция отберет оптимизирующих агентов. Существенным толчком к исследованию таких процессов послужила биология. Мейнард Смит и Прайс (Maynard Smith, Price, 1973) ввели понятие эволюционно устойчивой стратегии и пришли к выводу о том, что наблюдаемые черты поведения животных и растений можно объяснить с помощью равновесия по Нэшу в соответствующим образом определенной игре. Идея состоит в том, что комбинация естественного отбора и мутации приводит популяцию к эволюционно устойчивому состоянию в длительном периоде. Эта точка зрения была подтверждена многочисленными полевыми исследованиями. Здесь лкак если бы - это вполне реальное описание действительности. Вдохновленные успехом биологии, многие экономисты включились в активные исследования эволюционной теории игр. Почему же эволюционная теория привлекает такое внимание? Только после глубоких и длительных исследований теория игр прояснила, что значит рациональность в стратегических ситуациях и каковы ее последствия. Рациональность сама по себе не оправдывает равновесие по Нэшу, и нужно искать что- то другое, что объясняло бы равновесное поведение. Кроме того, необходимость равновесного отбора, которая стала доминирующей темой в многочисленных приложениях теории игр к многообразию конкретных задач, это то, чего предшествующая литература по динамике приспособления не учитывала. |
|
<< Предыдушая | Следующая >> |
= К содержанию = | |
Похожие документы: "Модель случайного выбора пар." |
|
|