Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Экономика

С. Л. Печерский, А. А. Беляева. Теория игр для экономистов, 2001

Модель случайного выбора пар.

В каждом периоде все игроки случайным образом разбиваются на пары. В конце раунда каждый игрок наблюдает только исход своего собственного матча. То, как игрок играет сегодня, будет влиять на то, как его оппонент будет играть завтра, но маловероятно, чтобы игрок снова попал в пару к своему текущему оппоненту или кому-то, кто играл с текущим оппонентом. Снова близорукая игра лпочти оптимальна в конечной, но большой по сравнению с дисконтирующим множителем, популяции. Этот подход наиболее часто используется в теоретико-игровых экспериментах.
С технической точки зрения есть два типа обычно исполь-зуемых моделей больших популяций - конечные популяции и континуальные популяции. Важный модельный момент связан с тем, каким образом популяции, из которых выбираются игроки, соотносятся с числом лигровых ролей в игре. Можно различать агента в игре, соответствующего определенной ро-ли игрока, и действительного игрока, принимающего на себя роль агента в конкретном матче. Если игра симметрична, то можно считать, что есть одна популяция, из которой выбираются два агента. В этом случае говорят об однородной популяции. С другой стороны, мы можем считать, что каждый агент выбирается из отдельной популяции. В этом случае говорят об асимметричной популяции.
В симметричной игре, в дополнение к крайним случаям однородных и неоднородных популяций, можно также рассматривать смесь этих двух случаев, когда каждый игрок имеет какие-то шансы встретиться в матче с оппонентом из другой
популяции и какие-то шансы - с оппонентом из той же популяции.
Мы остановимся сейчас (весьма кратко) на одном специфическом процессе динамического приспособления - так называемом фиктивном разыгрывании, полностью основанном на идее обучения, а затем перейдем к модели, основанной на идее эволюции.
В процессе фиктивного разыгрывания агенты ведут себя так, как будто они считают, что они сталкиваются со стационарным, но неизвестным распределением на множестве стратегий агентов.
Итак, предположим, что мы имеем бескоалиционную игру {{1, 2}, {Si, S2} , {ui, и2}} ж Модель фиктивного разыгрывания предполагает, что игроки выбирают свои ходы в каждом периоде из условия максимизации ожидаемого выигрыша в этом периоде при данной их оценке распределения действий оппонента в этом периоде, причем эта оценка имеет следующий специальный вид: у игрока i есть экзогенно заданная начальная функция весов кг0 : S_; Ч> IR+ . Эти веса модифицируются путем добавления 1 каждой стратегии оппонента каждый раз, как только эта стратегия играется, то есть
k\(8-i) = kUs-i) + \1' еСЛИ5-"1=^'
[0, в противном случае.
Вероятность того, что игрок i предсказывает оппоненту игру s_i в момент t, есть
ft(s_i) = .
5_г kl(s-i)
Фиктивное разыгрывание - это правило p\{lt) 1 так что Ptilt) ? BR(jI) (здесь BR - best response). Важно заметить, что такое правило может быть не единственным, поскольку может существовать более одного лучшего ответа на каждую оценку. Ключевой вопрос, возникающий здесь, состоит в том, сходится ли такой процесс.
Состояние процесса фиктивного разыгрывания есть вектор оценок игроков, а не стратегии, играемые в период t, поскольку их хватает для определения будущей эволюции системы. Тем не менее, несколько пренебрегая формальностями терминологии, будем говорить, что набор стратегий является устойчивым состоянием, если он играется в каждом периоде начиная с некоторого конечного момента времени Т.
Предложение 5.1.1. (Fudenberg, Kreps, 1990). 1) Если s - строгое равновесие по Нэшу и s играется в момент t в процессе фиктивного разыгрывания, то s будет играться далее всегда. 2) Любое устойчивое состояние фиктивного разыгрывания в чистых стратегиях должно быть равновесием по Нэшу.
Упомянем здесь еще один вариант фиктивного разыгрывания. Милгром и Роберте (Milgrom, Roberts, 1991) рассматривают адаптивное обучение. Прогноз (относительно выбора стратегий оппонентом) называется адаптивным, если этот прогноз приписывает очень малую вероятность любой стратегии оппонента, которая не игралась длительное время. Формально прогноз адаптивен, если для любого е > 0 и любого t существует T(e,t) такой, что для любого t' > T(e,t) и любой истории до момента t', прогноз у\ приписывает вероятность не больше е множеству чистых стратегий оппонента игрока i, которые не игрались между моментами tut'. Для адаптивного прогноза сохраняется второе утверждение предложения 5.1: если прогнозы адаптивны и разыгрывание сходится к набору чистых стратегий, то этот набор должен быть равновесием по Нэшу.
Перейдем теперь от моделей, базирующихся на обучении к моделям, связанным с идеей эволюции.
Основная идея эволюционного подхода состоит в том, что агенты могут не оптимизировать сознательно, но вести себя так, как если бы они были рациональны, поскольку (экономическая) конкуренция отберет оптимизирующих агентов.
Существенным толчком к исследованию таких процессов послужила биология. Мейнард Смит и Прайс (Maynard Smith, Price, 1973) ввели понятие эволюционно устойчивой стратегии и пришли к выводу о том, что наблюдаемые черты поведения животных и растений можно объяснить с помощью равновесия по Нэшу в соответствующим образом определенной игре. Идея состоит в том, что комбинация естественного отбора и мутации приводит популяцию к эволюционно устойчивому состоянию в длительном периоде. Эта точка зрения была подтверждена многочисленными полевыми исследованиями. Здесь лкак если бы - это вполне реальное описание действительности. Вдохновленные успехом биологии, многие экономисты включились в активные исследования эволюционной теории игр. Почему же эволюционная теория привлекает такое внимание?
Только после глубоких и длительных исследований теория игр прояснила, что значит рациональность в стратегических ситуациях и каковы ее последствия. Рациональность сама по себе не оправдывает равновесие по Нэшу, и нужно искать что- то другое, что объясняло бы равновесное поведение.
Кроме того, необходимость равновесного отбора, которая стала доминирующей темой в многочисленных приложениях теории игр к многообразию конкретных задач, это то, чего предшествующая литература по динамике приспособления не учитывала.
<< Предыдушая Следующая >>
= К содержанию =
Похожие документы: "Модель случайного выбора пар."
  1. 14.4.2. Формы тарифной системы оплаты труда
    модели, в которых вместо двух коэффициентов (ККУ и КТУ) определяется один - свободный коэффициент оплаты труда (СКТ), механизм расчета которого учитывает как факторы квалификационного уровня работника, так и факторы результативности его работы и отношения к труду в конкретном расчетном периоде. Смешанные системы оплаты труда В последние годы наряду с тарифной и бестарифной системами применяются
  2. 1.3. Предпринимательство как особая форма экономической активности
    модели осуществления предпринимательства. Рассредоточение предпринимательской функции в виде распределения процесса принятия решений и вовлечение в предпринимательский процесс все большего числа участников является объективным условием современного предпринимательства. Осуществление экономической активности - целесообразной деятельности человека в экономических процессах, направленной на
  3. 4.5. Организационно-управленческие инновации
    модели. Классическая модель описывает традиционное, консервативное предпринимательство, предполагающее управление производством на основе экономичного и эффективного использования производственных ресурсов. Инновационная модель рассматривает виды деятельности, непосредственно связанные с получением, воспроизводством новых научно-технических знаний и их реализацией в материальной сфере
  4. 5.4. Информационная безопасность
    модели обработки информации в терминах ресурсов. 6. Используемые средства связи (цифровая, голосовая и т. д.). Знание элементов системы дает возможность выделить критичные ресурсы и определить степень детализации будущего обследования. Инвентаризация информационных ресурсов должна производиться исходя из последующего анализа их уязвимости. Чем качественнее будут проведены работы на этом этапе,
  5. 31.1 Виды рисков
    модель, базирующуюся на стандартных методах решений. В основе этих ме тодов лежит дерево вероятностей и решений, позволяющее устано вить последовательность решений. Качественное распределение риска предусматривает принятие участ никами проекта ряда решений, направленных на увеличение или уменьшение числа потенциальных инвесторов. Это зависит от доли риска, которую участники хотят возложить на
  6. 7.2. Методологические подходы к задачам краткосредне- и долгосрочного прогнозирования мировых товарных рынков
    модели: где у - прогнозируемый параметр (показатель) товарного рынка (цена, спрос, предложение, экспорт, импорт и т.д.); ЦЛрЛ;, ...) - функция зависимости прогнозируемого параметра от обще хозяйственных (макроэкономических) факторов состояния мировой экономики; ...) - функция зависимости прогнозируемого параметра от мик роэкономических (товарно-рыночных) факторов состояния исследуемого товарного
  7. 1.1. Цели и средства политика развития производства
    моделей, которые могут быть полезны для разработки и осо бенно для планирования политики производства. В настоя щее время все большее число стран, как экономически сла боразвитых, так и развитых, проводят политику, сознатель но направленную на дальнейшее развитие хозяйства. Это оправдывает более тщательное изучение механизма развития с целью найти оптимальный вариант хозяйственной поли тики. Для
  8. 5.2. Модели открытой экономики
    моделям открытой эко номики, но в противоположность тому, что было сделано уже в параграфе 4.4., вводим в них элемент взаимозаменя емости через внешнюю торговлю. Для этого превращаем выбор отраслей в главный инструмент политики развития. По ходу мыслей в рассматриваемых здесь моделях выбор этот будет зависеть прежде всего от сравнительных пре имуществ, которые страна может иметь в одних отраслях,
  9. 1.3. Процесс научного познания и методы исследования
    моделирование, экспермент. Любая познавательная деятельность осуществляется при помощи определенных приемов, отобранных либо интуитивно, либо в соответствии со сложившимися традициями. В науке такие приемы получили названия лметоды. Понятие лметод (происходит от греч. шеШоёоБ - способ, путь) - это способ теоретического и практического освоения действительности. Методы, используемые в
  10. 1.5. Структура современной экономической теории
    моделирования и предельного анализа, следует, по всей видимости, отнести к содержательным теориям, как, впрочем, и многие другие социальные и гуманитарные теории. Во-вторых, с точки зрения логического построения все существующие теории можно классифицировать на дедуктивные и недедуктивные. Под понятием дедуктивные теории подразумевают такие теории, в которых истинность посылок (суждений, из