Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Экономика
С. Л. Печерский, А. А. Беляева. Теория игр для экономистов, 2001 | |
Стратегия |
|
Ч это полный возможный план, который описывает то, как игрок будет действовать в каждых возможных обстоятельствах, когда ему, может быть, придется делать ход. С точки зрения игрока, множества возможных обстоятельств представлены набором его информационных множеств, причем каждое информационное множество представляет различные различимые обстоятельства, в которых ему может потребоваться ходить. Тем самым стратегия игрока сводится к описанию того, как он планирует ходить в каждом из его информационных множеств. Определение 2.1.2. Пусть %i - семейство всех информационных множеств игрока i, А - множество всех возможных ходов (действий) в игре, С(Н) С А - множество ходов, возможных в информационном множестве Н. Стратегия игрока i - это отображение S; : %i Ч> А такое, что Si(H) ? С(Н) для каждого Н ? %i . То, что стратегия - это полный возможный план, нельзя недооценивать, особенно, как мы увидим, это будет важно в дальнейшем. Определение игроком своей стратегии подобно написанию перед игрой инструкции относительно того, как его представитель может действовать, просто заглядывая в эту инструкцию. Или, иначе, определение игроком i своей стратегии можно трактовать следующим образом: в каждом информационном множестве игрока i находится его агент, которому он сообщает, какой ход должен будет сделать этот агент, если ему придется делать ход, т.е. игра лдойдет до соответствующего информационного множества. Здесь очень важно иметь в виду следующее. Как полный план стратегия часто определяет действия игрока в инфор-мационных множествах, которые могут быть даже не достигнуты во время действительного разыгрывания игры. Так, в крестиках-ноликах стратегия игрока О описывает, в частности, то, что он будет делать, если на 1-м ходу X сыграет в центр. Но в действительной игре можно сыграть вовсе не в центр. Более того, стратегия игрока может включать планы действий, которые его собственная стратегия делает неуместными. Опять же в лкрестиках-ноликах стратегия игрока X включает описание того, что он будет делать после того, что он сыграет на первом ходу в лцентр, а 0 ответит в ллевый нижний угол, даже если X на первом ходу играет лверхний левый. Это, возможно, кажется странным, но играет очень важную роль в динамическом случае. Итак, еще раз: Стратегия - это полный возможный план действий, который говорит, что игрок будет делать в каждом его информационном множестве. Рассмотрим следующую простую игру (рис.3). Рис. 3. У первого игрока две стратегии: Н и Т. А у игрока 2 их четыре; поскольку у него 2 информационных множества, следовательно, каждая стратегия должна определять ход в каждом из этих информационных множеств. А именно: si : Н , если 1-й сыграл Н ; Н , если 1-й сыграл Т ; л2 : Н , если 1-й сыграл Н ; Т , если 1-й сыграл Т ; : Т , если 1-й сыграл Н ; Н , если 1-й сыграл Т ; : Т , если 1-й сыграл Н ; Г , если 1-й сыграл Г . Отметим здесь еще одно чрезвычайно важное обстоятельство. Имея набор стратегий каждого игрока, мы можем построить нормальную форму данной игры: поскольку выбор игроками своих стратегий определяет ход в каждом информационном множестве, значит, полностью определяет траекторию или лпуть, по которому будет развиваться игра. Нормальная форма игры, изображенной на рис. 3, есть Sl S2 S3 s4 Я / (ai, 61) (ai, 61) (a2,b2) (a2,b2) \ T V (a3,b3) (a4,64) (a3,b3) (a4,64) J Каждый набор стратегий определяет траекторию лдвижения по дереву и тем самым определяет исход игры. Ясно также, что мы имеем возможность говорить о равновесии по Нэшу. Прежде чем обратиться к более подробному рассмотрению равновесия по Нэшу приведем теорему существования. Теорема 2.1.1. (Kuhn, 1953) . В конечной игре с совершенной информацией существует равновесие по Нэшу в чистых стратегиях. Мы начнем со следующего примера, который покажет, что равновесие по Нэшу не всегда дает разумное предсказание. Пример (Mas-Colell, Whinston, Green). Фирма Е (entrant) - новичок - рассматривает вопрос о том, входить ли на рынок, где в текущий момент есть одна единственная укоренившаяся фирма I (incumbent). Если Е решается на вход, то I может ответить двумя способами: она может предоставить вход, отдавая часть своих продаж, но не изменяя цену, либо она может вступить в хищническую войну, которая приведет к лдраматическому снижению цен. Дерево, соответствующее рассматриваемой ситуации, изображено на рис.4. Нормальная форма этой игры имеет следующий вид (рис. 5): I вх од Е нет Предоставить (если лвход) (0,2) (2,1) Война (если лвход) (0,2) (-3,-1) Рис. 5. Здесь две ситуации равновесия по Нэшу в чистых стратегиях: (нет, война) и (да, предоставить). Но первая из этих ситуаций - это не разумное предсказание: фирма Е может предвидеть, что если она изберет лвход, то I в действительности изберет лпредоставить, т.е. лвойна, если вход - не заслуживает доверия. Для того чтобы исключить ситуации типа (нет; война, если вход), мы рассмотрим лпринцип последовательной рациональности: стратегия игры должна предписывать оптимальный ход в каждой вершине дерева. Т.е. если игрок находится в некоторой вершине дерева, его стратегия должна предписывать оптимальный выбор, начиная с этой точки, при данных стратегиях его оппонентов. В этом смысле стратегия лвойна, если вход таковой не является, ибо после входа единственная оптимальная стратегия для I - лпредоставить. В нашем примере сделать все очень просто: начнем с того, что определим оптимальное поведение для I в игре на этапе лпосле входа - это, очевидно, лпредоставить. Теперь мы можем определить оптимальное поведение фирмы Е до этого момента, с учетом предвидения того, что произойдет после входа. Это можно сделать, рассмотрев лредуцированную позиционную форму, где лпост-входное принятие решения I заменено на соответствующие выигрыши, которые возникают при оптимальном лпост-входном поведении фирмы I (рис.6). А это уже простейшая задача принятия индивидуального решения, причем решение - лвход. Рис. 6. Этот тип процедуры, которая начинается с нахождения оптимального поведения лв конце игры, а затем определения оптимального поведения на более ранних шагах в предвидении того, что будет происходить дальше, называется обратной индукцией . (Подчеркнем, что сказанное относится к конечным играм с совершенной информацией, т.е. конечным играм с лодновершинными инормационными множествами.) Однако, прежде чем остановиться на обратной индукции более подробно, мы должны отметить следующее достаточно существенное обстоятельство, касающееся смешанных стратегий. А именно, если мы рассматриваем игры в позицион-ной форме, то игроки могут рандомизировать свои чистые стратегии способом, отличным от стандартного, в котором используются смешанные стратегии, приписывающие каждой чистой стратегии игрока (множество которых может быть очень большим) вероятность того, что игрок будет ее играть. В позиционной форме появляется возможность рандомизации раздельно в каждом информационном множестве. Такой способ рандомизации приводит к стратегиям поведения. Определение 2.1.3. В игре в позиционной форме Г^; стратегия поведения игрока i определяет для каждого информационного множества Н ? %i и альтернативы а ? С(Н) вероятность Ai(a,H) > 0, причем Н) = 1 для всех Н ? %i . Оказывается (Kuhn, 1953; см. также, например, Петросян, Зенкевич, Семина, 1998), что для игр с полной памятью эти два типа рандомизации эквивалентны. (Важно подчеркнуть, что полная память играет здесь ключевую роль.) А именно, для любой стратегии поведения игрока i существует его смешанная стратегия, дающая в точности такое же распределение выигрышей для любых стратегий (смешанных или стратегий поведения), которые могут играться остальными игроками, и наоборот. Это соответствие можно установить следующим образом. Будем, как всегда, обозначать чистые стратегии игрока i через Si . Пусть Ui - некоторая его смешанная стратегия. Будем называть некоторую вершину х дерева Г^; возможной для Si , если существует такой набор стратегий s = (s4-,s_j-) , что траектория, определяемая этим набором, проходит через s . Обозначим множество всех возможных для вершин через P(si) . Информационное множество Н называется существенным для Si , если оно содержит некоторую возможную для Si вер-шину. Множество существенных для Si информационных множеств обозначим через R(si) . Пусть (Ti - некоторая смешанная стратегия игрока i. Тогда стратегия поведения Аг-, соответствующая смешанной стратегии , определяется следующим образом. Если Н ? R(si) , то ( Е{8г:ЯбД(8г),8г(Я) = а}<5') ( A i{a,h)- ^ ЧЧ . (*) Z^{st-.HeR(st)} ai\si) Если Н R(si) , то знаменатель этой дроби обращается в ноль, поэтому стратегию Аг- можно определить произвольно, например, A i(a,H)= crt(st). {s,:s,(H) = a} Если Ai - стратегия поведения, то можно определить как YlXi(Si(H),H). я При этом Ai оказывается стратегией поведения, соответствующей (Ti. Поэтому в играх с полной памятью (а именно такие игры мы и рассматриваем) безразлично, каким способом ран- домизировать. Терминологически мы всегда будем говорить о смешанных стратегиях. В игре с неполной памятью могут существовать смешанные стратегии, для которых нет эквивалентных им стратегий поведения. Пример (Osborn, Rubinstein). Рассмотрим игру, изображенную на рис. 7. Пусть смешанная стратегия игрока а определяется следующим образом: с вероятностью 1/2 играется L , а потом еще раз L , и с вероятностью 1/2 играется R , а потом еще раз R . Исходом, соответствующим этой стратегии, является распределение (тр 0, 0,-j) на множестве терминальных вершин. Но такой исход не может быть обеспечен ни одной стратегией поведения: стратегия поведения ((р, 1 - р), (q, 1 - q)) инициирует распределение на множестве терминальных вершин, в которых исход, соответствующий и2 , имеет вероятность 0 в случае только, если р = 0 или q = 1 , но тогда вероятность (L,L) или (R, R) есть 0. |
|
<< Предыдушая | Следующая >> |
= К содержанию = | |
Похожие документы: "Стратегия" |
|
|