Игра состоит из последовательности ходов. Ходы бывают личные и случайные. (В шахматах все ходы личные. Рулетка содержит случайный ход). Результаты ходов оцениваются
Вид материала | Документы |
- Урок-игра по теме «Обыкновенные дроби», 162.9kb.
- Методика обучения технике лыжных ходов Методические указания для преподавателей и студентов, 697.8kb.
- Содержание, 248.94kb.
- Программа для государственного экзамена по дисциплине «Гражданское право» гражданское, 644.18kb.
- Методические рекомендации г. Москва 2009 год антибиотикопрофилактика основных инфекций, 461.31kb.
- Ходы Южно-Уральской торгово-промышленной палаты в 2009 году превысили 105 миллионов, 539.09kb.
- В этой статье,которая будет постепенно расти, по крупицам, из разных источников собраны, 214.07kb.
- Список профилей направления 010300, 964.84kb.
- Для эффективного ведения бизнеса сейчас не достаточно просто иметь сайт в Интернете, 80.93kb.
- Анна Борисова Анна Борисова, 219.92kb.
Введение в матричные игры
П
![](images/152303-nomer-m2f951c1d.jpg)
несколько сторон (игроков). Цели игроков различны, часто противоположны. Мы будем рассматривать только игры двух лиц с противоположными интересами.
Игра состоит из последовательности ходов. Ходы бывают личные и
случайные. (В шахматах все ходы личные. Рулетка содержит случайный ход).
Результаты ходов оцениваются функцией выигрыша для каждого игрока. Если сумма выигрышей равна 0, то игра называется игрой с нулевой суммой
(преферанс). Будем рассматривать только такие игры.
С
![](images/152303-nomer-66a05515.jpg)
поведение игрока, т.е. выбор хода.
Оптимальной стратегией называют такую стратегию, при которой достигается максимальный ожидаемый
средний выигрыш при многократном повторении игры.
Матричные игры — это игры, где два игрока играют в игру с нулевой суммой, имея конечное число «чистых» стратегий: {1,…, m} и {1,…, n} и (ij) задан платеж aij второго игрока первому. Матрица (aij) задает выигрыш первого
игрока и проигрыш второго, aij ≷ 0 !
Игра в орлянку.
Игроки выбирают ход{орел, решка}. Если ходы совпали, то выиграл первый, иначе второй.
![](images/152303-nomer-2253ca7.png)
![](images/152303-nomer-202b8307.png)
I ![]() | орел | решка |
I игрок | ||
орел | 1 | – 1 |
решка | – 1 | 1 |
Прорыв обороны. Первый игрок выбирает систему зенитного вооружения. Второй игрок выбирает самолет. Элементы aij задают вероятность поражения самолета j системой i. Цель второго игрока — прорвать оборону.
![](images/152303-nomer-mb48af8.gif)
| Самолеты | ||
Зенитки | 0,5 | 0,6 | 0,8 |
0,9 | 0,7 | 0,8 | |
0,7 | 0,5 | 0,6 |
В первом примере все ходы одинаково плохи или хороши. Во втором примере ход (2, 2) в некотором смысле лучший для обеих сторон: если взять самолет 2, то зенитка 2 — лучшая для первого игрока; если взять зенитку 2, то самолет 2 лучший для второго. В матрице есть седловая точка!
Определение. Седловой точкой матрицы (aij) называют пару (i0j0) такую, что
![](images/152303-nomer-m2f638d62.gif)
Принцип минимакса (осторожности).
Предположим, что противник всеведущ и угадывает все ходы! Первый игрок предполагает, что второй все знает и для хода i первого игрока выберет j(i):
aij(i) aij, j = 1,…, n. Обозначим
![](images/152303-nomer-2c23a078.gif)
стратегией для первого игрока является выбор i0 такой, что
![](images/152303-nomer-2c036a29.gif)
Величину назовем нижней ценой игры в чистых стратегиях.
Второй игрок из соображений осторожности считает, что первый j выберет i(j) так, что ai(j)j aij, i, т.е.
![](images/152303-nomer-m58bb1714.gif)
![](images/152303-nomer-m6e38c46b.gif)
Величину назовем верхней ценой игры в чистых стратегиях.
Пример 1. = –1, = +1,
Пример 2.
![](images/152303-nomer-603646bb.gif)
![](images/152303-nomer-25956ace.gif)
Лемма. Для любой функции f(x,y), xX, yY, справедливо неравенство
![](images/152303-nomer-m59eeffd0.gif)
в предположении, что эти величины существуют.
Доказательство. Введем обозначения:
![](images/152303-nomer-m392e20da.gif)
![](images/152303-nomer-29fbf559.gif)
Тогда
![](images/152303-nomer-6b69ec47.gif)
![](images/152303-nomer-m48cb8dd6.gif)
Теорема. Необходимым и достаточным условием равенства верхней и нижней цен игры в чистых стратегиях является существование седловой точки
в матрице (aij).
Доказательство. Необходимость. Пусть = . По определению
![](images/152303-nomer-3464e4bf.gif)
т.е.
![](images/152303-nomer-m279639e1.gif)
![](images/152303-nomer-7f3f6a61.gif)
Достаточность. Пусть седловая точка (i0j0) существует, т.е.
![](images/152303-nomer-280993d0.gif)
Т
![](images/152303-nomer-m140a455b.gif)
![](images/152303-nomer-69f99ce0.gif)
![](images/152303-nomer-6d124a.gif)
Смешанные стратегии и основная теорема матричных игр
Определение. Под смешанной стратегией будем понимать вероятностное распределение на множестве чистых стратегий.
Смешанная стратегия первого игрока: p = (p1,…, pm),
![](images/152303-nomer-5e11284f.gif)
Смешанная стратегия второго игрока q = (q1,…, qn),
![](images/152303-nomer-m1fc22b6e.gif)
При многократном повторении игры игрок выбирает чистые стратегии
случайным образом с соответствующими вероятностями.
Платежная функция для смешанных стратегий p и q:
![](images/152303-nomer-bfd3566.gif)
задает математическое ожидание выигрыша первого игрока при p,q.
Замечание. Добавлением большой положительной константы можно добиться того, что E(p,q) > 0, p,q без изменения стратегий.
Из принципа осторожности:
Первый игрок ищет максимум
![](images/152303-nomer-m2cf8e539.gif)
![](images/152303-nomer-1e23eb8d.gif)
Второй игрок ищет минимум
![](images/152303-nomer-4547421c.gif)
игры
![](images/152303-nomer-2308f5c7.gif)
Теорема Фон–Неймана
В матричной игре существует пара
![](images/152303-nomer-d56a3c3.gif)
-
, pPm, qQn.
- = =
.
Доказательство. Сначала покажем, как представить задачу о выборе
наилучших стратегий в виде ЛП, а затем докажем теорему.
Первый игрок: (p) max
![](images/152303-nomer-6b08563b.gif)
Пусть ui = pi /(p), i = 1,…, m, в предположении (p) > 0.
Тогда ui 0, i = 1,…, m, и
![](images/152303-nomer-324e8060.gif)
![](images/152303-nomer-m3fef5b76.gif)
![](images/152303-nomer-m5f75b796.gif)
![](images/152303-nomer-m5d008181.gif)
![](images/152303-nomer-m63a8bac.gif)
Аналогичным образом получаем задачу второго игрока:
![](images/152303-nomer-m4bf21833.gif)
![](images/152303-nomer-m23aabb25.gif)
![](images/152303-nomer-m4b6b2e3c.gif)
где vj = qj /(q), j = 1,…, n. Полученные задачи являются взаимодвойственными. Пусть
![](images/152303-nomer-3daf548c.gif)
Положим
![](images/152303-nomer-m14f4c490.gif)
![](images/152303-nomer-m16bf3fe7.gif)
![](images/152303-nomer-m4c00d5e9.gif)
![](images/152303-nomer-612649d5.gif)
Просуммировав, получим
![](images/152303-nomer-1d756b9f.gif)
Поделим на
![](images/152303-nomer-69945bc5.gif)
![](images/152303-nomer-4879bec4.gif)
Теперь докажем первое утверждение теоремы:
![](images/152303-nomer-75cf14ab.gif)
Аналогично
![](images/152303-nomer-m118cf05b.gif)
т.е.
![](images/152303-nomer-m289bf5c5.gif)
Докажем второе утверждение теоремы.
Из предыдущего неравенства имеем:
![](images/152303-nomer-m25082cb9.gif)
т.е.
![](images/152303-nomer-7bcb8d82.gif)
Н
![](images/152303-nomer-m140a455b.gif)
![](images/152303-nomer-m3cb71968.gif)
![](images/152303-nomer-3e3ec48b.jpg)
Дилемма заключенных
Д
![](images/152303-nomer-55d79760.jpg)
У следствия не хватает доказательств их виновности и преступникам предлагают сделку:
Если сознаешься и подтвердишь участие товарища в преступлении, то выйдешь на свободу, а товарищ получит 7 лет лишения свободы.
Преступники сидят в разных камерах и не могут общаться, но они знают, что каждому сделано такое предложение.
Если оба преступника сознаются, то каждый получит 5 лет.
Если оба не сознаются, то каждый получит по 1 году.
Матричная игра двух лиц
-
2-й сознался
2-й не сознался
1-й сознался
5 : 5
0 : 7
1-й не сознался
7 : 0
1 : 1
Седловая точка — оба сознаются — существует и дает 5 лет каждому
Оптимальное решение — не сознаваться — дает только 1 год.
Оно не является седловой точкой!
Что будет, если дать преступникам посовещаться?
Вопросы к экзамену
3 курс, ФИТ, НГУ, Летняя сессия, 2008 г.
- Метод динамического программирования на примере распределительной задачи.
- Модель размещения капитала. Свойство дробных решений. Процедура
округления.
- Алгоритмы для задачи о рюкзаке с гарантированной точностью 0.5 и 0.75.
- Аппроксимационные схемы. Полиномиальные и полностью полиномиальные аппроксимационные схемы. Примеры таких схем для задачи о рюкзаке.
- Задача замены оборудования с учетом дисконтирования затрат. Соотношения динамического программирования для случая конечного планового периода.
- Задача упаковки в контейнеры. Нижние оценки целевой функции.
- Задача двумерной прямоугольной упаковки. Алгоритм имитации отжига.
- Задача календарного планирования. Критические работы, пути и критическое время проекта. Вероятность завершения проекта к заданному сроку
- Постановка задачи календарного планирования с ограниченными ресурсами.
- Т–поздние расписания. Алгоритм вычисления Т–поздних расписаний.
- Доказательство оптимальности Т*–позднего расписания. Алгоритм Гимади.
- Задачи календарного планирования с переменными длительностями работ. Сведение к линейному программированию.
- Задача коммивояжера. Теорема о погрешности приближенных полиномиальных алгоритмов и алгоритмов локального спуска.
- Задача коммивояжера с неравенством треугольника. Алгоритм с гарантированной оценкой точности 2. Доказательство оценки и ее неулучшаемости.
- Нижние оценки в задаче коммивояжера: примитивная оценка, оценка линейного программирования, оценка задачи о назначениях и минимальные 1-деревья.
- Алгоритм решения задачи о назначениях.
- Метод ветвей и границ для задачи коммивояжера.
- Классификация задач теории расписаний.
- Алгоритм Лаулера для задачи 1| prec| fmax
- Алгоритм решения задачи 1| prec, pmtn, ri | fmax
- Алгоритм решения задачи P | pmtn |Cmax
- Алгоритм решения задачи P | pmtn, ri |Lmax
- Алгоритм решения задачи Q | pmtn |Cmax
- Алгоритм решения задачи F2 || Cmax
- Задачи о покрытии, алгоритм Чватала, оценка его погрешности и экстремальный пример.
- Задачи размещения. Генетический алгоритм для задачи размещения производства.
- Задачи размещения в условиях конкуренции, их связь с принятием решений голосованием, «безнадежный» пример.
- Матричные игры. Определение седловой точки.
- Необходимые и достаточные условия равенства верхней и нижней цен игры в чистых стратегиях. Теорема Фон-Неймана. Дилемма заключенных.
![](images/152303-nomer-m4e021f0e.gif)
![](images/152303-nomer-61ba9146.gif)
Лекция 14. Матричные игры --