Г. К. Честертон Графы (терминология)
| Вид материала | Документы |
СодержаниеМногошаговые игры |
- Терминология в пауэрлифтинге, 280.99kb.
- Рабочая программа дисциплины Графы и алгоритмы Направление подготовки, 133.78kb.
- Планирование, управление, контроль 76 Терминология по охране объектов нефтепроводного, 1117.18kb.
- «Современная терминология заготовки и переливания крови», 28.84kb.
- Л. А. Чернышова отраслевая терминология в свете антропоцентрической парадигмы, 2698.99kb.
- Артур Конан Дойл. Как Копли Бэнкс прикончил капитана Шарки. Киплинг Р. Д. Дьявол, 33.4kb.
- Г. К. Честертон По-настояшему боишься только того, чего не понимаешь, 5959.79kb.
- Г. К. Честертон, 1996.42kb.
- Г. К. Честертон святой франциск ассизский, 1309.11kb.
- Вопросы к теоретическому зачету группы с (sis – 2003), 29.23kb.
Многошаговые игры
Лемма. Пусть U1,…,UT,V1,…,VT – компактные множества, а
– непрерывная функция. Обозначим
множество всех функций
. Тогда
Доказательство. Очевидно

В силу результатов предыдущей лекции

Повторяя те же рассуждения, получим нужный результат.
Лемма. Пусть U1,…,UT,V1,…,VT – компактные множества, а
– непрерывная функция. Обозначим
множество всех функций
,
– множество всех функций
. Тогда
Доказательство аналогично предыдущему
Лемма. Пусть U1,…,UT,V1,…,VT – компактные множества, а
– непрерывная функция. Обозначим
множество всех функций
, и пусть 1,2,…,T – вероятностные меры на V1,V2,…,VT соответственно. Тогда
Доказательство аналогично предыдущему.
Определение. Управляемой динамической системой называется набор
, где Xt – множества, называемые фазовыми пространствами, xX0 – начальная фазовая точка,
– множества управлений,
– функции перехода,
– терминальные критерии.С каждой управляемой динамической системой можно связать несколько игр.
Определение. Игрой на классе программных стратегий, соответствующей управляемой динамической системе
называется набор Г=<N,U1,…,Un,g1,…,gn>, в котором N={1,…,n},
, а значения функций
вычисляются с помощью рекуррентных соотношенийx0=x,
, t=0,…,T,gi(u1,…,un)=hi(xT+1), i=1,…,n
(здесь
).Определение. Игрой на классе позиционных стратегий, соответствующей управляемой динамической системе
называется набор *Г=<N,*U1,…,*Un,*g1,…,*gn>, в котором N={1,…,n},
, а значения функций
вычисляются с помощью рекуррентных соотношенийx0=x,
, t=0,…,T,
, t=0,…,T,gi(u1,…,un)=hi(xT+1), i=1,…,n
(здесь
).Справедлива
Лемма. Игра на классе позиционных стратегий является квазиинформационным расширением игры на классе программных стратегий, соответствующей той же управляемой динамической системе.
Доказательство. Значения проекции
определяются рекуррентными соотношениями x0=x,
, t=0,…,T,
, t=0,…,T.Вложения ci определяются стандартным образом, после чего аксиомы квазиинформационного расширения проверяются по индукции.
Использовать специфику игр на классе программных стратегий в общем случае не удается. Для игр на классе позиционных стратегий решение многих задач упрощается. Например, рассмотрим антагонистическую игру *Г={1,2},*U1,*U2,*g1, *g2=–*g1> на классе позиционных стратегий, соответствующую динамической управляемой системе
. СправедливаТеорема. Пусть множества Xt и
компактны, а функции ft и hi непрерывны. Тогда максимальный гарантированный результат первого игрока
может быть вычислен с помощью рекуррентных формул 
, t=T,T–1,…,0,L=L0(x).
Доказательство проводится индукцией «с конца».
Если множества
конечны, то соответствующие игры на классах программных и позиционных стратегий легко могут быть представлены как позиционные игры. Наличие этой связи позволяет, например, легко перенести на случай игр двух лиц на классе позиционных стратегий последнюю теорему из предыдущего раздела.- Проклятие размерности
