О некоторой общей схеме формирования критериев оптимальности в играх с природой

Статья - Разное

Другие статьи по предмету Разное

из критериев 7.1, 7.2, 8.1, 8.2 достаточно применить один, причем с более простой функцией игры.

? Максиминно-максимаксные критерии.

Такие критерии представляют собой комбинации максиминного и максимаксного критериев. В качестве показателя оптимальности стратегии берется величина

где ? ? [0,1] коэффициент оптимизма, а и показатели оптимальности стратегии Ai соответственно в максиминном и максимаксном критериях (см. п. 3 и п. 5). При этом функции игры в этих двух критериях целесообразно использовать соответствующие друг другу. Это соответствие показано в табл. 3.

Таблица 3

КритерииВыигрыши

aРиски

rВероятности

состояний природы

qW (a, r, q)M (a, r, q)9.1+aa9.2++(1-q)aqa9.3++a-ra-r9.4+++(1-q)a-qrqa-(1-q)rОптимальной считается стратегия Ai0, максимизирующая показатель оптимальности Нi(? ):

Коэффициент оптимизма ? выбирается субъективно в пределах от 0 до 1, включая концы, в зависимости от опасности ситуации: чем более опасной представляется ситуация, тем меньше оптимизма и тем меньше коэффициент оптимизма ? ; чем более благоприятная ситуация, тем больше оптимизма и значит ? можно выбирать ближе к 1.

При наименьшем значении коэффициента оптимизма ? = 0 данный критерий превращается в максиминный критерий крайнего пессимизма, а при наибольшем значении коэффициента оптимизма ? = 1 рассматриваемый критерий превращается в максимаксный критерий крайнего оптимизма. При ? = 1/2 максиминно-максимаксный критерий можно считать критерием реализма.

Критерий 9.1 является критерием Гурвица относительно выигрышей ([1], с. 505; [2], с. 120; [3], с. 47; [5], с. 57).

? Минимаксно-миниминные критерии.

Минимаксно-миниминные критерии являются результатом комбинации минимаксного и миниминного критериев. Показатель неоптимальности стратегии Ai определяется следующим образом:

где ? ? [0,1] коэффициент оптимизма, а и показатели неоптимальности стратегии Ai соответственно в минимаксном и миниминном критериях (см. п. 4 и п. 6). Функции игры в этих двух критериях лучше выбирать соответствующими друг другу, как это указано в табл. 4.

Таблица 4

КритерииВыигрыши

aРиски

rВероятности

состояний природы

qS (a, r, q)M (a, r, q)10.1+rr10.2++qr(1-q)r10.3++r-ar-a10.4+++qr-(1-q)a(1-q)r-qaОптимальной по критерию является стратегия Ai0, для которой

.

Данный критерий превращается в минимаксный критерий при ? = 0, в миниминный критерий при ? = 1, в критерии Гурвица относительно рисков при (критерий 10.1).

Утверждение 4. При одном и том же коэффициенте оптимизма максиминно-максимаксные критерии 9.3 и 9.4 эквиваленты соответственно минимаксно-миниминным критериям 10.3 и 10.4.

Доказательство. Для критериев 10.3 и 9.3 имеем:

откуда

т.е. показатель неоптимальности Di(? ) будет минимальным для того значения i, для которого показатель оптимальности Hi(? ) будет максимален. Таким образом, эквиваленция 9.3 ? 10.3 доказана.

Эквиваленция 9.4 ? 10.4 доказывается аналогично. n

ПРИМЕР. Рассмотрим игру с природой, в которой игрок А имеет возможность применить одну из четырех стратегий А1, А2, А3, А4, а природа П может находиться в одном из трех состояний П1, П2, П3 с вероятностями соответственно q1 = 0,7; q2 = 0,1; q3 = 0,2. Известны выигрыши (aij) игрока А. Найдем оптимальные стратегии по рассмотренным выше критериям.

Выпишем таблицы показателей игры и в дополнительных столбцах показатели оптимальности и неоптимальности для соответствующих критериев. При этом на основании утверждений 1-4 из эквивалентных критериев будем рассматривать только один.

Таблица для критериев 3.1 и 5.1Таблица для критерия 3.2Пj

AiП1П2П3WiMiПj

AiП1П2П3WiA147117*A11,26,30,80,8(aij) =A24353*5A21,22,74,01,2A365226A31,84,51,61,6*A406306A40,05,42,40,0Таблица для критериев 4.1 и 6.1 Таблица для критерия 4.2

Пj

AiП1П2П3SiEiПj

AiП1П2П3SiA120440*A11,40,00,81,4(rij) =A224040*(qjrij) =A21,40,40,01,4A30233*0*A30,00,20,60,6*A461261A44,20,10,44,2Таблица для критерия 3.3 и 5.3 Таблица для критерия 3.4

Пj

AiП1П2П3WiMiПj

AiП1П2П3WiA127-3-37*A1-0,26,30,0-0,2(аijrij)=A22-15-1*5((1-qj )аij qjrij)=A2-0,22,34,0-0,2A363-1-1*6A31,84,31,01,0*A4-651-65A4-4,25,32,0-4,2Таблица для критерия 5.2 и 7.1 Таблица для критерия 6.2

Пj

AiП1П2П3MiLiПj

AiП1П2П3EiA12,80,70,22,83,7A10,60,03,20,0*(qj аij) =A22,80,31,02,84,1((1-qj)rij) =A20,63,60,00,0*A34,20,50,44,2*5,1*A30,01,82,40,0*A40,00,60,60,61,2A41,80,91,60,9Таблица для критерия 5.4

Пj

AiП1П2П3Mi A12,20,7-3,02,2(qj aij -(1-qj)rij) =A22,2-3,31,02,2 A34,2-1,3-2,04,2* A4-1,8-0,3-1,0-0,3Теперь выпишем таблицы показателей оптимальности для критериев 9 с коэффициентом оптимизма ? = 1/2.

Таблица для критерия 9.1 Таблица для критерия 9.2

AiWi =

Mi =

Hi(1/2)=AiWi =

Mi =

Hi(1/2)= A1174*A10,82,81,8A2354*A21,22,82,0A3264*A31,64,22,9*A4063A40,00,60,3Таблица для критерия 9.3 Таблица для критерия 9.4

AiWi =

Mi =

Hi(1/2)=AiWi =

Mi =

Hi(1/2)=A1-372A1-0,22,21,0A2-152A2-0,22,21,0A3-162,5*A31,04,22,6*A4-65-0,5A4-4,2-0,3-2,25Выпишем таблицы показателей неоптимальности для критериев 10.

Таблица для критерия 10.1Таблица для критерия 10.2AiSi=

Ei=

Hi(1/2)=AiSi=

Ei=

Hi(1/2)=A1402A11,40,00,7A2402A21,40,00,7A3301,5*A30,60,00,3*A4613,5A44,20,92,55Звездочкой * во всех таблицах отмечены оптимальные по соответствующему критерию стратегии.

Для лучшей обозримости сведем полученные результаты в таблицу.

Таблица оптимальных стратегий по различным критериям

№ критерияКритерии. Функции игрыОптимальная

стратегия3Максиминные критерии (крайнего пессимизма)3.1W(a,r,q)=aA23.2W(a,r,q)=(1-q)aA33.3W(a,r,q)=a-rA2 , A33.4W(a,r,q)=(1-q)a-qrA34Минимаксные критерии (крайнего пессимизма)4.1S(a,r,q)=rA34.2S(a,r,q)=qrA35Максимаксные критерии (крайнего оптимизма)5.1М(a,r,q)=аА15.2М(a,r,q)=qаА35.3М(a,r,q)=а-rA15.4М(a,r,q)=qa-(1-q)rА36Миниминные критерии (крайнего оптимизма)6.1E(a,r,q)=rA1, A2, A36.2E(a,r,q)=(1-q)rA1, A2, A37Критерий максимизации взвешенного среднего выигрыша

(критерий Лапласа)7.1L(a,r,q)=qаА39Максиминно-максимаксные критерии с коэффициентом

оптимизма ? =1/29.1W(a,r,q)= М(