а) оперирующая сторона разрешает осреднение критерия;
б) оперирующая сторона не разрешает осреднение критерия.
П Найти скорость движения машин, при которой поток будет максимальным.
№ 2.2.4. Продавец газет покупает k газет для продажи и за каждую проданную газету получает прибыль, равную a. Непроданные газеты он возвращает, но при этом терпит убыток, равный b, на каждой непроданной газете. Спрос, т.е. количество z людей, покупающих газеты, является неконтролируемым фактором, принимающим значения на отрезке,, [ ] где, - известные натуральные числа. Цель газетчика - так выбрать число газет k для продажи, чтобы по мере возможности увеличить прибыль от продажи. Составить модель операции. Найти оценку эффективности произвольной стратегии и оптимальную стратегию, если спрос Z является случайной величиной с известным математическим ожиданием m и дисперсией D > 0.
2.3. Предположим теперь, что в рассматриваемой операции нет СФ, но есть НФ y N. Тогда ОЦЕНКОЙ ЭФФЕКТИВНОСТИ стратегии x назовем число W (x) = inf W (x, y) или W (x) = supW (x, y).
yN yN Задачи:
№ 2.3.1. Спелеолог продвигается из точки в точку по пещере, C1 Cимеющей следующую форму (рис. 2).
Здесь Ci, i = 1,2,3 - выходы из пещеры, D - точка разветвления, C1 D C2 CD= 3 км, CC2 = 8 км, DC3 = 2,1 км. В некоторый момент времени tспелеолог повредил себе ногу и, Cначиная с этого момента, его цель состоит в том, чтобы как можно Рис. быстрее выйти из пещеры, выбирая любой из выходов. Предполагается, что спелеолог при желании может измерять расстояние, пройденное по пещере. Положение спелеолога в момент на отрезке C1,C2 характеризуется расстоянием, t0 y [ ] пройденным от C1. Составить модель операции в следующих вариантах информированности спелеолога об y :
а) известно, что 3,5 y 5 ;
б) известно, что 2 y 4, но спелеолог не помнит, проходил ли он точку D.
№ 2.3.2. Город имеет форму круга G радиуса R. Будем предполагать, что из любой точки города можно проехать на машине в любую другую точку по прямой линии и что машины движутся по городу с постоянной скоростью. Решается вопрос о размещении в городе трех пожарных частей. Нужно так выбрать точки расположения пожарных частей, чтобы до возникшего в точке пожара можно скорее всего y добраться. Составить модель операции. Найти оценку эффективности произвольной стратегии.
з 3. Общее определение стратегии ОС Как уже отмечалось ранее, ОС может располагать к моменту проведения операции дополнительной информацией. Эту дополнительную информацию принято называть ИНФОРМАЦИОННОЙ ГИПОТЕЗОЙ.
Формально информационная гипотеза задается с помощью ИНФОРМАЦИОННОЙ ФУНКЦИИ R: N Z0 Rk, k =1,2,...
Видинформационной функции R должен быть обязательно сообщен ИО к моменту исследования. К моменту же проведения операции станет известным ОС значение функции R y, z.
( ) В зависимости от информированности ОС о значениях НКФ принято R выделять следующие типы информационной функции :
а) Полная информированность ОС, то есть ОС к началу проведения операции будут сообщены значения всех присутствующих в операции НКФ. В этом случае информационная функция является тождественной R y, z = y, z, y, z N Z0.
( ) ( ) ( ) в) Отсутствие информации о значении НКФ. Тогда информационная функция тождественная равна некоторой константе R0 y, z C, y, z N Z0.
( ) ( ) с) Частичная информированность ОС о значении НКФ, задаваемая некоторой функцией R = R y, z.
( ) Пример. Рассмотрим некоторую операцию, в которой из НКФ есть НФ (стратегия противника) y = y1, y2, y3, где - количество самолетов ( ) yi i -го типа, участвующих в операции, i = 1,.
а) R( y) = y, то есть к началу операции разведка сообщит ОС количество самолетов каждого из трех типов, участвующих в операции.
в) R0 (y) 0. Это означает, что никаких дополнительных сведений о количестве самолетов противника к началу операции не ожидается.
с) R1(y) = yi. Другими словами, к началу операции будет i=известна только общая численность самолетов противника. Если же R2 ( y) = y1, то соответствующая информационная гипотеза такая: к началу операции будет точно известно только количество самолетов первого типа.
Информационная гипотеза используется ИО при выборе поведения для ОС, что и отражено в общем понятии стратегии.
СТРАТЕГИЕЙ ОПЕРИРУЮЩЕЙ СТОРОНЫ (СОС) с точки зрения ИО является правило поведения (другими словами способ действия или способ использования активных средств), разрешенное информационной гипотезой (ожидающейся информацией). Дадим теперь формальное описание СОС.
Рассмотрим операцию с информационной гипотезой, задаваемой некоторой функцией R = R y, z. СОС будем называть такое отображение ( ) x множества N Z0 (возможных значений НКФ) в множестве M (возможных способов действий ОС), то есть x:N Z0 M0, что из условия R y1, z1 = R y2, z2 следует, что x y1, z1 = x y2, z2. Другими ( ) ( ) ( ) ( ) словами, те значения НКФ, которые не различает информационная гипотеза, не должны быть различимы и в предлагаемом исследователем способе поведения ОС.
Для случаев а), в) и с), рассмотренных выше, возможны следующие множества стратегий.
а) R y, z = y, z. Тогда множество возможных стратегий ( ) ( ) M = x: N Z0 M{ } есть множество всех возможных отображений N Z0 в M0.
в) R0 y, z C. В таком случае множество возможных СОС ( ) M0 = x: x M, x y, z x M( ) { } есть множество СТРАТЕГИЙ -КОНСТАНТ. Этистратегии мы обсуждали и в з 1-2.
с) R = R y, z - некоторая функция, отличная от R и R0. В этом ( ) случае множество возможных СОС есть M = x: x M ; R y1, z1 = R y2, z2 x y1, z1 = x y2, z2.
( ) ( ) ( ) ( ) { } R Очевидно, что M M M.
0 R Пример. Рассмотрим операцию, в которой ОС располагает двумя самолетами, а противник тремя зенитками. В операции участвуют один самолет и одна зенитка. Построить множество СОС в случаях а), в) и с).
Выделим сначала основные компоненты операции.
x КФ - участвующий в операции самолет; значение КФ - номер этого самолета и x M0 = 1,2.
{ } НФ - зенитка, участвующая в операции; значение НФ y - номер этой зенитки и y N = 1,2,3.
{ } СОС - x:N M0 или x = x( y). Заметим, что x( y) есть номер самолета в зависимости от номера зенитки, участвующей в операции.
а) R(y) = y. Множество возможных СОС M состоит, очевидно, из восьми стратегий. Выпишите все эти стратегии.
в) R0 (y) 0. Тогда M0 = x1( y) 1, x2 (y) 2.
{ } с) Пусть 0, y = 1,R(y) =.
1, y = То есть зенитки с нечетными номерами не могут быть различимы разведкой ОС. Тогда ИО не может уже рекомендовать ОС такой способ действия, как 1, y = 1, x(y) =, 2, y = который при использовании противником зенитки с номером один предлагает выпустить самолет один, а в случае использования противником третьей зенитки - второй самолет.
Поэтому M = x1, x2, x3, x4, { } R где 1, y = 1,32, y = 1, x3 (y) = ; x4 ( y) =.
2, y = 21, y = з 4.ОЦЕНКА ЭФФЕКТИВНОСТИ СТРАТЕГИЙ ОС при наличии дополнительной информации о значении НКфакторов 4.1. Рассмотрим операцию, компоненты которой КФ x M0, НФ M y N, КЭО W = W (x, y), СОС x = x( y), где одно из трех возможных множеств стратегий M0, M, M. Тогда ОЦЕНКОЙ R ЭФФЕКТИВНОСТИ СОС x назовем число W x = inf W x( y), y. ( 1 ) ( ) ( ) yN Очевидно, что W x ( ) будет получено в результате операции, если ОС использует стратегию x и находится в самой худшей для себя ситуации. А именно: противнику известны СОС x и он преследует цель, противоположную цели ОС (если цель противника противоположна цели ОС, то есть КЭО для противника есть - W, то он будет стремиться уменьшить величину критерия W, а если ему известна еще СОС x, то он, естественно, выберет таким, чтобы реализовать (1) или подойти y достаточно близко к этой величине).
Если противник имеет непротивоположную цель, выражаемую критерием W1(x, y), и ИО известен этот критерий, то ОС, сообщая противнику свою стратегию и уточняя соответствующим образом множество значений НФ, может улучшить оценку (1).
Так, если ИО известно, то противник знает СОС x, то он может исходить из того, что противник, стремясь максимизировать функцию W1, выберет y1 таким образом, чтобы W1 x y1, y1 = maxW1 x y, y. ( 2 ) ( ) ( ) ( ) ( ) yN Поскольку ИО неизвестны мотивы выбора y1 из всех реализующих максимум (2), то оставаясь на позициях гарантированного результата, за оценку эффективности стратегии x он должен принять W x = inf W x y1, y1, ( ) ( ) ( ) y1N (x) где N x = y1 :W1 x y1, y1 = maxW1 x y, y.
( ) ( ) ( ) ( ) ( ) { } yN Так как N x N, то для любой СОС x M, ( ) W x W x.
( ) ( ) Другими словами, если цель противника не противоположна цели ОС, то ОС выгоднее сообщить свою стратегию, иначе даже общность целей может быть ничуть не лучше, чем их противоположность.
Стратегию x0 = x0 (y) назовем ОПТИМАЛЬНОЙ в множестве стратегий M, если W x0 = maxW x.
( ) ( ) xM Число WГ (M ) = supW x = supinf W x y, y ( ) ( ) ( ) xM yN xM принято называть НАИЛУЧШИМ ГАРАНТИРОВАННЫМ РЕЗУЛЬТАТОМ.
4.2. Предположим теперь, что в рассматриваемой операции нет Z НФакторов, но есть СФ - случайная величина со значениями z Z0 и функцией распределения вероятностей F F. Тогда КЭО W = W x, z и ( ) СОС x = x(z) M.
Пусть ОС разрешает ИО осреднять критерий, то есть разрешает ИО W x Z, Z, который W x = M переход к другому критерию ( ) ( ) ( ) является математическим ожиданием случайной величиныW x Z, Z.
( ) ( ) Тогда ОЦЕНКОЙ ЭФФЕКТИВНОСТИ стратегии x(z) называется число W W x = inf M x Z, Z = inf x z, z dF(z).
( ) ( ) ( ) ( ) W ( ) FF FF Z4.3. Рассмотрим теперь общий случай, а именно операцию, в которой присутствуют все факторы. Пусть КФ : x M ; НФ : y N ; СФ : Z - случайная величина со значениями z Z0 и функцией распределения F F ; КЭО : W = W(x, y, z) ; СОС : x = x( y, z) M. Предположим, что ОС разрешает ИО осреднять критерий. Тогда ОЦЕНКОЙ ЭФФЕКТИВНОСТИ СОС назовем число W x = inf x y, z, y, z dF (z), ( ) ( ) W ( ) FF Zесли НФ y не зависит от реализации z случайной величины Z.
Например, - стратегия противника не зависит от ошибки разведки ОС - y Z. Если же y зависит от реализации z СФактора Z, то оценкой будет число W x = inf W x y, z, y, z dF(z).
( ) ( ) ( ) FF Z0 yN Задачи:
№ 4.1. Пусть x M = 1,2,3, 4, y N = 1,2,3 и { } { } 3 7 - 2 3 -W x, y =.
( ) () -3 2 4 3 - Найти оценки эффективности стратегий x1 = 1,1,1, если ( ) а) y - неопределенный фактор;
б) Y - случайный фактор, N - множество возможных значений СФ 2 1 и распределение вероятностей,,.
3 6 № 4.2. Пусть x M0 = ; - стратегия противника, имеющего [-1;1 y ] интересы, противоположные интересам оперирующей стороны, y N = -1,1 ; Z - случайная величина, значения которой z Z0 = -1,1.
[ ] [ ] Найти оценки эффективности стратегий x1 и x2, где x1( y, z) = yz 1, z 0, y 0 или z 0, y x2( y, z) = -1, в других случаях если а) противник не знает реализации z ;
б) противник знает реализацию z.
Решить задачу, считая 1) Z - случайная величина с плотностью распределения вероятностей f (z) = 1 - z 1[-11] (z), z R ;
( ), 2) Z0 -0,5 0,1 p1 ;
3 p1 p P 3) Z0 z1 zz1, z2 -1,[ ] 0,5 0, P q, z 2q 4) f (z) = 0, 1 < z 1, q 1.
2q № 4.3.
W x1, x2, y1, y2, z1, z2 = 4 y1x1z1 y1 + x12 x2 + ( ) ( ) +4 y2x2 z2 y2 + z12 x2, x1, x2 M0 = ] [-1,1 ;
] () ( ) [-1,y1, y2 - стратегии первого и второго противников, интересы которых неизвестны, -1 yi 1, i = 1,2 ; z1, z2 - две независимые случайные величины, равномерно распределенные на отрезке -1,1. Найти оценку [ ] эффективности стратегии оперирующей стороны x:x z1, z2 = z1, z2, ( ) ( ) если:
а) противники не знают реализаций z1 и z2 ;
в) второй противник знает реализацию z2, но не z1, а первый не знает реализаций z1 и z2 ;
с) второй противник знает реализацию z1, но не z2, а первый не знает реализаций z1 и z2 ;
d) второй противник знает реализации z1 и z2, а первый эти реализации не знает;
е) второй противник знает реализации и, а первый знает z1 zреализацию z2, но не z1;
f) второй противник знает реализации z1 и z2, а первый знает реализацию, но не ;
z1 zg) оба противника знают реализации z1 и z2.
№ 4.4.
1 2 3 4 2 x M0 = 1,2,{ } W x, y = -1 2 3 2 1,, ( )() {} 5 -2 -2 3 4 -3 y N = 1,2,3, 4,5, y - стратегия противника, знающего стратегию оперирующей стороны.
Найти оценки эффективности стратегий x1 = 1,2,2,3,3,3, ( ) x2 = 2,1,2,1,3, 2, если ( ) а) интересы противника заданы матрицей 2 3 3 4 2 W1 x, y = 4 1 2 3 2 3,5, ( ) () 5 3 -5 2 -1 - в) интересы противника заданы матрицей с элементами Wп (x, y), относительно которых известно лишь, что W1(x, y) Wп (x, y) W2 (x, y) при всех x M, y N, где W1(x, y) - элементы матрицы из п.а), а W2 (x, y) - элементы матрицы 3 4 4 5 3 W2 x, y = 5 2 3 4 3 4,5, ( ) () 6 4 -4 3 0 с) интересы противника заданы либо матрицей W1(x, y) из п. а), либо матрицей 0 1 0 1 0 W3 x, y = 1 0 0 0 1 0, ( ) () 1 0 1 1 1 d) интересы противника с вероятностью описываются матрицей и с вероятностью - матрицей W1(x, y) W3 (x, y).
з 5. Смешанные стратегии Рассмотрим операцию, в которой есть КФ x M0, НФ y N, КЭО W = W (x, y).
Напомним, что в случае отсутствия дополнительной информации о значении НФ возможными могут быть только стратегии-константы x M x x M. Ясно, что x x является простейшей стратегией.
( ) Поэтому недопустимо получать результат худший, чем может дать M0, худший, чем WГ M0. Другими словами результат проведения операции в ( ) условиях наименьшей возможной информированности должен быть наименьшим. Действительно, для любого M M WГ M0 = supW x WГ (M ) = supW(x).
( ) ( ) xM xMЭто иесть математическое выражение принципа роста результата с ростом информированности ОС.
Это иесть математическое выражение принципа роста результата с ростом информированности ОС.
Вышесказанное означает, что первой и необходимой задачей при исследовании конкретной операции является задача нахождения x0 оптимальной стратегии в M и числа WГ M0 = supinf W (x, y), ( ) xM0 yN называемого часто максимином операции.
Вслед за этим возникает вопрос, нельзя ли улучшить ожидаемый результат по сравнению с WГ M0, не используя конкретную ( ) информацию о НФ. Одна из возможностей заключена в применении смешанных стратегий, приводящих к искусственному введению случайности на множестве стратегий-констант M0 или все равно, что на множестве (иначе называемому рандомизацией стратегий).
Pages: | 1 | 2 | 3 | Книги по разным темам