Игры с природой Отличительной особенностью игр с природой является то обстоятельство, что природа рассматривается как некоторая незаинтересованная инстанция, поведение которой неизвестно, но, во всяком случае, не содержит элемента враждебности и сознательного противодействия достижению целей менеджера. Как и в случае игр с противником, менеджеру должна быть известна платежная матрица, соответствующая выигрышу менеджера при различных своих стратегиях и состояниях (стратегиях) природы. Если в случае игры с противником предполагать определенные вероятности появления его стратегий не представлялось возможным, то в рассматриваемой ситуации менеджеру полезно дополнительно располагать информацией о вероятностях появления возможных состояний природы, заданной например в виде смешанных стратегий N1 N2...Nn SN = q1 q2...qn, n = 1.
q j j=Задача менеджера заключается в выборе в конкретных условиях наиболее выгодной собственной стратегии. Отбрасывать УневыгодныеФ с точки зрения природы стратегии нельзя. Исходя из этого в теории статистических решений [5] вводится понятие риска rij = - Eij, j Таблица 3.где rij - риск менеджера при использоваПример матрицы рисков нии стратегии Mi в ответ на состояние природы Nj, а j - максимально возмож 1 ный выигрыш менеджера при состоянии 1 11 природы Nj. Пример матрицы рисков 2 21 представлен в табл. 3.16.
Если менеджеру известны вероятности возможных состояний природы qj, то было бы логичным в качестве своей стратегии принять стратегию Mi, максимизирующую свой средний выигрыш n.
E = max q (3.19) Eij j 1im j= Отметим, что указанная стратегия менеджера одновременно минимизирует его средний риск.
При выборе оптимальной стратегии одну из существенных трудностей представляет определение конкретного набора вероятностей qj.
Если нет никаких гипотез о вероятности появления определенного состояния природы, то используется принцип недостаточного основания Лапласа, когда вероятности назначаются равными друг другу q1 = q2 =... = qn =.
n Если у менеджера существуют некоторые предположения о вероятностях появления определенных событий, то он может их расставить в порядке убывания их правдоподобности (ранжировать) и поставить им в соответствие некоторый ряд чисел, определенный в том числе и экспертным путем. Отметим, что в любом случае справедливо утверждение n = 1.
q j j= Наиболее сложным случаем для выработки управленческого решения является ситуация, когда у менеджера полностью отсутствует любая (в том числе и экспертная) информация о вероятностях возможных состояний природы. В этом случае решение приходится принимать исходя из анализа платежной матрицы или матрицы рисков. Согласно максиминному критерию Вальда выбирается стратегия, гарантирующая выигрыш не меньший чем E = max 1minn{E }.
ij 1im j Данный критерий ориентирует менеджера на наихудшие условия и рекомендует выбирать стратегию, для которой в самом тяжелом случае выигрыш максимален. Обычно критерий Вальда называют критерием крайнего пессимизма.
Критерий минимаксного риска Сэвиджа рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации.
Сущность критерия Сэвиджа - любыми путями минимизировать риск.
Критерий Сэвиджа также относится к критериям крайнего пессимизма, однако в этом случае, в отличие от критерия Вальда, худшим считается не минимальный выигрыш, а максимальная его потеря (максимальный риск).
max{r }.
r = min ij 1im jn Критерий пессимизма-оптимизма Гурвица рекомендует при выборе решения выбирать нечто среднее между крайним пессимизмом и оптимизмом E = max{ min {Eij}+ (1- ) max{Eij}}.
1im 1 jn 1 jn Здесь некий коэффициент (мера пессимизма), выбираемый экспертным путем из интервала между 0 и 1. Очевидно, что при =1 критерий Гурвица превращается в критерий Вальда.
В качестве примера еще раз обратимся к распределительной задаче, описанной в 3.4.1. Пусть количество имеющихся ресурсов описывается набором значений b ={30,52; 51,11; 31,23; 26,28; 39,40; 57,47; 53,61;
44,30; 84,54}; матрица коэффициентов aij имеет вид табл. 3.2, в которой столбцы имеют смысл вида соответствующей продукции, а строки - вида ресурса. Будем считать, что входящий в состав коэффициентов значимости параметр c1 носит случайный характер и принимает два возможных значения z1= 9,20 и z2= 18,40. Тогда коэффициенты значимости каждого вида продукции cj могут иметь два возможных набора значений: {9,20; 7,15; 6,01; 7,61} и {18,40; 7,15; 6,01; 7,61}. Предположим, что имеет место игра с природой, т.е. z1, z2 определяют возможные стратегии природы N1 и N2 а не противника, как это было ранее. Будем считать, что в распоряжении менеджера также имеются две возможные стратегии M1 и M2. Построим платежную матрицу аналогично предыдущему. Значение E11 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N(z1= 9,20), а менеджера стратегия M1 (стратегия природы угадана). Это решение ранее уже было получено и представляет собой набор переменных X = {1,13; 0,00; 0,00; 3,10}, обеспечивающий максимальное значение целевой функции округленно равное 33,97 при общем суммарном расходе ресурсов равном 185,59. Значение E22 определяется как целевая функция при решении задачи в предположении, что у природы имеет место стратегия N2 (z2= 18,40), а менеджер выбрал стратегию M2 (стратегия природы также угадана). Результат решения средствами пакета Excel дает набор переменных X = {2,68; 0,00; 0,00; 0,00} при значении целевой функции округленно равном 49,29. Значение E12 рассчитывается в предположении, что менеджером выбрана стратегия M1 в виде принимаемого решения X ={1,13; 0,00; 0,00; 3,10}, а природа использует стратегию N2. Тогда вектор значимости имеет значения {18,40; 7,15;
6,01; 7,61} и целевая функция имеет величину 44,37. Наконец, значение E21 рассчитывается в предположении, что менеджером выбрана стратегия M2 в виде принимаемого решения X ={2,68; 0,00; 0,00; 0,00}, а природа использует стратегию N1. Век- Таблица 3.тор значимости имеет значения {9,20; Матрица рисков 7,15; 6,01; 7,61} и целевая функция имеет 1 величину 24,65. Результаты вычислений 1 0 4,полностью аналогичны случаю игры с противником и совпадают с данными 2 9,32 табл. 3.15. Построим матрицу рисков (табл. 3.17).
Проанализируем платежную матрицу. Будем считать, что вероятности появления стратегий природы известны и равны соответственно q1= 0,4 и q2= 0,6. Используем выражение для максимального среднего выигрыша (3.19). Выигрыш менеджера по первой строке платежной матрицы табл. 3.12 составляет 40,21, а по второй - 39,43. Очевидно, что стратегией, максимизирующей средний выигрыш является стратегия M1. Риск менеджера по первой строке матрицы рисков (табл. 3.14) составляет 2,95, а по второй - 3,73. Стратегией, минимизирующей риск также является стратегия M1.Таким образом решением задачи является набор переменных X = {1,13; 0,00; 0,00; 3,10}.
Будем теперь считать, что менеджеру неизвестны вероятности появления стратегий природы. Воспользуемся критерием Вальда. Минимальный выигрыш по первой строке платежной матрицы табл. 3.12 составляет 33,97, а по второй - 24,65. Очевидно, что как и в предыдущем случае, оптимальной стратегией менеджера является стратегия M1 с соответствующим решением.
Расчеты по критерию Сэвиджа дают максимальное значение риска в первой строке равное 4,92, а во второй - 9,32. Следовательно, и в этом случае оптимальной стратегией менеджера является стратегия M1.
Решим задачу с использованием критерия Гурвица. Минимальное значение первой строки платежной матрицы составляет 33,97, максимальное 44,37. Соответствующие значения для второй строки 24,65 и 49,29. Пусть = 0,5. Тогда расчеты по критерию Гурвица для первой строки дают 39,17, а для второй - 36,97. Следовательно, оптимальной является стратегия M1 с соответствующим решением. Изменим меру пессимизма менеджера и сделаем ее равной 0,3 ( = 0,3). Расчеты по строкам платежной матрицы дают соответственно 41,25 и 41,898. В этом случае оптимальной является стратегия M2 с решением X = {2,68; 0,00;
0,00; 0,00}.
Игры с природой с экспериментами Рассмотренные выше игры с природой предусматривали необходимость принятия решения менеджером в условиях неопределенности на основе имеющихся у него данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов.
Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами.
Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а менеджер может только делать вывод о целесообразности его проведения на основании имеющейся у него априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки N конечен и известен заранее.
Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания менеджер может принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую-либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте) или быть неограниченным (неограниченный последовательный эксперимент).
Будем считать, что в распоряжении менеджера имеется набор m стратегий Mi, которые он может использовать в ответ на одну из n возможных стратегий природы Nj, появляющуюся с вероятностью qj при условии n = 1.
q j j=Известна также платежная матрица Eij. Для снижения неопределенности относительно действительного состояния природы менеджер может провести эксперимент, стоимость которого известна и равна C. Пусть в результате проведения эксперимента состояние природы станет известно точно. Необходимо сделать вывод о целесообразности проведения эксперимента.
Средний выигрыш менеджера Ei при использовании стратегии Mi может быть определен как n Ei = q.
Eij j j=В качестве оптимальной стратегии может быть выбрана стратегия M, максимизирующая средний выигрыш менеджера n.
E = E(M ) = max q Eij j 1im j= Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы Nj. Очевидно, что в этом случае менеджер должен выбирать стратегию, обеспечивающую максимальный выигрыш = max Eij.
{ } j i=1,2,...,m Оценим теперь средний возможный выигрыш после проведения эксперимента n ср = - C, q j j j=где C - стоимость проведения эксперимента. Отсюда появляется услоE <ср вие целесообразности проведения эксперимента или nn max{ q } < qi - C.
Eij j i 1im j=1 j=Преобразовывая неравенство, имеем nn n C < qi - max{ q } = min{ ( - Eij )}.
i Eij j q j j (3.20) 1im 1im j=1 j=1 j=Выражение в круглых скобках в (3.20) есть ничто иное как риск rij = - Eij.
j Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной выбрать стратегию, максимизирующую средний выигрыш или минимизирующую средний риск. Пример, решенный в подразд. 3.7, показывает, что стоимость эксперимента по определению состояния природы в рассмотренной там задаче не должна превышать 2,95.
Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из k несовместимых событий S1, S2,Е, Sk, связанных определенными вероятностями с состояниями (стратегиями) природы. Обозначим условную вероятность появления исхода Si эксперимента при условии стратегии природы Ni символом wij. Поскольку S1, S2,Е, Sk образуют полную систему событий, справедливо k = 1;1 j n.
wij i=Будем считать, что все значения wij менеджеру известны, а также известна стоимость проведения эксперимента C. Нас по-прежнему будет интересовать вопрос: целесообразно ли проведение эксперимента и если да, то какую стратегию необходимо выбрать менеджеру при том или ином исходе эксперимента. Предположим, что в результате эксперимента был получен результат Sl. Определим апостериорные вероятности стратегий природы по теореме Байеса [14] q wij j (3.21) v = P(N Sl ) =.
jl j n wlj q j j=Далее для каждой стратегии менеджера рассчитаем величину условного среднего выигрыша при условии результата эксперимента Sl т ср Eil = v.
Eij jl (3.22) j=Очевидно, что оптимальной будет стратегия менеджера Mi, обеспечивающая максимум условного среднего выигрыша при конкретном исходе эксперимента Sl ср El = max{Eil }.
1im Вероятность появления условного выигрыша El совпадает с вероятностью появления события Sl. Обозначим ее символом hl. Тогда n (3.23) hl = wlj.
q j j=Величина выигрыша с использованием эксперимента k Eэксп = hl.
El (3.24) l=С другой стороны, выигрыш менеджера без проведения эксперимента определяется выражением n.
E = max q Eij j 1im j= Отсюда вытекает условие целесообразности проведения эксперимента C < Eэксп - Е.
Если проведение эксперимента признано целесообразным, то менеджер должен разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию Mi необходимо выбрать, если эксперимент дал результат Sl.
Вернемся к рассмотренному выше примеру. Пусть точно определить состояние природы не удается, но существует три возможных результата проведения эксперимента S1, S2, S3 (k=3). Зададим в табл. 3.матрицу условных вероятностей появления Si варианта эксперимента W={wij} при Nj состоянии природы.
Pages: | 1 | ... | 10 | 11 | 12 | 13 | 14 | Книги по разным темам