2 ББК 22.18 Чх 97 Чхартишвили А.Г. Теоретико-игровые модели Чх 97 информационного управления. М.: ЗАО ПМСОФТ, 2004. - 227 с. ISBN 5-9900281-6-4 Работа содержит результаты исследований теоретических и прикладных теоретико-игровых моделей

Книги по разным темам Pages: | 1 | 2 | 3 | 4 | ... | 26 |

А с точки зрения центра это означает, что при решении задачи информационного управления без потери эффективности можно ограничиться классом структур информированности, глубина которых ограничена данным уровнем.

Поэтому одним из результатов исследования задач информационного управления является определение максимального ранга рефлексии агентов (называемого максимальным целесообразным рангом), влиянием на который достаточно ограничиться центру при формировании структуры их информированности.

Перечисленные выше аспекты - модели принятия решений, рефлексия, информационное управление, его стабильность, сложность (характеризуемая глубиной структуры информированности) и т.д. - рассматриваются с теоретической точки зрения в первых пяти главах настоящей работы. В шестой главе описан, на основе общих результатов, ряд прикладных моделей информационного управления.

Содержание работы. В первой главе рассматривается общий подход к моделированию принятия решения. Приведены наиболее общераспространенные концепции, как в случае индивидуального, так и в случае интерактивного принятия решений. Описана классификация управлений социально-экономическими системами, одним из которых является информационное управление. Сформулирована общая постановка задачи информационного управления.

Во второй главе для описания информированности принимающего решение агента вводится понятие структуры информированности, включающей в себя иерархию представлений о неопределенном параметре, а также о представлениях оппонентов, представлений о представлениях и т. д. Игра, в которой игроки принимают решение на основе своих структур информированности, называется рефлексивной игрой. Исследуется ряд свойств структуры информированности. Формулируется концепция информационного равновесия как решения рефлексивной игры.

Определяется удобное вспомогательное понятие графа рефлексивной игры - конструкции, позволяющей в наглядной форме изображать взаимную информированность агентов. Вводятся взаимосвязанные понятия регулярной структуры информированности и регулярного конечного дерева (РКД). Показывается на ряде примеров, что язык графов рефлексивной игры может служить средством описания эффектов информационной рефлексии в художественных произведениях.

В третьей главе исследуются специфические типы информационных равновесий. Рассматривается свойство стабильности равновесия, состоящее в том, что каждый агент наблюдает именно тот результат игры, который ожидает в момент выбора действия (тем самым, информационная структура игры не меняется). Стабильные информационные равновесия подразделяются на истинные и ложные. Формулируется достаточное условие, при выполнении которого все стабильные равновесия являются истинными.

Отдельно рассматривается случай, когда агенты в результате игры наблюдают действия друг друга. Доказывается ряд утверждений, проясняющих взаимосвязь стабильности равновесия и свойств структуры информированности игры. Проводится аналогия между рефлексивными играми и байесовыми играми - альтернативным способом моделирования принятия решения в ситуации с неполной информированностью.

В четвертой главе обсуждается проблематика моделирования информационного воздействия. Выделены некоторые способы осуществления центром информационного воздействия на агентов с целью формирования той или иной структуры информированности: информационное регулирование, рефлексивное управления, активный прогноз.

В пятой главе дается постановка и классификация задач информационного управления. Задача информационного управления понимается как поиск структуры информированности игры, при которой действия агентов оказываются выгодными для центра. Для формулировки условий, при которых область поиска решения задачи информационного управления можно сузить, вводится вспомогательное понятие рефлексивных отображений, позволяющих описать множество информационных равновесий при всевозможных структурах информированности. Для случая двух агентов и линейных рефлексивных отображений доказано достаточное условие стационарности отображений. Обобщено хорошо известное свойство неманипулируемости механизмов планирования.

Именно, вводится понятие рефлексивной неманипулируемости - свойства механизма планирования, при котором существуют такие структуры информированности участников игры, что сообщение достоверной информации является компонентой информационного равновесия.

В шестой главе рассматривается набор независимых друг от друга прикладных моделей информационного управления. Большинство из них отражают воздействия на информированность экономических агентов (производителей и покупателей продукции, заказчиков и исполнителей работ и т.д.), некоторые же - на информированность участников предвыборной борьбы, избирателей и т.д.

ГЛАВА 1. ТЕОРИЯ ИГР И ПРОБЛЕМЫ ИНФОРМАЦИОННОГО УПРАВЛЕНИЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМИ СИСТЕМАМИ 1.1. ТЕОРЕТИКО-ИГРОВЫЕ МОДЕЛИ В ЭКОНОМИКЕ И УПРАВЛЕНИИ Теория игр относится к числу тех немногих наук, момент лоформления которых в отдельную дисциплину известен достаточно точно. В 1944 г. вышла монография Дж. фон Неймана и О. Моргенштерна Теория игр и экономическое поведение (см.

русский перевод [65]), в которой были изложены известные на то время результаты. Монография положила начало бурному развитию этой науки, не прекращающемуся и по сей день1.

Хотя и не сразу, но теоретико-игровое моделирование заняло прочное место в арсенале методов экономического анализа. Завершение этого процесса можно отнести, по-видимому, к 1990-м годам. В 1994 г. Нобелевскую премию по экономике получили Дж. Нэш, Дж. Харшаньи и Р. Зельтен, внесшие большой вклад в развитие теории игр. В 1995 г. вышел учебник по микроэкономике [176], который до сих пор признается одним из наиболее авторитетных и в котором теории игр уделяется большое внимание. С тех пор это является необходимым требованием к любому изложению основ экономической теории (см., например, [91, 97]).

Интеграция теории игр в теорию управления социальноэкономическими системами состоялась в конце 1960-х годов.

Именно тогда на фоне бурного развития математической теории управления и интенсивного внедрения ее результатов при создании новых и модернизации существующих технических систем практически одновременно во многих научных центрах как в СССР, так и за рубежом начали предприниматься попытки применения общих подходов теории управления для разработки математических моделей социальных и экономических систем.

Одним из направлений исследований, учитывающих при анализе и синтезе моделей и механизмов управления целенаправленность поведения участников организационной (активной) системы, Обзор теории игр, ее основных разделов - см., например, [33, 34, 167, 180].

стала теория активных систем (ТАС) [8, 9, 15, 19], основным центром зарождения и развития которой является Институт проблем управления РАН (бывший Институт автоматики и телемеханики).

Основным методом теоретического исследования в теории активных систем является как раз теоретико-игровое моделирование.

По основным своим подходам и используемым методам исследований ТАС чрезвычайно тесно связана с такими разделами теории управления социально-экономическими системами, как:

теория иерархических игр [27, 29, 30, 48]; теория контрактов, развиваемая в основном зарубежными учеными и исследующая задачи стимулирования в условиях вероятностной неопределенности [10, 75, 171, 176]; теория реализуемости, также развиваемая в основном зарубежными учеными и исследующая задачи реализуемости соответствий группового выбора механизмами планирования, а также их свойства - неманипулируемость и др. [11, 71, 176].

Отметим также, что элементы теории игр в настоящее время являются необходимым компонентом не только экономического, но и управленческого образования (см., например, [147, 148, 149, 152, 153, 154]).

С теоретико-игровой точки зрения задача управления состоит в том, чтобы создать для управляемых субъектов (агентов) игру с такими правилами, чтобы исход игры был как можно более благоприятным для управляющего органа (центра). Центр является как бы метаигроком, он делает первый ход, формируя правила игры для агентов. После этого агенты выбирают свою стратегию поведения тем или иным образом, с учетом выбора центра.

Исходя из этого, необходимым предварительным этапом решения задачи управления социально-экономической (или, иначе говоря, активной) системой является теоретико-игровой анализ, позволяющий центру спрогнозировать реакцию управляемой системы на те или иные управляющие воздействия. И только после осуществления такого анализа центр может обоснованно осуществлять то или иное воздействие. Предметом настоящей работы является вполне определенное управляющее воздействие - информационное, т. е. целенаправленное влияние на информированность агентов.

Дальнейшее изложение в первой главе построено следующим образом. В разделе 1.2 обсуждается модель индивидуального принятия решения рациональным агентом. В разделе 1.3 обсуждается интерактивное принятие решений, т. е., собственно, принятие решений в ситуации игрового взаимодействия агентов. В разделе 1.4 содержится переход к формулировке задачи управления, а именно дается классификация управлений, одним из которых является информационное управление. Наконец, раздел 1.5 содержит общую постановку задачи информационного управления.

1.2. ИНДИВИДУАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ:

МОДЕЛЬ РАЦИОНАЛЬНОГО ПОВЕДЕНИЯ Опишем, следуя [33, 71, 78, 81], модель принятия решений единственным агентом. Пусть агент способен выбирать некоторое действие x из множества X допустимых действий. В результате выбора действия x X агент получает выигрыш f(x), где f: X - действительнозначная целевая функция, отражающая предпочтения агента.

Примем гипотезу рационального поведения, заключающуюся в том, что агент с учетом всей имеющейся у него информации выбирает действия, которые наиболее предпочтительны с точки зрения значений своей целевой функции (данная гипотеза не является единственно возможной - см., например, концепцию ограниченной рациональности [106]). В соответствии с гипотезой рационального поведения агент выбирает альтернативу из множества лучших альтернатив. В рассматриваемом случае это множество является множеством альтернатив, на которых достигается максимум целевой функции.

Следовательно, выбор действия агентом определяется правилом индивидуального рационального выбора P(f, X) X, которое выделяет множество наиболее предпочтительных с точки зрения агента действий2:

P(f, X) = Arg max f(x).

xX При использовании максимумов и минимумов подразумевается, что они достигаются.

Усложним модель, а именно предположим, что выигрыш агента определяется не только его собственными действиями, но и значением неопределенного параметра - состояния природы. Таким образом, в результате выбора действия x X и реализации состояния природы агент получает выигрыш f(, x), где f: X 1.

Если выигрыш агента зависит, помимо его действий, от неопределенного параметра - состояния природы, то в общем случае не существует однозначно лучшего действия - принимая решение о выбираемом действии, агент должен предсказывать состояние природы.

Поэтому введем гипотезу детерминизма, заключающуюся в том, что агент стремится устранить с учетом всей имеющейся у него информации существующую неопределенность и принимать решения в условиях полной информированности [33, 43] (другими словами, окончательный критерий, которым руководствуется агент, принимающий решения, не должен содержать неопределенных параметров). В соответствии с гипотезой детерминизма агент должен устранить неопределенность относительно не зависящих от него параметров (быть может, путем введения определенных предположений об их значениях).

В зависимости от той информации I, которой обладает агент о неопределенных параметрах, различают [33, 75]:

- интервальную неопределенность (когда известно только множество возможных значений неопределенных параметров);

- вероятностную неопределенность (когда, помимо множества возможных значений неопределенных параметров, известно их вероятностное распределение p());

- нечеткую неопределенность (когда, помимо множества возможных значений неопределенных параметров, известна функция принадлежности их значений).

Относительно используемых агентом процедур устранения неопределенности обычно принимаются следующие предположения: интервальная неопределенность устраняется вычислением максимального гарантированного результата (МГР), вероятност ная - ожидаемого значения целевой функции, нечеткая - множества максимально недоминируемых альтернатив1.

Обозначим f f - процедуру устранения неопределенноI сти, то есть процесс перехода от целевой функции f(, x) к целевой функции f (x), которая не зависит от неопределенных параметров.

В соответствии с введенным предположением в случае интервальной неопределенности f (x) = min f(, x), в случае вероятностной неопределенности f (x) = f (x, ) p( )d и т.д. [71, 75].

Устранив неопределенность, получаем детерминированную модель, то есть правило индивидуального рационального выбора имеет вид:

P(f, X, I) = Arg max f (x), xX где I - информация, используемая агентом при устранении неопределенности f f.

I В настоящей работе в основном рассматривается простейший - точечный - случай, когда агенты имеют представления о конкретном значении состоянии природы.

До сих пор мы рассматривали индивидуальное принятие решений. Рассмотрим теперь игровую неопределенность, в рамках которой существенными являются предположения агента о множестве возможных значений обстановки игры (действий других агентов, выбираемых ими в рамках тех или иных неточно известных рассматриваемому агенту принципов поведения).

Введенные предположения не являются единственно возможными. Использование других предположений (например, гипотезу об использовании МГР можно заменить гипотезой оптимизма или гипотезой взвешенного оптимизмапессимизма и т.д.) приведет к другим концепциям решения, однако процесс их получения будет следовать реализуемой ниже общей схеме.

1.3. ИНТЕРАКТИВНОЕ ПРИНЯТИЕ РЕШЕНИЙ:

Pages: | 1 | 2 | 3 | 4 | ... | 26 |

Книги по разным темам

Blog