На правах рукописи
Объедко Татьяна Юрьевна
УПРАВЛЕНИЕ С ПРОГНОЗИРОВАНИЕМ ДИСКРЕТНЫМИ СИСТЕМАМИ СО СЛУЧАЙНЫМИ ПАРАМЕТРАМИ И МУЛЬТИПЛИКАТИВНЫМИ ШУМАМИ ПРИ ОГРАНИЧЕНИЯХ
05.13.01 - Системный анализ, управление и обработка информации (в отраслях информатики, вычислительной техники и автоматизации)
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Томск 2012
Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Национальный исследовательский Томский государственный университет на кафедре прикладной математики
Научный консультант: доктор технических наук, профессор Домбровский Владимир Валентинович
Официальные оппоненты:
Воробейчиков Сергей Эрикович, доктор физико-математических наук, доцент, федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Национальный исследовательский Томский государственный университет, кафедра высшей математики и математического моделирования, профессор Якупов Рафаэль Тимирович, доктор физико-математических наук, профессор, филиал федерального государственного бюджетного образовательного учреждения высшего профессионального образования Кемеровский государственный университет в г. Анжеро-Судженске, кафедра математики, заведующий кафедрой
Ведущая организация: Федеральное государственное автономное образовательное учреждение высшего профессионального образования Сибирский федеральный университет (г. Красноярск)
Защита состоится 26 декабря 2012 г. в 10.30 на заседании диссертационного совета Д 212.267.12, созданного на базе федерального государственного бюджетного образовательного учреждения высшего профессионального образования Национальный исследовательский Томский государственный университет по адресу: 634050, г. Томск, пр. Ленина, 36 (II уч. корпус, ауд. 212б).
С диссертацией можно ознакомиться в Научной библиотеке Томского государственного университета.
Автореферат разослан 09 ноября 2012 г.
Ученый секретарь Тарасенко диссертационного совета Петр Феликсович
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Моделями со случайными параметрами описываются многие реальные системы, такие как сложные производственнотехнологические, энергетические и технические системы (атомные энергетические установки; летательные аппараты; системы наведения на объект, уклоняющийся от встречи; процессы теплопереноса); экономические системы, логистические системы. Важной областью приложений стохастической теории управления является финансовая инженерия, в частности, задача управления инвестиционным портфелем (ИП). Финансовый рынок представляет собой сложную стохастическую систему, и задача управления портфелем включает в себя все основные проблемы, связанные с управлением динамическими стохастическими системами.
В связи с этим в настоящее время активно развивается направление, рассматривающее проблемы управления системами со случайными параметрами (структурой). Как правило, выделяют два класса таких систем:
1. Системы, динамика которых описывается разностными (в дискретном времени) или дифференциальными (в непрерывном времени) уравнениями, в то время как структура системы (параметры) изменяется в соответствии с эволюцией переменных, принимающих дискретный набор значений из некоторого множества (так называемые, гибридные системы, или системы непрерывнодискретной природы). Обычно в моделях таких систем предполагается, что смена структуры осуществляется в соответствии с эволюцией наблюдаемой или скрытой марковской цепи с конечным пространством состояний.
2. Системы, параметры которых меняются непрерывно и представляют собой некоторый случайный процесс или последовательность.
Задачами управления для систем первого класса занимались многие исследователи, среди которых следует отметить работы А.В. Борисова, П.В. Пакшина, В.И. Смагина, E.K. Boukas, O.L.V. Costa, V. Dragan, R.J. Elliott, W.E. Hopkins, T. Morozan, B. Oksendal, W.L. Paulo, D.D. Sworder и др.
Системам второго класса посвящены работы следующих авторов: Н.Н.
Красовского, П.В. Пакшина, Ю.И. Параева, В.В. Домбровского, M. Ait Rami, A.
Beghi, M. Cannon, X. Chen, D. DТAlessandro, J. Fisher, B. Kouvaritakis, A. Lim, P.J. McLane, J.A. Primbs и др.
В большинстве работ, как правило, рассматриваются задачи управления, без учета ограничений на переменные состояния и управления. Основной метод синтеза стратегий управления - это применение метода динамического программирования Беллмана, принципа максимума Понтрягина, либо сведение задачи к решению системы линейных матричных неравенств.
Решение задачи управления с учетом ограничений, используя традиционные подходы, приводит к значительным аналитическим и вычислительным трудностям (так называемому проклятию размерности) и к практически нереализуемым стратегиям управления. Однако во многих реальных задачах необходимо учитывать ограничения на переменные состояния и управления.
Эффективным подходом к синтезу систем управления с ограничениями, получившим широкое признание и применение в практике управления сложными технологическими процессами, является метод управления с прогнозирующей моделью (управление с прогнозированием). При этом, как правило, получается стратегия управления с обратной связью, но удается избежать проклятия размерности. Задачам управления с прогнозирующей моделью посвящены работы многих исследователей, таких как В.И. Смагина, В.В. Домбровского, T. Alamo, A. Bemporad, F. Borrelli, E.F. Camacho, M. Cannon, B.L. Cooly, J.A. De Dona, G.C. Goodwin, B. Kouvaritatakis, J.H. Lee, D. Limon, D.Q. Mayne, M. Morari, D.M. Pena, J.A. Primbs, C.V. Rao, J.B. Rawlings, P.O.M. Scokaert, M.M. Seron, C.H. Sung и др.
Стохастические системы с марковскими скачками (переменной структуры) рассматриваются в работах B.-G. Park, W.H. Known, L. Blackmore, A. Bektassov, M. Ono, B.C. Williams, системы со случайными непрерывными параметрами и/или мультипликативными шумами рассматриваются в работах В.В. Домбровского, M. Cannon, B. Kouvaritatakis, J.A. Primbs и др. Однако практически не решенными остаются многие вопросы. В работах, посвященных управлению с прогнозирующей моделью системами со случайными параметрами, рассматриваются, в основном, задачи управления при ограничениях на математические ожидания переменных состояния и/или управления или при вероятностных ограничениях, кроме того, предполагается, что случайные параметры представляют собой последовательности независимых случайных величин. При управлении реальными объектами часто необходимо учитывать жесткие, строго выполняемые ограничения на переменные состояния и/или управления. Проведенный анализ литературы показал, что практически отсутствуют результаты для гибридных систем непрерывно-дискретной природы, параметры которых изменяются скачкообразно, а также для систем с непрерывными коррелированными случайными параметрами в условиях жестких ограничений.
Объект исследования. Управляемые стохастические системы со случайными параметрами и мультипликативными шумами.
Предмет исследования. Алгоритмы синтеза стратегий управления с прогнозированием при ограничениях на управляющие переменные.
Целью диссертационной работы является построение прогнозирующего управления для систем со случайными параметрами и мультипликативными шумами при ограничениях и применение результатов к управлению ИП.
В рамках указанной цели были поставлены следующие основные задачи исследования:
1. Разработать метод синтеза стратегий управления с прогнозированием для систем с марковскими скачками и мультипликативными шумами при явных ограничениях на управляющие переменные.
2. Синтезировать стратегии управления с прогнозированием взаимосвязанными гибридными системами с марковскими скачками при явных ограничениях на управляющие переменные.
3. Синтезировать стратегии управления с прогнозированием для систем со случайными коррелированными параметрами и мультипликативными шумами при явных ограничениях на управляющие переменные.
4. Применить стратегии управления с прогнозированием к управлению ИП при ограничениях на объемы торговых операций с использованием реальных данных различных финансовых рынков.
Методы исследования. При выполнении диссертационной работы использовались понятия и методы теории автоматического управления (методология управления с прогнозированием), теории случайных процессов, методы оптимизации, методы матричной алгебры, методы теории вероятностей и математической статистики, численные методы и методы компьютерного моделирования.
Научная новизна полученных результатов заключается в следующем.
Разработаны методы синтеза стратегий управления с прогнозирующей моделью для дискретных систем с мультипликативными шумами и скачкообразно меняющимися параметрами, эволюция которых описывается дискретной марковской цепью, а также для систем со случайными коррелированными параметрами, возмущенных мультипликативными шумами, при ограничениях на управляющие воздействия, по квадратичному и mean-variance (лсреднеевариация) критериям. Синтез стратегий управления сводится к решению последовательности задач квадратичного программирования. На основе полученных результатов решены новые задачи управления сложной стохастической системой - инвестиционным портфелем.
Теоретическая значимость диссертационного исследования состоит в развитии теории прогнозирующего управления системами со случайными параметрами и мультипликативными шумами при ограничениях на управляющие переменные.
Практическая ценность данной работы состоит в возможности применения полученных результатов для управления сложными реальными объектами при ограничениях:
а) объектами, динамика которых зависит от случайных скачкообразных параметров, б) объектами, динамика которых зависит от параметров, представляющих собой случайные коррелированные последовательности.
В диссертационной работе результаты применены к задачам управления ИП на финансовом рынке с переключающимися режимами и на финансовом рынке с коррелированными доходностями рисковых активов с учетом ограничений на объемы торговых операций.
Результаты диссертационной работы используются в учебном процессе на факультете прикладной математики и кибернетики Томского государственного университета.
Достоверность полученных результатов подтверждается строгими аналитическими выкладками и доказательствами, а также результатами численного моделирования с использованием реальных данных.
В работе приведены результаты численного моделирования на примере управления ИП с использованием реальных данных о доходностях акций, торгующихся на Российской бирже Фондовая биржа ММВБ, Нью-Йоркской фондовой бирже NYSE (New York stock exchange), а также валютных пар, торгующихся на международном валютном рынке Forex (foreign exchange). Численные эксперименты подтверждают эффективность предложенных подходов к управлению ИП, как примеров управления сложной стохастической системой.
ичное участие автора заключается в получении результатов, изложенных в диссертации. Постановка указанных задач сделана научным руководителем, д.т.н., профессором В.В. Домбровским. Основные теоретические результаты, а также результаты численного моделирования, представленные в диссертации, получены лично автором.
Структура диссертации. Работа состоит из введения, основного текста, заключения, списка литературы и приложения. Основной текст разбит на 3 главы и содержит 34 рисунка. Список литературы включает 157 наименований.
Общий объем работы 159 страниц, основной текст - 138 страниц.
На защиту выносятся:
1. Метод синтеза стратегий управления с прогнозированием для систем с марковскими скачками и мультипликативными шумами при ограничениях на управляющие переменные а) по квадратичному критерию, б) по критерию mean-variance (лсреднее-вариация).
2. Уравнения синтеза стратегий управления с прогнозирующей моделью для гибридных систем, состоящих из подсистем, с учетом явных ограничений на управляющие переменные. При этом параметры каждой из подсистем изменяются в соответствии с эволюцией марковских цепей, состояния которых взаимосвязаны между собой.
3. Метод синтеза стратегий управления с прогнозированием для систем со случайными коррелированными параметрами, возмущенных аддитивными и мультипликативными шумами, при ограничениях на управляющие переменные а) по квадратичному критерию, б) по критерию mean-variance.
4. Результаты применения методов к решению новых актуальных задач управления ИП:
a) управление ИП в условиях скачкообразного изменения параметров доходностей рисковых финансовых активов (на рынке с переключающимися режимами) при ограничениях на объемы торговых операций (на объемы куплипродажи финансовых активов и на размеры заемных средств);
б) управление ИП в условиях коррелированности доходностей рисковых финансовых активов при ограничениях на объемы торговых операций.
5. Результаты численного моделирования и тестирования полученных алгоритмов на примере управления ИП с использованием реальных данных.
Апробация работы. Основные результаты работы докладывались и обсуждались на следующих конференциях: Всероссийская научная конференция молодых ученых Наука. Технологии. Инновации (Новосибирск, 2008 г., 2011 г.), Восьмая и девятая Российские конференции с международным участием Новые информационные технологии в исследовании сложных структур (Томск, 2010 г., 2012 г.), V Всероссийский форум студентов, аспирантов и молодых ученых, (Томск, май 2010 г.).
Публикации. По теме диссертации опубликовано 11 печатных работ, в том числе в журналах из списка ВАК - 6 статей [1-6].
СОДЕРЖАНИЕ РАБОТЫ
Во введении проведен обзор существующих подходов к синтезу стратегий управления системами со случайными параметрами, обоснована актуальность темы диссертации, сформулирована цель работы, изложена ее научная новизна, раскрыты теоретическое значение и практическая ценность полученных результатов, кратко излагается содержание диссертационной работы.
В первой главе диссертации рассматривается задача управления с прогнозирующей моделью дискретными системами с марковскими скачками и мультипликативными шумами. Получены уравнения синтеза стратегий управления с учетом ограничений на управляющие воздействия для квадратичного и meanvariance критериев со скользящим горизонтом управления. Рассмотрены случаи наблюдаемой и ненаблюдаемой цепи Маркова. Произведено обобщение для случай многокомпонентной системы, состоящей из подсистем, зависящих от взаимосвязанных цепей Маркова.
Пусть объект управления описывается уравнением n x(k +1) = Ax(k) + [(k +1),k +1] + Bj[(k +1),k +1]wj (k +1)u(k), (1) B j= где x(k) - nx-мерный вектор состояния, u(k) - nu-мерный вектор управления, wj(k) ( j =1,n) - независимые между собой дискретные белые шумы с нулевым средним и единичной дисперсией, (k) - однородная дискретная марковская цепь с конечным множеством состояний, известной матрицей переходных веn роятностей P =, (i, j =1, ), и известным Pij = P (k +1) = (k) = i, Pij =1, { } j Pij j=n начальным распределением pi = P = i, (i =1,), pi =1.
Последовательности {(0) } i=wj(k) и (k) независимы; A, Bj[(k),k], ( j = 0,n) - матрицы соответствующих размерностей. Предполагается, что состояние марковской цепи (k) в момент времени k доступно наблюдению.
На управляющие воздействия накладываются ограничения umin (k) S(k)u(k) umax (k), (2) где S(k) - матрица соответствующей размерности.
Для управления системой (1) при ограничениях (2) синтезируем закон управления по следующему правилу. На каждом шаге k минимизируем квадратичный критерий со скользящим горизонтом управления m J (k + m / k) = M{ xT (k + i)R1(k,i)x(k + i) - R2(k,i)x(k + i) + (3) i=+uT (k + i -1/ k)R(k,i -1)u(k + i -1/ k) / x(k),(k)}, по последовательности прогнозирующих управлений u(k/k),Е,u(k+m-1/k), зависящих от состояния системы в момент времени k, где R1(k,i) 0, R2(k,i) 0, R(k,i) > 0 - весовые матрицы соответствующих размерностей, m - горизонт прогноза, k - текущий момент времени. В качестве управления в момент времени k берем u(k)=u(k/k). Тем самым получаем управление u(k) как функцию состояний x(k) и (k), то есть управление с обратной связью.
Чтобы получить управление u(k+1) на следующем шаге, процедура повторяется для следующего момента k+1 и т.д.
Цепь Маркова с дискретным временем допускает следующее представление в пространстве состояний:
(k +1) = P(k) + (k +1), (4) где (k)=[((k),1),Е,((k),)]T, ((k),j) - функция Кронекера ( j =1,); (k) - мартингал разность.
С учетом (4) систему (1) можно представить в следующем виде n x(k +1) = Ax(k) + [(k +1),k +1] + Bj[(k +1),k +1]wj (k +1)u(k), B j= (i) где i(k) Bj[(k),k] = (k)B (k); (i =1,n ) - компоненты вектора (k), {Bj(i)} i j i= - множество значений матрицы Bj[(k),k].
( j = 0,n;i =1,) Критерий (3) будет иметь вид m (5) J (k + m / k) = M{ xT (k + i)R1(k,i)x(k + i) - R2(k,i)x(k + i) + i=+uT (k + i -1/ k)R(k,i -1)u(k + i -1/ k) / x(k),(k)}.
Теорема 1.1. Вектор прогнозирующих управлений U(k)=[uT(k/k),Е, uT(k+m-1/k)]T, минимизирующий критерий (5) при ограничениях вида (2), на каждом шаге k определяется из решения задачи квадратичного программирования с критерием вида 2xT Y (k + m / k) = (k)G(k) - F(k)U (k) +UT (k)H (k)U (k) (6) при ограничениях Umin (k) S(k)U (k) Umax (k), (7) где S(k) = diag(S(k),..., S(k + m -1)), T T T T Umin (k) = [umin (k),...,umin (k + m -1)]T, Umax(k) =[umax(k),...,umax(k +m-1)]T, H(k), G(k), F(k) - блочные матрицы вида H11(k) H12(k) L H1m (k) H21(k) H22(k) L H2m (k) (8) H (k) =, L L L L H (k) Hm2(k) L Hmm(k) m1 G(k) = G1(k) G2(k) L Gm(k), F(k) = F1(k) F2(k) L Fm(k), (9) [ ] [ ] блоки которых равны n T T Eqdiag{Pt(k)}Eq Htt (k) = R(k,t -1) + B(q)(k + t) Q1(m - t)B(q)(k + t), ( ) j j j=0 q=n n T ( Htf (k) = B0q)(k + t) ( ) q=1r=T E diag{P (k)} P -t T f -t f f ( (AT ) Eq Q1(m - f )B0r )(k + f ), f > t, ( ) r T Htf (k) = H (k), f < t, ft ( Gt (k) = (At )T Q1(m - t) EqPt(k)B0q)(k + t), q= ( Ft (k) = Q2(m - t) EqPt(k)B0q)(k + t), q= Q1(t) = ATQ1(t -1)A + R1(k,m - t),Q1(0) = R1(k,m), Q2(t) = Q2(t -1)A + R2(k,m - t),Q2(0) = R2(k,m);t, f =1,m, Eq = 0,...,0,1,0,...,0,q =1, .
[ ] Оптимальное управление равно Inu 0nu u(k) = L 0nu U (k), где Inu - единичная матрица размерности nu, 0nu - квадратная нулевая матрица размерности nu.
Во многих практических задачах в текущий момент отсутствует информация о состоянии цепи Маркова. Будем полагать, что состояние цепи не доступно наблюдению. Для управления системой (1) на каждом шаге k минимизируем критерий со скользящим горизонтом управления m J (k + m / k) = M{xT(k + i)R1(k,i)x(k + i) - R2(k,i)x(k + i) + (10) i=+uT(k + i -1/ k)R(k,i -1)u(k + i -1/ k) / x(k)}, по последовательности прогнозирующих управлений u(k/k),Е,u(k+m-1/k) при ограничениях (2).
В работе сформулирована и доказана теорема об оптимальных стратегиях.
Синтез стратегий управления сводится к решению последовательности задач квадратичного программирования.
Современные системы управления зачастую состоят из взаимодействующих подсистем неоднородной непрерывно-дискретной природы. В связи с этим актуальной становится следующая задача.
Пусть система представляет собой совокупность подсистем, состояния которых описываются уравнениями x(q)(k +1) = A(q)x(q)(k) + B(q)[(q)(k +1),k +1]u(q)(k),(q =1,s), (11) ( ( где x(q)(k) - nxq) -мерный вектор состояния q-й подсистемой, u(q)(k) - nuq) мерный вектор управления q-й подсистемой; A(q), B(q)[(q)(k),k] - матрицы соответствующих размерностей; (q)(k) - скалярная однородная цепь Маркова с конечным множеством состояний {1,2,Е,q}. Таким образом, каждая из подсистем может находиться в q состояниях, определяемых скалярным случайным процессом с дискретным множеством значений (состояний).
Между подсистемами существует взаимосвязь: состояние цепи (q)(k) q-й подсистемы (q=1,2,Е,s) в k-й момент времени зависит от состояний цепей (r)(k-1), (r=1,2,Е,s) в момент времени k-1. Таким образом, динамика системы в целом зависит от дискретного векторного случайного процесса (k)=[(1)(k),(2)(k),Е,(s)(k)]T с конечным множеством состояний {q,jq} (q=1,2,Е,s; jq=1,2,Е,q) и дискретным временем. Случайный процесс (k) представляет собой векторную односвязную цепь Маркова.
Для векторной цепи вероятности перехода за один шаг имеют вид:
Pi1,...,is; j1,..., js = P 1(k +1) = 1 j1,...,s(k +1) = sjs 1(k) = 1i1,...,s(k) = sis, { } Pi1,...,is; j1,..., js =1, j1,..., js с начальным распределением pj1,..., js = P {1(0) = j1,...,s(0) = js,( j1 =1, 1;...; js =1, s), pj1,..., js =1.
} j1,..., js Предполагается, что состояние векторной марковской цепи в момент времени k доступно наблюдению.
На управляющие воздействия каждой из подсистем накладываются ограничения (q) (q) umin (k) S(q)(k)u(q)(k) umax (k),q = 1,2,..., s, (12) где S(q)(k) - матрицы соответствующих размерностей.
Необходимо определить закон управления системой, состоящей из подсистем вида (11), при ограничениях (12) из условия минимума критерия со скользящим горизонтом управления s m ( J(k + m / k) = M{ (x(q)(k + i))T R1q)(k,i)x(q)(k + i) - q=1i=( -R2q)(k,i)x(q)(k + i)+(u(q)(k + i -1/ k))T R(q)(k,i -1)u(q)(k + i -1/ k) x(q)(k),(k), } где u(q)(k + l / k),l = 0,m -1 - последовательность прогнозирующих управлений ( ( q-й подсистемой, u(q)(k)=u(q)(k/k), R1q)(k,i) 0, R2q)(k,i) 0, R(q)(k,i) > 0 - весовые матрицы соответствующих размерностей.
В работе сформулирована и доказана теорема об оптимальных стратегиях.
Показано, что задача оптимизации на каждом шаге сводится к задаче квадратичного программирования.
В первой главе также рассматривается задача управления с прогнозирующей моделью по критерию mean-variance (лсреднее-вариация) для дискретных систем с мультипликативными шумами и скачкообразно меняющимися параметрами при ограничениях на управляющие воздействия.
Критерий mean-variance широко используется в финансовых приложениях, в частности, в задачах управления инвестиционным портфелем.
Пусть объект управления описывается уравнением (1) при ограничениях (2). Пусть скалярный выход системы (1) y(k) = L(k)x(k), (13) где L(k) - вектор-строка соответствующей размерности.
Задача управления формулируется в двух постановках.
Задача 1.1. Необходимо определить стратегию управления системой (1) при ограничениях на управляющие воздействия (2) по критерию meanvariance со скользящим горизонтом m J (k + m / k) = ( { } ) 1(k,i)M y(k + i) - M y(k + i) / x(k),(k) / x(k),(k) - { } i=-2(k,i)M y(k + i) / x(k),(k) + M uT (k + i -1 / k)R(k,i -1)u(k + i -1/ k) / x(k),(k), { } { } где весовые коэффициенты 1(k,i) 0,2(k,i) 0 - это коэффициенты, характеризующие склонность к риску и задающие соотношение между ожидаемым значением и вариацией выхода системы, R(k,i)>0 - весовая матрица.
Задача 1.2. Необходимо определить стратегию управления системой (1) по критерию mean-variance со скользящим горизонтом m J (k + m / k) = ( { } ) 1(k,i)M y(k + i) - M y(k + i) / x(k),(k) / x(k),(k) { } i=+M uT (k + i -1/ k)R(k,i -1)u(k + i -1 / k) / x(k),(k) { } при ограничениях на управления (2) и ограничениях M y(k + i) / x(k),(k) (k + i),(i =1,m), { } где (k + i) 0 - ожидаемое значение выхода системы.
В работе сформулированы и доказаны теоремы об оптимальных стратегиях для задач 1.1, 1.2 для случаев наблюдаемой и ненаблюдаемой цепей Маркова. Управляющие воздействия на каждом шаге получаются из решения задачи квадратичного программирования.
Во второй главе диссертации рассматривается задача управления с прогнозирующей моделью дискретными системами со случайными коррелированными параметрами и аддитивными и мультипликативными шумами.
Пусть объект управления описывается уравнением n x(k +1) = A0(k +1) + Ai(k +1)vi(k +1) x(k) + (14) i=1 n u(k) + B0[(k +1),k +1] + [(k +1),k +1]vi (k +1) + D[(k +1),k +1]w(k +1), B i i=1 где x(k) - nx-мерный вектор состояния, u(k) - nu-мерный вектор управления, (k) - последовательность q-мерных случайных векторов; Ai(k), Bi[(k),k], i = 0,n, D[(k),k] - матрицы соответствующих размерностей, причем элементы матриц Bi[(k),k], i = 0,n, D[(k),k] зависят от (k) линейно.
Для процесса (k) предполагаются известными условные моменты распределений M (k + i) / Fk = (k + i), (15) { } M (k + i)T (k + j) / Fk = Qij (k),(k = 0,1,2,...),(i, j = 0,d). (16) { } F=( Fk )k1 - поток -алгебр, где каждая из -алгебр Fk порождается где последовательностью {(s):s =0,k } и интерпретируется как доступная информация до момента времени k включительно. Аддитивные и мультипликативные шумы {v(k); k=0,1,Е}, {w(k); k=0,1,Е} - векторы белых шумов соответствующих размерностей с нулевыми средними и единичными матрицами ковариаций, причем E{w(k)vT(s)}=0, E{(k)vT(s)}=0, E{(k)wT(s)}=0 для всех k, s.
На управляющие воздействия накладываются ограничения вида (2).
Необходимо определить закон управления системой (14) при ограничениях (2) из условия минимума квадратичного критерия со скользящим горизонтом управления m J (k + m / k) = { M xT (k + i)R1(k,i)x(k + i) - R2 (k,i)x(k + i) + (17) i=+uT (k + i -1/ k)R(k,i -1)u(k + i -1/ k) / x(k),Fk.
} Теорема 2.1. Вектор прогнозирующих управлений U(k)=[uT(k/k), Е,uT(k+m-1/k)]T, минимизирующий критерий (17) при ограничениях вида (2), на каждом шаге k определяется из решения задачи квадратичного программирования с критерием вида 2xT Y (k + m / k) = (k)G(k) - F(k)U (k) + UT (k)H (k)U (k) при ограничениях Umin (k) S(k)U (k) Umax (k), где S(k) = diag(S(k),...,S(k + m -1)), T T T T Umin (k) = [umin(k),...,umin(k + m -1)]T, Umax(k) =[umax(k),...,umax(k +m-1)]T, H(k), G(k), F(k) - блочные матрицы, блоки которых равны Htt (k) = R(k,t -1) + L (m - t), f -t T T Htf (k) = M{B0 [(k + t),k + t] A0 (k + l)L12 (m - f ) / Fk },t < f, l=t+T Htf (k) = H (k),t > f, ft t-T Gt (k) = A0 (k + l)L (m - t), l=m j-t Ft (k) = R2(k, j) A0(k + j - l +1)B (k + t), j=t l=n L (s) = AiT (k + m - s)Q(s)Ai (k + m - s), i=n n L12(s) = AiT (k + m- s)Q(s)Bj[(k + m- s),k + m- s]vi(k + m- s)vj(k + m- s), i=0 j=n L (s) = AT (k + m - s)Q(s)B (k + m - s), 12 j j j=n L (s) = M{BT[(k + m - s),k + m - s]Q(s)Bj[(k + m - s),k + m - s] / Fk},s =1,m, j j= Q(t) = L (t -1) + R1(k,m - t),Q(0) = R1(k,m);t, f =1,m.
Оптимальное управление равно Inu 0nu u(k) = L 0nu U (k), где Inu - единичная матрица размерности nu, 0nu - квадратная нулевая матрица размерности nu.
Во второй главе также решена задача управления по критерию meanvariance для дискретных систем со случайными коррелированными параметрами и мультипликативными шумами. Доказаны теоремы об оптимальных стратегиях.
В третьей главе результаты применяются к решению актуальных задач управления инвестиционным портфелем:
а) управление ИП в условиях скачкообразного изменения параметров доходностей рисковых финансовых активов (на рынке с переключающимися режимами) при ограничениях на объемы торговых операций;
б) управление ИП в условиях коррелированности доходностей рисковых финансовых активов при ограничениях на объемы торговых операций.
Рассматривается ИП, состоящий из n видов рисковых активов (обыкновенных акций) и одного безрискового актива (банковский счет или надежные облигации).
Динамика капитала ИП определяется уравнением n V (k + 1) = 1+ r V (k) + hi (k +1) - r ui (k), [ ] [ ] i=где ui(k), i =1,n - капитал, помещенный в i-й рисковый актив;
n u0(k) = V (k) - (k) - капитал, помещенный в безрисковый актив i(k+1) - u i i=ставка доходности рисковых вложений на интервале [k,k+1], случайная не наблюдаемая в момент времени k величина, r - неслучайная доходность безрисковых вложений. Значение ui(k)<0, i =1,n, означает участие в операции продажа без покрытия на сумму |ui(k)|.
При управлении портфелем учитываются следующие ограничения:
на размеры вложений в рисковые активы uimin(k) ui(k) uimax (k),(i =1,n) (18) на размер вложений в безрисковый актив n (19) u0min (k) V (k) - (k) u0max (k).
u i i=Если нижняя граница uimin(k)<0, i =1,n, то для рискового актива i-го вида допустимо участие в операции продажа без покрытия на сумму не более |uimin(k)|; если uimin(k) 0, i =1,n, то операции продажа без покрытия для рискового актива i-го вида запрещены; u0max (k) 0 определяет максимальный размер капитала, который можно вкладывать в безрисковый актив, uimax(k) 0, i =1,n определяют максимальный объем капитала, который можно вкладывать в рисковый актив i-го вида; u0min(k) 0, величина u0min (k) определяет максимальный размер займа безрискового актива.
Рассмотрены следующие задачи.
1. Задача слежения за эталонным портфелем с заданной доходностью 0, эволюция которого описывается уравнением 0 0 V (k +1) = [1+ 0]V (k),V 0 =V 0, ( ) ( ) по квадратичному критерию m J (k + m / k) = M 1(k,i)V (k + i) -V 0(k + i) -2(k,i)[V (k + i) -V 0(k + i)] + i=+uT (k + i -1 / k)R(k + i -1)u(k + i -1 / k) /V (k),V (k),Fk, (20) } где 1(k,i) 0,2(k,i) 0Ц весовые коэффициенты, F = (Fk )k1 - поток -алгебр, каждая из -алгебр Fk интерпретируется как доступная инвестору информация о доходностях активов до момента времени k включительно.
2. Управление ИП по mean-variance критерию m J (k + m / k) = V (k + i) - M V (k + i) / V (k),Fk / V (k),Fk - (21) { } 1(k,i)M ( ) { } i=-2(k,i)M V (k + i) / V (k),Fk + M uT (k + i -1/ k)R(k,i -1)u(k + i -1/ k) / V (k),Fk, { } { } где 1(k,i) 0,2(k,i) 0 - коэффициенты, характеризующие склонность инвестора к риску и задающие соотношение между ожидаемым значением капитала ИП и соответствующим риском (вариацией) в момент времени k.
При управлении ИП на рынке с переключающимися режимами предполагается, что доходности рисковых активов описываются уравнениями n i [(k),k = i ] [(k),k + ij ] [(k),k wj(k), ] j=где (k) (k=0,1,2Е) - однородная дискретная марковская цепь с конечным множеством состояний {1,2,Е,}; wj(k) - независимые между собой дискретные белые шумы с нулевым средним и единичной дисперсией; последовательности wj(k) и (k) независимы; i[(k),k] - ожидаемая доходность i-го рискового вложения; ij[(k),k] - элементы матрицы волатильности [(k),k]. Для синтеза стратегий управления ИП использовались результаты, полученные в главе 1.
Примерами рынков с переключающимися режимами являются рынки акций.
Приведены результаты численного моделирования с использованием реальных данных о доходностях акций, торгующихся на российской фондовой бирже ММВБ и американской фондовой бирже NYSE. При моделировании на данных российского рынка портфели формировались из всех возможных комбинаций по 5 активов из наиболее ликвидных акций (всего 21 портфель); на данных американского рынка - по 6 активов из наиболее ликвидных акций (всего 84 портфеля). Тестирование проводилось за период с 20.07.2007 г. по 31.07.2012 г. (более 1200 торговых дней).
Под сменой режимов рынка понимался переход из состояния с низкой в состояние с высокой волатильностью, и наоборот. Смена режимов рынка описывалась марковской цепью. В качестве индикаторов состояния рынка использовались финансовые индексы: на российском рынке ценных бумаг - индекс ММВБ, на американском рынке - индекс Доу Джонса. Если выборочная оценка волатильности доходности индекса не превышала значение , то считалось, I что рынок находился в состоянии с низкой волатильностью, в противном случае - с высокой. Значение определялось исходя из анализа поведения реальI ного рынка. Оценка матрицы переходных вероятностей осуществлялась по методу максимального правдоподобия по выборке значений индикатора за период, предшествующий периоду инвестирования. Капитал реального управляемого ИП вычислялся с учетом транзакционных издержек (расходов, связанных с торговыми операциями с активами). Оценки ожидаемой доходности рисковых активов на каждом шаге производились методом простой скользящей средней.
Типичные результаты моделирования для портфеля, составленного из рисковых активов Apple Inc, Intel Corp, Microsoft Corp, IBM, American Express, Coca-Cola co, представлены на рис. 1-3. Предполагалось, что операции продажи без покрытия запрещены (ui (k) 0),и размер банковского займа не может превышать величину 3V(k). Для стратегии слежения за эталонным портфелем желаемая доходность 0=0.002, коэффициенты 1(k,i)=1, 2(k,i)=0; для управления по критерию mean-variance 1(k,i)=1, 2(k,i)=0.2. На рис. 1 показана динамика капиталов эталонного портфеля V0(k) и управляемых портфелей V(k) для стратегии слежения за эталонной траекторией и для стратегии mean-variance.
Рис. 2 иллюстрирует динамику доходности индекса Доу Джонса и оценки состояния рыночного режима. Динамика вложений капитала в рисковый актив приведена на рис 3.
Рис. 1. Динамика капиталов эталонного ИП (линия 1) и управляемых ИП (линия 2 - задача слежения, линия 3 - управление по mean-variance критерию) Рис. 2. Динамика доходности индекса Доу Джонса (линия 1) и оценка состояния цепи Маркова (линия 2) Рис. 3. Динамика вложений в акции Microsoft Corp для стратегии слежения При решении задач управления ИП на рынке с коррелированными доходностями использовались результаты главы 2. Примером рынка с коррелированными доходностями может служить валютный рынок Forex. В диссертационной работе приведены результаты моделирования стратегий управления по квадратичному критерию (20) и mean-variance критерию (21) с использованием реальных данных валютного рынка Forex.
Численные расчеты подтверждают работоспособность и эффективность предложенных подходов. Доходность портфелей и волатильность траекторий зависят от значений параметра 0 - для задачи слежения, или от соотношения доходность-риск - при управлении по mean-variance критерию, а также от точности оценок параметров доходностей финансовых активов.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ 1. Синтезированы стратегии управления с прогноз 112.
Подписано в печать 08.11.2012 г.
Формат А4/2. Ризография Печ. л. 1,0. Тираж 100 экз. Заказ № 03/11-Отпечатано в ООО Позитив-НБ 634050 г. Томск, пр. Ленина 34а Авторефераты по всем темам >> Авторефераты по техническим специальностям