ПОЛИЭДРАЛЬНАЯ ОПТИМИЗАЦИЯ ДИСКРЕТНЫХ ПРОЦЕССОВ УПРАВЛЕНИЯ: ТЕОРИЯ И ПРИМЕНЕНИЯ Специальность: 05.13.01 - Системный анализ, управление и обработка информации АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук Москва Х 2009

Авторефераты по всем темам >> Авторефераты по техническим специальностям

На правах рукописи

ФИЛИМОНОВ Николай Борисович ПОЛИЭДРАЛЬНАЯ ОПТИМИЗАЦИЯ ДИСКРЕТНЫХ ПРОЦЕССОВ УПРАВЛЕНИЯ:

ТЕОРИЯ И ПРИМЕНЕНИЯ Специальность:

05.13.01 - Системный анализ, управление и обработка информации

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора технических наук

Москва Х 2009

Работа выполнена в Московском государственном университете приборостроения и информатики НАУЧНЫЙ КОНСУЛЬТАНТ:

доктор технических наук, профессор В.Д. ИВЧЕНКО ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ:

Академик РАН доктор физико-математических наук, профессор Н.А. КУЗНЕЦОВ доктор физико-математических наук, профессор В.И. ЦУРКОВ доктор технических наук, профессор С.В. МАНЬКО ВЕДУЩАЯ ОРГАНИЗАЦИЯ:

ГНЦ РФ ФГУП Государственный научно-исследовательский институт авиационных систем

Защита состоится л13 мая 2009 г. в л14-00 часов на заседании диссертационного совета Д 212.131.03 Московского государственного института радиотехники, электроники и автоматики (ТУ) по адресу:

119454, г. Москва, просп. Вернадского, д. 78; тел. 434-92-

С диссертацией можно ознакомиться в библиотеке Московского государственного института радиотехники, электроники и автоматики (ТУ)

Автореферат разослан л 2009 г.

Ученый секретарь диссертационного совета кандидат технических наук, доцент О.А. Тягунов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

В современной автоматике на первый план выдвигаются задачи оптимизации процессов управления, причем интерес к ним неизбежно будет возрастать в соответствии с манифестом Я.З. Цыпкина: Оптимизировать все, что оптимизируется, а что не оптимизируется, сделать оптимизируемым.

Современные методы оптимизации процессов управления базируются на математическом аппарате классического вариационного исчисления, принципа максимума, динамического программирования и функционального анализа. Однако, они оказываются малоэффективными для многих реальных научно-технических задач, предъявляемых инженерной практикой. В условиях усложнения динамических моделей управляемых объектов, расширения требований к качеству процессов управления и ужесточения фазовых и ресурсных ограничений более перспективными являются т.н. прямые методы оптимизации, не использующие условия оптимальности (общий камень преткновения для других методов), а изначально базирующиеся на аппарате математического программирования (МП).

В настоящее время МП достигло определенной степени зрелости и представляет собой эффективный инструмент оптимизации, обеспеченный мощным арсеналом алгоритмических и программных средств. Несмотря на огромный прикладной потенциал, аппарат МП до сих пор не получил должного признания и применения в сфере оптимизации процессов управления.

Занимаясь той или иной научной проблемой, - подчеркивали Курант (R.

Courant) и Роббинс (G. Robbins), - лучше исходить из ее индивидуальных особенностей, чем полагаться на общие методы, а А.Н. Тихонов и Д.П. Костомаров, рассуждая о перспективах развития методов оптимизации отмечали, что конкретизация задачи, выделение определенных классов функций и областей позволяют провести более глубокое исследование и разработать специальные методы, которые решают задачу исчерпывающим образом. В настоящей диссертации выделен такой конкретный и вместе с тем достаточно широкий класс оптимизационных задач, для которых удается получить весьма простые и вместе с тем эффективные алгоритмические решения.

Диссертация посвящена теоретическому исследованию нового класса оптимизационных задач - задач полиэдральной оптимизации дискретных процессов управления динамическими объектами в условиях ресурсных и фазовых ограничений. Полиэдральная оптимизация основывается на аппарате полиэдрального программирования (ПП) - специального раздела МП, изучающего оптимизационные задачи полиэдральной структуры.

Тема диссертации - полиэдральная оптимизация дискретных процессов управления: теория и применения.

Актуальность темы диссертации обусловлена необходимостью исследования следующих проблем современной автоматики:

Х проблемы управления динамическими объектами в условиях фазовых и ресурсных ограничений, уровень теоретической проработки которой не отвечает требованиям практики;

Х проблемы развития техники классических прямых показателей качества процессов управления в рамках формализма пространства состояний;

Х проблемы разработки прогностических стратегий управления, продиктованной закономерной сменой классической парадигмы позиционного управления;

Х проблемы разработки алгоритмов робастного управления в условиях параметрической неопределенности динамики объекта и внешней среды.

Основной целью диссертационного исследования является разработка теоретических основ и изучение прикладных аспектов полиэдральной оптимизации дискретных процессов управления и наблюдения, и их применение к решению выделенных проблем автоматики.

Объект диссертационного исследования - дискретные процессы управления конечномерными динамическими объектами с учетом ресурсных и фазовых ограничений.

Предмет диссертационного исследования - проблематика полиэдральной оптимизации дискретных процессов управления.

Основными задачами

диссертационного исследования являются:

Разработка теоретических основ ПП.

Разработка численных методов решения задач ПП.

Разработка критериальной базы задач полиэдральной оптимизации дискретных процессов управления Решение ключевых задач полиэдральной оптимизации дискретных процессов управления.

Применение полиэдрального подхода в алгоритмах управления движением летательных аппаратов.

Современное состояние темы диссертации. Диссертационное исследование поступательно развертывается по линии: полиэдральное программирование - полиэдральная оптимизация процессов управления.

Ретроспектива полиэдрального программирования. Исследования в области оптимизации процессов управления не могли пройти стороной мимо аппарата линейного программирования (ЛП), как наиболее зрелого и развитого раздела МП, обеспеченного мощным арсеналом алгоритмов и программных средств. Однако, возможности ЛП не выходят за пределы линейной структуры решаемых задач - линейности целевой и ограничивающих функций.

По сравнению с ЛП более перспективно в сфере оптимизации процессов управления ПП - новый специальный раздел МП, объектом исследования которого является класс экстремальных задач с полиэдральной структурой, т.е. полиэдральными целевыми и ограничивающими функциями. Полиэдральная методология применима к большинству прикладных оптимизационных задач, причем многие возникающие на практике оптимизационные задачи либо изначально удается формализовать в терминах ПП, либо допускают применение полиэдральной аппроксимации. Важно подчеркнуть, что ключевые конструкции ПП - полиэдральные множества, функции, нормы и метрики, - открывают новые возможности с точки зрения формализации постановки и содержательной интерпретации прикладных задач оптимизации дискретных процессов управления динамическими объектами в условиях ресурсных и фазовых ограничений.

ПП занимает промежуточное место между линейным и выпуклым программированиями, являясь обобщением первого и частным случаем второго. Его можно рассматривать как особую ветвь кусочно-линейного программирования (КЛП), охватывающую класс экстремальных задач с выпуклыми кусочно-линейными целевой и ограничивающими функциями. Основные задачи

КЛП были сформулированы в 1960-х гг. в известных книгах Е.Г. Гольштейна, Д.Б. Юдина и С.И.

Зуховицкого, Л.И. Авдеевой. Среди немногочисленных исследований, затрагивающих вопросы КЛП, можно выделить работы Агхара (W.G. Aghar) и Уэйлеса (T.D.

Walace); Мельцера (D. Meltzer); Гороховика (V.V. Gorokhovick) и Зорко (O.I. Zorko); Крифганза (A. Kripfganz) и Шульца (R. Schulze); Бенчекроуна (B. Benchekroun);

Бен-Исраэля (A. Ben-Israel) и Чарнеса (A. Charnes); В.П. Булатова; Р.П. Федоренко;

В.И. Мудрова; Ф.М. Кирилловой и Р Габасова; Е.П. Волокитина; Е.И. Шилкиной;

С.В. Плотникова; В.Н. Козлова; И.И. Еремина.

Несмотря на 40-летнюю историю своего существования, КЛП практически отсутствует в современной учебной и монографической литературе по МП, а задачи КЛП именуются нестандартными, либо специальными задачами ЛП. В связи с этим введение автором специального самостоятельного раздела МП под названием полиэдральное программирование является принципиальным и вполне оправданным. Данный термин более адекватно отражает существо рассматриваемых задач, позволяет избежать терминологической путаности и привнести необходимую строгость в общую классификацию разделов МП. Кстати, словосочетание полиэдральное программирование (точнее сепарабельное полиэдральное выпуклое программирование), впервые встречается в 1992 г. в монографии А.Д. Гвишиани и В.А. Гурвича, а те или иные полиэдральные категории (объектами которых являются полиэдры), связанные с задачами оптимизации и управления, в последнее десятилетие все чаще встречаются в отечественной научной и учебной литературе.

Здесь можно указать работы: И.И. Еремина, Н.А. Кузнецова, А.Б. Куржанского, Р.

Габасова, Б.П. Дербеневой, А.В. Лотова, Г.К. Каменева, Р.В. Ефремова, Е.К. Костоусовой, Л.И. Микулича, А.С. Беленького, Е.В. Гончарова и С.Б. Пельцвергера, в которых используются такие выражения, как: полиэдральное оценивание и полиэдральная аппроксимация областей достижимости систем, полиэдральная оптимизация и оптимизация в полиэдральной норме, полиэдральные множества допустимых стратегий, алгоритмы полиэдральной аппроксимации в задачах фильтрации, оптимизация систем управления с полиэдральными ограничениями, полиэдральные методы в задачах управления и т.п.

К разработке теоретических основ ПП наиболее близки работы И.И. Еремина последнего десятилетия, связанные с исследованием задач КЛП.

Ретроспектива полиэдральной оптимизации процессов управления. Критериальная база задач оптимального управления основана на формализации представлений о качестве процессов управления. Проблема качества управления является одним из наиболее консервативных (по Я.З. Цыпкину вечно юных) и слабо развивающихся разделов современной теории автоматического управления. Однако, на современном этапе ее развития фактически утрачена преемственность к интуитивно ясным и содержательным классическим представлениям о качестве процессов управления, выработанным отечественной автоматикой в 40-60-е гг. прошлого столетия. Действительно, мы наблюдаем преобладание квадратичных критериев качества и порождаемых ими задач оптимизации, именуемых задачами аналитического конструирования оптимальных регуляторов (АКОР). Несмотря на чрезвычайную популярность, концептуальные основы АКОР часто подвергались резкой критике известными отечественными и зарубежными учеными, включая В.В. Солодовникова, Н.Н. Моисеева, Я.З. Цыпкина, С.В. Емельянова, С.К. Коровина, А.А. Первозванского, А.М. Баткова, А.А. Колесникова, В.Н. Букова, Беллмана (R.E.

Bellman), Уонэма (W.M. Wonham), а также самих основоположников теории АКОР Калмана (R.E. Kalman) и А.М. Летова. Данная критика обусловлена, прежде всего, отсутствием у оптимизируемых квадратичных критериев ясного физического смысла, невозможностью учесть локальные свойства переходных процессов, а также установить прямые ограничения на фазовые переменные. Кроме того, инженерную ценность методологии АКОР ставят под сомнение результаты решения так называемой обратной задачи АКОР, согласно которой любая асимптотически устойчивая замкнутая автоматическая система (даже со сколь угодно неудовлетворительным качеством переходных процессов) является оптимальной в смысле некоторого квадратичного критерия качества.

В работах автора проведено систематическое исследование проблемы качества процессов управления для широкого класса конечномерных динамических объектов, которое затронуло, в частности, критериальные основы теории АКОР и послужило толчком к разработке альтернативной к ней теории полиэдральной оптимизации процессов управления.

По мнению Беллмана (R.E. Bellman), в теории АКОР исходную задачу заменяют менее важной задачей минимизации квадратичного функционала, потому что она, в противоположность первой, более реалистичной задаче, поддается изучению с помощью классических методов. Более реалистичны задачи полиэдральной оптимизации процессов управления, отличительной особенностью которых является полиэдральная структура: все ключевые элементы задачи - цель управления, ограничения и критерии качества - являются полиэдральными.

Обращаясь к ретроспективе полиэдральных критериев качества процессов управления, следует отметить, что отдельные их виды имеют давнюю историю и в период зарождения не могли интерпретироваться с позиций полиэдрального анализа. К числу исторически сложившихся первых критериев качества управления полиэдральной структуры следует отнести известный критерий равномерного приближения Чебышева, впервые введенный в теорию и практику автоматических систем сначала Б.В. Булгаковым в конце 1930-х гг. для задач накопления возмущений, а затем В.В. Солодовниковым и А.А. Фельдбаумом в 1953 г. для общего класса задач управления как максимальное отклонение, или перерегулирование. Важность данного критерия качества в теории и практике автоматических систем подчеркивали ведущие зарубежные и отечественные ученые: Беллман (R.E. Bellman), Дрейфус (S.E. Dreyfus), Гликсберг (I. Glicksburg), Гросс (O. Gross), Нейштадт (L.W.

Neustad), Джонсон (C.D. Johnson), Далех (M.A. Dahleh), Пирсон (J.B. Pearson), Куликовский (R. Kulikowski), Портер (W.A. Porter), Варга (J. Warga), Е.А. Барбашин, Н.Н.

Красовский, А.Б. Куржанский, Ю.С. Осипов, Н.Н. Моисеев, Ф.Л. Черноусько, Я.З.

Цыпкин, В.А. Якубович, А.Я. Дубовицкий, А.А. Милютин, Г.М. Уланов, В.Ф. Демьянов, К.А. Лурье, Р.П. Федоренко, Р. Габасов, Ф.М. Кириллова, В.А. Троицкий, А.И.

Субботин, А.Г. Ченцов, В.М. Кейн, В.А. Бесекерский, А.А. Колесников, А.А. Первозванский, В.П. Куропаткин, В.В. Григорьев, А.Е. Барабанов и др. Однако, несмотря на ясный физический смысл, практическую значимость и давнюю историю, возможности его применения оставались сомнительными из-за отсутствия конструктивных методов решения порождаемых им оптимизационных задач. Один из мотивов диссертационного исследования - возрождение интереса к чебышевскому критерию качества управления на основе полиэдральной методологии.

Те или иные полиэдральные конструкции фрагментарно встречаются в литературе в постановках ряда задач оптимального управления при формализации либо цели управления, либо ограничений, либо критериев качества. Здесь следует указать задачи минимаксного управления динамическими объектами, рассмотренные в работах Джонсона (C.D. Johnson), Швеппе (F.C. Schweppe), Далеха (M.A. Dahleh), Н.Ф. Кириченко, А.Б. Куржанского, В.А. Якубовича, В.М. Кейна, А.Е. Барабанова, Э.Я. Рапопорта, А.Ф. Шорикова и др. Однако, все эти задачи не относятся к рассматриваемому в диссертации классу задач с полиэдральной структурой.

К полиэдральной методологии оптимизации процессов управления наиболее близки работы А.А. Первозванского 1960-х гг., связанные с равномерной оптимизацией систем управления.

Методы исследования базируются на положениях современной теории управления и методов математического программирования. Для вывода, обоснования и доказательства основных теоретических результатов применялся математический аппарат теории разностных уравнений, теории матриц, теории оптимизации и выпуклого анализа. Подтверждение теоретических результатов проводилось компьютерными вычислительными экспериментами.

Научная новизна. В диссертации сформировано новое научное направление в теории автоматического управления, связанное с применением аппарата полиэдрального анализа, полиэдрального исчисления и полиэдрального программирования к задачам дискретного управления динамическими объектами.

На защиту выносятся следующие новые результаты:

Теоретические основы полиэдральной оптимизации, включая элементы полиэдрального анализа, полиэдрального исчисления и полиэдрального программирования.

Методы редукции задач полиэдральной оптимизации к задачам безусловной полиэдральной оптимизации и к задачам линейного программирования.

Численные методы безусловной полиэдральной оптимизации: субградиентный метод, реализующий непрямую схему жестких вычислений, и эволюционный метод в виде комбинации эволюционных стратегий и генетических алгоритмов, реализующий прямую схему мягких вычислений.

Полиэдральная методология формализации задач оптимального управления динамическими объектами с учетом фазовых и ресурсных ограничений.

Полиэдральная стратегия дискретного упреждающего управления динамическими объектами в условиях ресурсных ограничений.

Полиэдральные постановки и регулярные методы решения ряда дискретных задач анализа и синтеза систем управления:

Х предельного быстродействия;

Х анализа устойчивости и стабилизирующего управления;

Х определения экстремальных возмущающих факторов;

Х гарантированного управления в условиях начальной полиэдральной неопределенности;

Х робастного управления в условиях параметрической полиэдральной неопределенности;

Х конфликтного управления противоборствующими объектами;

Х барьерного управления в критических ситуациях;

Х идентификации состояния системы и внешней среды в условиях параметрической полиэдральной неопределенности возмущающих факторов.

Решение прикладных задач управления терминальными маневрами аэродинамических летательных аппаратов на основе полиэдрального подхода.

Достоверность и обоснованность научных положений, результатов, выводов и рекомендаций диссертации обусловлены использованием апробированных научных методов и средств, полнотой и корректностью исходных посылок, строгостью математических выкладок, подтверждаются результатами вычислительных экспериментов, а также апробацией и обсуждением полученных результатов на научных конференциях и экспертизой публикаций в ведущих научных изданиях.

Практическая ценность. Полученные в диссертации теоретические результаты и методические рекомендации ориентированы на разработку эффективных дискретных систем автоматического управления с учетом разнообразных условий функционирования, включая условия параметрической неопределенности, действия возмущающих факторов, возможность критических и конфликтных ситуаций.

Основными достоинствами полиэдральной методологии оптимизации процессов управления как эффективного инженерного инструмента решения широкого круга теоретико-прикладных задач являются:

Х общность математического формализма, обусловленная использованием полиэдральных норм и метрик в постановке и содержательной интерпретации широкого класса задач управления;

Х структурные свойства полиэдральных функций, проявляющиеся в возможности их дизъюнктивного разложения, т.е. представления в виде функции поточечного максимума конечного числа линейных функций;

Х аппроксимативные аспекты применения полиэдральных функций, связанные с возможностью приближения любых выпуклых функций и множеств соответственно полиэдральными функциями и множествами;

Х ясный инженерный смысл полиэдральных критериев качества процессов управления;

Х естественность и простота оперирования полиэдральными целями управления, а также учета полиэдральных фазовых и ресурсных ограничений;

Х сводимость к задачам линейного программирования и, как следствие, - простота компьютерной реализации с использованием доступных и апробированных вычислительных технологий и стандартного программного обеспечения.

Результаты теоретических исследований, разработанные методы полиэдральной оптимизации и полиэдральные алгоритмы управления могут найти широкое применение в задачах автоматизации технических объектов и технологических процессов в промышленности, энергетике и на транспорте.

Использование, внедрение и реализация результатов. Диссертационная работа выполнялась в МГТУ им. Н.Э. Баумана и МГУПИ в рамках плановых госбюджетных научно-исследовательских работ и конкурсных проектов, включая:

программу Минобразования РФ Интеллектуальные системы (1998 г.), подпрограмму Научные исследования высшей школы в области транспорта (2001 г.), конкурсный проект РФФИ по отделу математики, информатики и механики Исследование алгоритмов решения терминальных задач (2000-2002 гг.).

Результаты диссертационного исследования использовались в научно-производственном процессе двух предприятий:

- ОАО АНТК им. А.Н. Туполева в 1998-2000 гг. при разработке научно-методического, алгоритмического и программного обеспечения системы компьютерной сертификации динамики посадочных маневров пассажирских самолетов: среднемагистрального Ту-204 и сверхзвукового Ту-144ЛЛ;

- ФГУП НПО машиностроения в 2000-2003 гг. при разработке перспективных алгоритмов управления стартовым маневром автоматических аэродинамических высокоманевренных беспилотных летательных аппаратов.

Предложенные решения позволяют значительно сократить сроки разработки и верификации алгоритмов управления, а также повысить качество процессов управления маневрами летательных аппаратов. При этом техническая целесообразность применения и эффективность разработанных алгоритмов управления обусловлены возможностью учета реальных динамических свойств аппарата, требований к качеству маневра, а также ресурсных и фазовых ограничений.

Основные теоретические результаты диссертации вошли в пятитомный учебник по методам классической и современной теории автоматического управления, использованы в учебном процессе при подготовке инженеров по направлению Системы управления и навигации, магистров и бакалавров по направлению Автоматизация и управление в МГТУ им. Н.Э. Баумана и МАТИ-РГТУ им.

К.Э. Циолковского, а также при подготовке аспирантов в МГТУ им. Н.Э. Баумана и PhD-студента в Де Монтфортском университете (Лейстер, Великобритания).

Апробация работы. Основные теоретические и практические результаты диссертации докладывались и обсуждались на более, чем 110 международных и отечественных научных конференция, симпозиумах и семинарах, включая:

Конференции и семинары в России и в ближнем зарубежье: Моск. гор. шк.семин. мол. учен. Алгоритмизация и программирование задач управления (Москва, 1978, 1984); I и II Всесоюз. межвуз. науч.-техн. конф. Математическое, алгоритмическое и техническое обеспечение АСУ ТП (Ленинград, 1978; Ташкент, 1980); III Всесоюз. совещ. по автоматизации проектирования САУ и АСУ ТП (Иваново, 1981); Республ. конф. Вычислительная математика в современном научно-техническом прогрессе (Киев, 1982); 1-я Всесоюз. науч.-техн. конф. Синтез и проектирование многоуровневых систем управления (Барнаул, 1982); X и XI Всесоюз. науч.-техн. совещ.

Создание и внедрение систем автоматического и автоматизированного управления ТП (Алма-Ата, 1983; Новгород, 1986); V Всесоюз. совещ. Управление многосвязными системами (Москва, 1984); Республ. науч.-техн. конф. Опыт создания и пути повышения эффективности функционирования АСУПиТП (Минск, 1985); V-VI Всесоюз. совещ.-семин. мол. учен. Современные проблемы автоматического управления (Пушкино, 1985; 1987); III и IV Всесоюз. науч.-техн. конф. Программное, алгоритмическое и техническое обеспечение АСУ (Ташкент, 1985, 1988); Всесоюз. науч.

конф. Декомпозиция и координация в сложных системах (Челябинск, 1986); 5-я Всесоюз. Четаевская конф. Аналитическая механика, устойчивость и управление движением (Казань, 1987); Респ. науч.-техн. конф. Методологические проблемы автоматизированного проектирования и исследования систем (Севастополь, 1987); III Республ. науч.-техн. конф. Новые достижения в области приборостроения (Ереван, 1987); 1-2-я Всесоюз. науч.-техн. конф. мол. учен. и спец. с междунар. участием Контроль, управление и автоматизация в современном производстве (Москва, 1988, 1990); X Всесоюз. совещ. по проблемам управления (Москва, 1989); Всесоюз. науч.техн. совещ. Теоретические и прикладные проблемы создания систем управления ТП (Челябинск, 1990); Науч.-техн. конф. л165 лет МГТУ им. Н.Э. Баумана (Москва, 1995); 1-6-й междунар. симп. Интеллектуальные системы (Махачкала, 1994; С.-Петербург, 1996; Псков, 1998; Москва, 2000; Калуга, 2002; Саратов, 2004); VI-VIII и XI междунар. науч.-техн. семин. Современные технологии в задачах управления, автоматики и обработки информации (Алушта, 1997-1999, 2002); 1-я междунар. конф.

Новые технологии управления движением технических объектов (Ставрополь, 1999); The Third Russian-Korean Internat. Sympos. on Science and Technology (Novosibirsk, 1999); 4th и 5th Internat. Conf. on Actual Problems of Electronic Instrument Engineering (Novosibirsk, 1998, 2000); VI междунар. семин. Устойчивость и колебания нелинейных систем управления (Москва, 2000); Конф. по теории колебаний и управлению, посвящ. 100-летию Б.В. Булгакова (Москва, 2000); Междунар. конф. Континуальные логико-алгебраические исчисления и нейроматематика в науке, технике и экономике (Ульяновск, 2001); Науч.-практ. семин. Проблемы синтеза и проектирования систем автоматического управления (Новосибирск, 2001); Всеросс. науч.-техн.

конф. Аэрокосмические технологии (Реутов, 2002, 2003, 2004); 2, 3 и 5-я междунар.

науч.-техн. конф. Инженерно-физические проблемы авиационной и космической техники (Чкаловские чтения) (Егорьевск, 1997, 1999, 2004); XXVI-XXVIII академ. чтения по космонавтике (Москва, 2002-2004); 2-3-я Всеросс. науч. конф. Управление и информационные технологии (Пятигорск, 2004; С.-Петербург, 2005); 1-2-я Всеросс.

науч.-техн. конф. с междунар. участ. Мехатроника, автоматизация, управление (Владимир, 2004; Уфа, 2005); 1-2-я междунар. науч. конф. Аналитическая теория автоматического управления и ее приложения (Саратов, 2000, 2005); Всеросс. научнотехн. конф. Информационные технологии (Воронеж, 2005); 1st и 2nd Internat. Conf.

Dynamical System Modelling and Stability Investigation (Kyiv, 2003, 2005).

Конференции в ближнем и дальнем зарубежье: Научна сесия ВМЕИ Ленин (Болгария, София, 1989); Трета-Пета Национ. млад. шк. с междунар. уч. Системи за автоматизация на инженерния труд и научните изследвания (Болгария, София, 1989-1991); 9th, 10th, 13th-17th Internat. Conf. Systems for Automation of Engineering and Re-search (Bulgaria, Varna, 1995, 1996, 1999-2003).

Семинары в: МГТУ им. Н.Э. Баумана, МАТИ-РГТУ им. К.Э. Циолковского, МИФИ (ТУ), МГУ им. М.В. Ломоносова, СПбГЭТУ ЛЭТИ, Саратовском ГТУ, Киевском ГУ, Софийском ГУ (Болгария), Де Монфортском ун-те (Великобритания).

Публикации. По теме диссертационного исследования опубликовано самостоятельно и в соавторстве более 160 печатных работ, включая одну монографию, две главы в пятитомном учебнике, учебное пособие, 34 статьи, опубликованные в центральных отечественных и зарубежных журналах, а также 19 статей, опубликованных в рецензируемых научных сборниках. 18 статей опубликованы в периодических изданиях, рекомендованных ВАК РФ (из них 6 статей без соавторов).

Публикации полностью отражают основное содержание диссертации.

ичный вклад автора. В работах, выполненных в соавторстве, автору принадлежат результаты, относящиеся к разработке теории ПП и ее применения в задачах оптимизации процессов управления. В работах с соавторами (В.В. Солодовниковым и А.Б. Филимоновым) автору принадлежит ведущая роль в постановке задач, выборе и обосновании методов их решения, а также в объяснении полученных результатов. В работах, выполненных совместно с аспирантами А.Н. Бабичем, М.Н. Деменковым и И.В. Белоусовым, автор осуществлял непосредственное научное руководство.

Структура и объем работы. Диссертация состоит из введения, шести глав, заключения, списка литературы из 821 наименований и двух приложений, включая акты об использовании результатов диссертационного исследования. Основное содержание диссертации изложено на 284 страницах, включая 26 рисунков и 4 таблицы.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность и приведен обзор современноВведение го состояния научных исследований по теме диссертации. Определены: объект, предмет, цель, основные задачи и методы исследования.

Сформулированы основные положения, выносимые на защиту. Показана научная новизна, оригинальность, достоверность и обоснованность, а также практическая ценность результатов. Дана общая характеристика работы.

В главе разрабатываются основные положения полиГлава 1. Основы теории эдрального анализа (ПА), полиэдрального программирования (ПП) и полиэдрального исчисления (ПИ), полиэдральной оптими- составляющих фундамент теории полиэдральной опзации тимизации. Формулируются общая и типовые частные задачи ПП. Предлагаются методы редукции задач ПП к задачам ЛП и задачам безусловной полиэдральной оптимизации.

Элементы полиэдрального анализа. ПА - специальный раздел выпуклого анализа, объектом изучения которого являются такие полиэдральные конструкции, как полиэдральные множества, функции, неравенства, нормы и метрики.

Полиэдральные множества. Полиэдральное множество, или выпуклый полиэдр P=Чn, - множество, образованное пересечением конечного числа замкнутых полупространств в , причем пустое множество является полиэдральным по определению.

Каждый полиэдр допускает внешнее и внутреннее представления, которые, согласно известной теореме Вейля (H. Weyl), эквивалентны.

Внешнее представление полиэдра P Чn задается множеством замкнутых полупространств {P1, P2, Е, Pm}, порождаемых ограничивающими гиперплоскостями Гi = {xЧn : ai, x = bi, i =1, m (ai Чn, biЧ)}:

m P = = {xЧn : A x b}, i P i=где AЧmn - матрица со строками ai, bЧm - вектор с элементами bi (i = 1,m ).

Внутреннее представление полиэдра P Чn задается параметрически в виде всевозможных выпуклых комбинаций конечного числа точек xi:

s s x P = conv{x1, x2, Е, xs} = Чn : x = xi; i Ч, i 0, i =1,s; =1.

i i i=1 i= Полиэдральные функции. Полиэдральная функция f - функция, надграфик которой epi f является выпуклым полиэдром.

Описываются фундаментальные свойства полиэдральных функций и доказывается сохранение свойства полиэдральности при многих операциях.

На классе непрерывных функций f1(x), f2(x), Е fm(x) определена операция максимума (поточечного или дискретного максимума) m max{f1(x), f2(x), Е, fm(x)} fi(x) = (f1f2Еfm)(x).

i=Теорема 1.1. Функция f(x) является полиэдральной тогда и только тогда, когда она является функцией максимума конечного числа линейных функций:

m f(x) = i(x), (1.1) i= где i(x) = аi0 + аi, x, аi0Ч, аi, i = 1, m. Представление полиэдральной функции в виде (1.1) является ее дизъюнктивным разложением.

Теорема 1.2. Если f1(x), f2(x), Е fm(x) - полиэдральные функции, а f(x) - функция максимума:

m f(x) = fi(x), i=то f(x) - полиэдральная функция. Доказано, что класс полиэдральных функций совпадает с классом выпуклых кусочно-линейных функций. Показана возможность построения новых полиэдральных функций из имеющихся посредством операций умножения на положительный скаляр, сложения и поточечного максимума, а также линейного преобразования аргумента.

Наиболее часто встречающимися полиэдральными функциями являются функции поточечного максимума и суммы модулей:

f(x) = max {| x1 |, | x2 |, Е, | xn |}, f(x) = | x1 | + | x2 | + Е + | xn |.

Полиэдральные неравенства. Полиэдральное неравенство - неравенство g(x) С, (1.2) в котором g(x) является полиэдральной функцией, а C = const, причем множество его решений является выпуклым полиэдром.

Показано, что всякую конечную систему полиэдральных неравенств можно представить единственным полиэдральным неравенством (1.2), а если q g(x) = j(x), j=где j(x) - линейные функции, то полиэдральное неравенство (1.2) можно разложить в эквивалентную систему линейных неравенств:

j(x) С, j = 1, q.

Полиэдральные нормы и метрики. Математическая структура многих прикладных задач оптимизации определяется выбором нормы векторов в пространстве решений . Введение полиэдральных норм может дать существенные преимущества, позволяя в прикладных задачах оптимизации эффективно использовать методологию полиэдральной оптимизации.

Полиэдральная норма - норма, являющаяся полиэдральной функцией координат. Широкое распространение находят две полиэдральные нормы:

n ||x||1 = xi, ||x|| = max | xi |, (1.3) 1in i=известные как октаэдрическая и кубическая (чебышевская) нормы.

Полиэдральные нормы порождают особый класс неевклидовых метрик - полиэдральные метрики. Нормы (1.3) порождают соответственно две полиэдральные метрики - расстояние Минковского и расстояние Чебышева:

1(x, x) = || x-x||1 (x, x) = || x-x||.

Доказана теорема об удовлетворении функции максимума аксиомам нормы. Обсуждаются вопросы построения и сравнения полиэдральных норм.

Элементы полиэдрального программирования. ПП - специальный раздел математического программирования, объектом исследования которого является класс экстремальных задач с полиэдральной структурой, т.е. с полиэдральными целевой и ограничивающей функциями.

Общая задача полиэдрального программирования. Общая задача ПП является задачей условной оптимизации вида f(x) extr, (1.4) gi(x) 0, i = 1, m, (1.5) xP, (1.6) где x=Чn, f(x) и gi(x) - соответственно полиэдральные целевая и ограничивающие функции; P - полиэдральное множество.

Введение полиэдральной функции g(x) = max gi(x) i[1 : m] и полиэдра D = {xЧn : g(x) 0; xP}. (1.7) позволяет общую задачу ПП (1.4)-(1.6) представить в виде следующей эквивалентной задачи условной полиэдральной оптимизации:

extr { f(x) : xD}. (1.8) Многие прикладные задачи оптимального управления, проектирования и планирования изначально имеют полиэдральную структуру. Кроме того, некоторые задачи ЛП для уменьшения количества переменных и ограничений целесообразно переформулировать в терминах ПП, а любую задачу выпуклого программирования всегда можно точно или приближенно свести к задаче ПП путем кусочнолинейной аппроксимации целевой и ограничивающих функций.

Поскольку полиэдральные функции относятся к классу выпуклых кусочно-линейных функций, то общая задача ПП относится к классу задач выпуклой негладкой оптимизации.

В последнее время негладкость все чаще встречается в математических моделях технических, социально-экономических и экологических процессов, что способствовало интенсивному развитию теории негладкой оптимизации, основанной на аппарате негладкого анализа. Различным аспектам негладкой оптимизации посвящены работы А.М. Гупала, В.A. Демьянова, В.Н. Малоземова, Л.В. Васильева, В.В. Федорова, Н.З. Шора, В.И. Норкина, Е.А. Нурминского, Б.Т. Поляка, А.М. Рубинова, И.В. Коннова, Рокафеллара (R.T. Rockafellar), Кларка (F.H. Clarke), Ауслендера (A. Auslender), Данскина (J.M. Danskin), Калума (J. Cullum), Халкина (H. Halkin), Доната (W.E. Donath), Голдстейна (A.A. Goldstein), Волфа (P. Wolfe) и др.

Автором развиваются два подхода к редукции задач ПП:

Х редукция задач ПП к семейству задач ЛП;

Х редукция задач ПП к задаче безусловной полиэдральной оптимизации.

Редукция к задачам линейного программирования. Полиэдральные функции обладают важной спецификой: они, являясь негладкими, составлены из гладких - линейных функций. Именно эта специфика позволяет избежать борьбы с негладкостью решаемых задач ПП посредством их редукции к задачам ЛП. Пусть f(x) и g(x) : Ч - полиэдральные функции.

Задачи ПП на максимум - это оптимизационные задачи вида З0: max{f(x) : g(x) 0}.

Представим функции f(x) и g(x) своими дизъюнктивными разложениями:

p q f(x) = i(x), g(x) = j(x), i=1 j=где i(x) и j(x) - линейные функции. Рассмотрим семейство задач ЛП:

Зi: max{i(x) : j(x) 0, j = 1, q }, i = 1, p.

Теорема 1.3. Исходная задача З0 разрешима тогда и только тогда, когда разрешима каждая из p вспомогательных задач З1, З2, Е, Зp.

Допустим, что задача З0 разрешима, и положим, что f, 1, , Е, - 2 p оптимальные значения целевых функций рассматриваемых задач, причем = max{1, , Е, }.

2 p Тогда f = , причем, если для некоторого k{1, 2, Е, p} выполняется равенство =, то k оптимальное решение вспомогательной задачи Зk является также оптимальным решением исходной задачи З0. Метод решения задачи ПП на максимум:

Х решается семейство вспомогательных задач ЛП З1, З2, Е, Зp;

Х определяется наибольшее значение из всех оптимальных значений целевых функций решенных задач;

Х найденное оптимальное решение, обеспечивающее наибольшее значение целевой функции, принимается за оптимум исходной задачи З0.

Задачи ПП на минимум - это оптимизационные задачи вида З0: min{f(x) : g(x) 0}.

Поставим исходной задаче З0 в соответствие следующую вспомогательную оптимизационную задачу З в расширенном пространстве =Ч:

З : f (x) = xn+1 min, g1(x) = f(x1, x2, Е, xn) - xn+1 0, g2 (x) = g(x1, x2, Е, xn) 0.

где x = col(x1, x2, Е, xn, xn+1) .

Теорема 1.4. Исходная З0 и вспомогательная З задачи эквивалентны:

1) каждая из них разрешима только тогда, когда разрешима другая;

2) оптимальные значения целевых функций обеих задач совпадают:

f = f ;

3) если x - оптимальное решение исходной задачи, то x = (x, f ) является оптимальным решением вспомогательной задачи и наоборот. Теорема 1.5. Любая задача ПП на минимум сводится к задаче ЛП. Метод решения задач ПП на минимум:

Х вводится дополнительная переменная xn+1 - мажоранта целевой функции задачи З0;

Х исходная задача преобразуется в расширенную задачу З с линейной целевой функцией xn+1;

Х из задачи З посредством разбиения ее полиэдральных ограничений на линейные получается задача ЛП З1;

Х найденное оптимальное решение последней задачи дает решение исходной задачи.

Задачи ПП на минимакс и максимин - это минимаксные и максиминные задачи полиэдральной структуры.

Пусть =Чn, а P, Q - выпуклые полиэдры, являющиеся выпуклыми оболочками заданных конечных множеств точек P0, Q 0 :

P = conv P0, P0 = { p1, p2, Е, pL}, pi (i = 1,L );

Q = conv Q, Q = { q1, q2, Е, qM}, qj (j = 1,M ).

0 Под задачами ПП на минимакс понимаются задачи вида fI = min max f (y - z). (1.9) y P z Q Показано, что вспомогательная функция (y) = max f (y - z) является поz Q лиэдральной, для ее построения можно использовать формулу (y) = max f (y - q) = max f (y - qj), q Q0 1 jM а минимаксная задача (1.9) сводится к задаче ПП на минимум fI = min (y).

y P Под задачами ПП на максимин понимаются задачи вида fII = max min f (y - z), (1.10) z Q y P предполагая, что полиэдральная функция f(x) удовлетворяет аксиомам нормы.

Показано, что вспомогательная функция (z) = min f (y - z) y P является выпуклой и ее множества уровня являются выпуклыми полиэдрами. В силу этого, максиминная задача (1.10) равносильна задаче ПП на максимум fII = max (z), (1.11) z Q оптимальное значение которой достигается в крайней точке множества Q.

Экстремальная задача (1.11) сводится к поиску максимума функции (z) на конечном множестве точек Q0 :

fII = max (q) max (qj), q Q1 jM значения функции в которых являются значениями задачи ПП на минимум:

(qj) = min f (y - qj).

y P Для значений рассматриваемых минимаксных и максиминных задач ПП справедливо общее правило: fI fII.

Таким образом, принципиальной особенностью основных типовых задач ПП является их редуцируемость, т.е. сводимость к задачам ЛП.

Редукция к задаче безусловной полиэдральной оптимизации методом точных полиэдральных штрафов. Один из способов решения задач условной оптимизации заключается в их сведении к задачам безусловной оптимизации методом штрафных функций, который в сочетании с методами поиска безусловного экстремума является универсальным средством решения практически любых задач МП.

В основу метода штрафных функций положена идея введения штрафа за нарушение ограничивающих условий задачи в виде штрафной функции, зависящей от штрафного параметра и обладающей следующими свойствами:

Х при нахождении переменных в допустимой области штрафная функция близка к нулю и достаточно быстро возрастает при выходе за ее пределы;

Х степень близости штрафа к нулю и скорость его возрастания зависят от значения штрафного параметра и увеличиваются с его ростом.

Рассмотрим общую задачу ПП (1.8), (1.7) на минимум:

З : min f (x).

xD Введем вспомогательную лоштрафованную целевую функцию F(x, ) = f(x) + Ф(x, ), где Ф(x, ) - штрафная функция, отражающая меру штрафа за нарушение ограничения xD и зависящая от положительного штрафного параметра .

В случае гладкой штрафной функции Ф(x, ) любая последовательность положительных чисел {k}, k +, приводит к соотношению Ф(x, k) 0, т.е.

обеспечивается лишь приближенная, асимптотическая редукция задачи З. В случае же негладких точных штрафных функций, введенных И.И. Ереминым и Зангвиллом (W.I. Zangwill), существует конечный точный штрафной параметр такой, что при любых множество решений условной оптимизационной задачи З с целевой функцией f(x) совпадает с множеством решений безусловной оптимизационной задачи с целевой функцией F(x, ), т.е. обеспечивается точная конечная редукция задачи З.

Исследования в области точных штрафных функций связаны с работами Киеля (K.C. Kiwiel), Ди Пило (G. Di Pillo), И.И. Еремина, А.М. Гупала, Ю.Г. Евтушенко, В.Г. Жадана, В.В. Шмелева, В.Ф. Демьянова, В.В. Федорова, Л.Н. Поляковой и др.

Обратимся к общей задаче ПП и положим, что D = GP; G, P Чn, где G - полиэдральное множество, задаваемое функциональными ограничениями в виде системы полиэдральных неравенств:

G = {xЧn : gi(x) 0, i = 1, m }, (1.12) а P - полиэдральное множество, задаваемое прямыми (интервальными) ограничениями, в виде простого параллелепипеда, определяющего двухсторонние границы изменения компонент вектора x:

P = {xЧn : xi xi xi, - xi < xi +, i = 1, n }. (1.13) Построим точные штрафные функции множеств G и P для освобождения от функциональных и прямых ограничений общей задачи ПП.

Поскольку каждая из полиэдральных функций gi(x) может быть представлена своим дизъюнктивным разложением:

qi gi(x) = ij(x), i = 1, m, j =где ij (x) - линейные функции, то полиэдральные неравенства (1.12) могут быть представлены эквивалентной системой линейных неравенств:

ij(x) 0, j = 1, qi, i = 1, m. (1.14) Введем срезки функций ij (x) :

+ ij (x) = max {ij(x), 0} = 0,5[ij(x) + |ij(x)|], j = 1, qi, i = 1, m, и объединим их в вектор-функцию : ЧnЧq1 +q2 +...+qm вида + + (x) = col (11(x), 12(x),..., + (x)).

mqm Как следует из работ Ю.Г. Евтушенко и В.В. Федорова, в качестве точных штрафных функций множества G достаточно взять lp-норму (норму Гельдера) вектор-функции (x) для двух значений параметра p: p = 1 и p = :

q q m m i i ФG1(x, ) = ||(x)||1 = + (x) = max{ (x), 0}, (1.15) ij ij i=1 j =1 i=1 j =+ ФG(x, ) = ||(x)|| = max max {ij (x)} = max {gi (x), 0}. (1.16) i[1 : m] j[1 : q ] i[1 : m] i Аналогичным образом строятся точные штрафные функции множества P:

n ФP1(x, ) = [max{(xi - xi ), 0} + max{(-xi + xi ), 0}], (1.17) i=ФP(x, ) = max {(xi - xi ), (-xi + xi ), 0}. (1.18) i[1 : n] Нетрудно видеть, что сепарабельные ФG1(x, ) и ФP1(x, ), а также несепарабельные ФG(x, ) и ФP(x, ) точные штрафные функции вида (1.15)-(1.18) являются полиэдральными функциями, порожденными соответственно полиэдральными октаэдрической и кубической нормами.

Введем лоштрафованные целевые полиэдральные функций:

F1(x, ) = f(x) + ФG1(x, ) + ФP1(x, ), F(x, ) = f(x) + ФG(x, ) + ФP(x, ).

Предложение. Пусть задача З разрешима. Тогда при использовании полиэдральных штрафных функций (1.15)-(1.18) существует точный штрафной параметр , т.е. для любых задача условной полиэдральной оптимизации З и вспомогательные задачи безусловной полиэдральной оптимизации с целевыми функциями F1(x, ) и F(x, ) эквивалентны:

min {f(x) : xD} = min {F1(x, ) : xЧn} = min {F(x, ) : xЧn};

arg min {f(x) : xD} = arg min {F1(x, ) : xЧn} = arg min {F(x, ) : xЧn}. В результате, любой численный метод однократного решения вспомогательной задачи полиэдральной оптимизации при любом точном штрафном параметре = служит также методом решения исходной задачи ПП.

Элементы полиэдрального исчисления. ПИ - специальный раздел выпуклого анализа, занимающийся исследованием дифференциальных свойств полиэдральных функций, включая локальное поведение и условия их экстремума.

Показано, что полиэдральные функций относятся к классу субдифференцируемых функций. Приводятся основные положения лисчисления субдифференциалов выпуклых негладких функций.

Проведен анализ дифференциальных и экстремальных свойств полиэдральных функций на основе использования их дизъюнктивного разложения и формул субдифференцирования функций поточечного максимума, полученных Данскиным (J.M. Danskin) и В.Ф. Демьяновым. Результаты данного анализа отражают следующие теоремы.

Теорема 1.6. Для субдифференциала полиэдральной функции (1.1) справедливо выражение f(x) = conv {ak, kI(x)}, где I(x) = {k[1: m] : k(x) = f(x)}, (1.19) т.е. любой субградиент функции pf(x) представим выпуклой комбинацией p = (1.20) k ak, k I ( x) где k = const 0, k = 1. k I ( x) Теорема 1.7. Точка x* является минимумом полиэдральной функции вида (1.1) при выполнении условия max [- ak, al ] > 0. (1.21) k, l I ( x*) В главе обсуждаются особенности применения Глава 2. Численные методы современных вычислительных технологий к задачам безусловной полиэдральной оптимизации.

безусловной полиэдральной Рассматриваются приближенные методы решеопмизации ния данных задач на основе технологий соответственно жестких и мягких вычислений.

Задача безусловной полиэдральной оптимизации - задача на минимум min f(x) (2.1) для полиэдральной функции f :=Чn Ч.

Данную задачу можно решать на базе одного из изложенных выше методов редукции к задачам ЛП, воспользовавшись в итоге точными методами ЛП, гарантирующими нахождение решения за конечное число шагов. Однако, в случае высокой размерности задачи и большой структурной сложности целевой функции f(x) менее трудоемкими могут оказаться приближенные бесконечношаговые методы оптимизации. При этом, несмотря на богатый спектр последних, Ф.П. Васильев и Ю.Г. Евтушенко подчеркивают, что луниверсального метода пока нет, и вряд ли он существует и не поиск универсального метода, а разумное сочетание разнообразных методов позволит с наибольшей эффективностью решать данные задачи.

Автором предлагаются два альтернативных метода вычисления экстремума полиэдральной функции - субградиентный метод оптимизации, реализующий непрямой метод жестких вычислений (Hard Computing) и эволюционный метод оптимизации, реализующий прямой метод мягких вычислений (Soft Computing). Данные методы целесообразно комбинировать в единой технологии негладкой оптимизации: сначала эволюционным методом осуществляется глобальный поиск грубого решения задачи, а затем на его основе субградиентным методом осуществляется локальный поиск ее точного решения.

Субградиентный метод оптимизации. Начало численным методам негладкой оптимизации положили методы субградиентного спуска, получившие развитие в работах Н.З. Шора, И.И. Еремина, Н.Н. Астафьева, Ю.М. Ермольева, М.А. Шепилова, Б.Т. Поляка, П.Р. Гамбурга, Е.Г. Гольштейна, А.С. Немировского, В.Ф. Демьянова, Л.В.

Васильева, Д.Б. Юдина, Ю.Е. Нестерова, В.И. Билецкого, В.И. Гершовича, А.П. Лиховида, Н.Г. Журбенко, В.А. Скокова, М.Б. Щепакина, Гоффина (L.I. Goffin), Митта (K.A.

Mitter), Берцекаса (D.P. Bertsecas), Хелда (M. Held), Волфа (P. Wolfe) и др.

В диссертации предложен субградиентный метод оптимизации, являющийся развитием традиционного субградиентного метода спуска применительно к задачам безусловной полиэдральной оптимизации (2.1).

В методе спуска строится минимизирующая последовательность точек {x(t), t = 0, 1, 2, Е}, обеспечивающая монотонного убывание целевой функции f(x(0)) > f(x(1)) > Е > f(x(t)) > Е.

Выбирается произвольное начальное приближение x(0)Чn, а следующие приближения находятся по рекуррентной формуле x(t) = x(t - 1) + x(t), где t = 1, 2, Е, x(t) - вектор спуска:

x(t) = - v(t)p(t).

Скаляр v(t) задает темп спуска на t-м шаге, а вектор p(t) является субградиентом целевой функции и вычисляется по формулам (1.20), (1.19), в которых весовые множители k, kI(x), можно принять равными:

k =1/ |I(x) |, где | I(x) | - мощность множества индексов I(x).

Для алгоритмизации метода спуска необходимо учесть погрешности вычислений и формализовать правило остановки итерационного процесса.

Задавая допустимую погрешность I > 0 выполнения приближенного равенства k(x) f(x), приходим к следующей модификации выражения для определения доминирующих базисных функций (1.19):

I(x) = {k : 1 k N, k(x) f(x) - I}. (2.5) Зададим допустимую погрешность f > 0 вычисления экстремума и опишем два возможных способа остановки вычислительного процесса.

В первом способе остановки вычисления заканчиваются при зацикливании с малыми изменениями целевой функции, для выявления которого анализируется отрезок минимизирующей последовательности длины n. Вычислительный процесс останавливается в точке x(T) при выполнении условий:

1) f(x(T )) f(x(T - 1));

2) | f(x(t)) - f(x(t - 1)) | < f при T t < T + ;

3) f(x(T )) f(x(T + )).

Найдена нижняя грань для темпа спуска, гарантирующая соблюдение требуемой точности вычислений при приближении к искомой точке минимума:

0 = / max || ai ||.

f 1i N Во втором способе остановки в соответствии с условием экстремума (1.21) вычислительный процесс заканчивается в момент t = T, если max [- ak, al] > f.

k, l I ( x(T )) Введенные погрешности I и f должны удовлетворять условию: I f.

Приводятся алгоритм, реализующий изложенный метод спуска, и результаты его исследования на модельных примерах.

Нейросетевая реализация субградиентного метода оптимизации. Обсуждается реализация предложенного субградиентного метода спуска в нейросетевом логическом базисе, обеспечивающая значительное ускорение решения оптимизационной задачи за счет распараллеливания вычислений.

Искусственная нейронная сеть периодического функционирования, адекватная субградиентному методу спуска, включает следующие шесть слоев:

Первый (входной) слой вычисляет значения линейных базисных функций i(x) в дизьюнктивном разложении (1.1) целевой полиэдральной функции f(x), каждой из которых соответствует нейрон с линейной функцией активации:

n ui = ij j w x, i = 1, N, x0 = 1, wij = аij.

j = Второй слой вычисляет значение целевой полиэдральной функции (1.1) и состоит из нейрона-дизъюнктора, выделяющего максимальный сигнал:

y = u1u2ЕuN = max {u1, u2, Е, uN}.

Третий слой - персептронный - предназначен для распознания доминирующих нейронов первого слоя посредством сравнения выходных сигналов нейронов первого слоя и нейрона-дизъюнктора в соответствии с (2.5).

Четвертый слой вычисляет направление спуска по весам доминирующих нейронов согласно (1.20), используя выходы предыдущего слоя.

Пятый слой вычисляет очередной шаг изменения x(t) предыдущего приближения x(t - 1).

Шестой (выходной) слой вычисляет координаты новой точки поиска x(t), т.е. скорректированного приближения и эта информация на следующем такте подается на вход первого слоя по цепям обратной связи.

На нулевом такте на входной слой нейронной сети подаются сигналы, соответствующие начальному приближению x(0), а на последнем такте ее выходной слой выдает искомый ответ: x(T ) x*.

Дается алгоритмическая реализация нейросетевого метода спуска.

Эволюционный метод оптимизации. Эффективным инструментом полиэдральной оптимизации являются эволюционные вычисления (ЭВ), основными достоинствами которых являются: простота реализации, быстродействие поиска, адаптируемость, робастность и внутренний параллелизм.

Методы ЭВ базируются на некоторых формализованных принципах эволюции популяции виртуальных особей в окружающей среде, в качестве которых принимаются соответственно произвольные альтернативные решения оптимизационной задачи и ее условия. Приспособленность каждой особи к окружающей среде характеризуется функцией приспособленности, в качестве которой выступает целевая функция и задача оптимизации состоит в ее максимизации, т.е. нахождении наиболее приспособленного решения. Здесь многошаговый процесс поиска имитирует основной механизм природной эволюции - естественный отбор в сочетании с наследственной изменчивостью, следуя принципу выживает наиболее приспособленный среди альтернативных вариантов решения. На каждом шаге поиска используется набор поисковых генетических операторов, основными из которых являются: мутация, обеспечивающая изменение одного решения, рекомбинация (кроссовер, кроссинговер), обеспечивающая перекомпоновку пары решений, и отбор (селекция, репродукция). В результате применения данных операторов происходит выращивание (поиск) популяции особей с наилучшими показателями приспособленности.

Среди направлений ЭВ наибольшее применение в практике оптимизации находят т.н. эволюционные стратегии (ЭС), предложенные Рехенбергом (I. Rechenberg) и Швефелем (H.-P. Schwefel), а так же генетические алгоритмы (ГА), сформулированные Фразером (A.S. Fraser), Бремерманом (H.J. Bremermann), Холландом (J.H. Holland), Де Джонгом (K.A. De Jong) и оформленные Гольдбергом (D.E. Goldberg).

В диссертации предложен эволюционный метод оптимизации, являющийся модификацией комбинированной схемы ЭС и ГА Ю.В. Федотова и имеющий следующие принципиальные особенности:

Х особь рассматривается как вектор искомых переменных, т.е. используется явное представление альтернативных решений, характерное для ЭС;

Х размер популяции особей фиксирован и не меняется в процессе поиска;

Х поиск решения осуществляется парой родительских особей, формируемой на основе панмиксии с нормальным законом распределения;

Х разнообразие популяции особей достигается за счет стандартных генетических операторов - универсальной равномерной рекомбинации, характерной для ГА, и абсолютной аддитивной мутации, характерной для ЭС;

Х используется элитная селекция с вытеснением, осуществляемая по целевой функции исходя из репродукционной популяции предки + мутанты;

Х для ускорения процесса поиска решения предусмотрена адаптация интенсивности мутации, характерная для ЭС.

Предложенный метод фактически реализует комбинацию стохастических переборного и градиентного методов: механизмы рекомбинации и мутации отвечают поисковой схеме переборного метода, а механизм селекции - поисковой схеме градиентного метода. Дана алгоритмическая реализация метода.

Согласно следствию известной теоремы No Free Lunch (D.H. Wolpert & W.G.

Macready), единственным способом сокращения времени и повышения качества эволюционного поиска является специализация схемы поиска, т.е. настройка основных ее параметров под конкретный класс целевых функций.

Для автоматизированной настройки параметров алгоритма эволюционной оптимизации разработано специальное программное средство ESGA с широкими библиотеками генетических операторов и тестовых функций, позволяющее в интерактивном режиме конструировать различные схемы поиска на основе ЭС и ГА. Компьютерное исследование предложенной базовой схемы эволюционного поиска и 16-ти вариантов ее конфигураций, проведенное на тестовых функциях Растригина, Розенброка и ступенчатой функции, позволило найти наиболее эффективную (в два раза эффективней прототипа) схему поиска.

В главе выделяется класс задач полиэдГлава 3. Формализация задач полиральной оптимизации дискретных проэдральной оптимизации дискретных цессов управления. Предложена полипроцесссов управления эдральная методология формализации терминальной цели управления, критерия качества управления, а также требований к фазовым и ресурсным ограничениям.

Общая задача оптимального дискретного управления. Полагаем, что динамика объекта управления описывается векторным разностным уравнением x(t +1) = f(t, x(t), u(t)), (3.1) где tT, T =[0 :T -1]+ - интервал управления, T 1 - терминальный момент времени; x = col(x1, x2, Е, xn)=Чn и u = col(u1, u2, Е, ur)Чr - векторы переменных состояния и управления соответственно; f : TЧnЧrЧn; - пространство состояний; + - множество неотрицательных целых чисел. В случае линейной модели динамики объекта уравнение (3.1) принимает вид x(t + 1) = A(t)x(t) + B(t)u(t), (3.2) где A: T Чnn и B: T Чnr - функциональные матрицы.

Цель управления заключается в переводе состояния объекта за время T в некоторое целевое множество состояний с учетом заданных фазовых и ресурсных геометрических ограничений:

+ x(t)x, tT ; (3.3) u(t)u, tT, (3.4) + где T =[1:T ] ; x Чn и u Чr - допустимые множества значений вектора состояния и вектора управления соответственно, причем обычно, = { x }.

Процесс управления представляет собой совокупность реализаций управляющего воздействия - программы управления U = {u(t), tT } и порожденной + им фазовой траектории движения объекта X = {x(t), tT }. При этом управляющее воздействие реализует программно-позиционную стратегию управления, предложенную Дрейфусом (S.E. Dreyfus), в виде гибких, циклически обновляемых (в частности, на каждом такте), программ.

Пусть качество процесса управления оценивается скалярным критерием F = F(X, U). (3.5) Общая задача оптимального дискретного управления заключается в нахождении управляющего воздействия U, при котором процесс управления, т.е.

пара (U, X), удовлетворяет ограничениям (3.3), (3.4) и обеспечивает экстремальное (минимальное или максимальное) значение критерию (3.5):

F extr.

Формализация задач полиэдральной оптимизации процессов управления основывается на полиэдральных конструкциях ключевых элементов в постановке задачи: цели управления, оптимизируемого критерия качества процесса управления, фазовых и ресурсных ограничений на управляемые движения.

Важнейшим этапом формализации задачи оптимального управления является выбор критерия качества процессов управления. Обсуждается негативная роль АКОР и связанная с этим фитишизация квадратичных критериев качества процессов управления, не имеющих ясного физического смысла. Более содержательную и продуктивную альтернативу для теории и практики автоматических систем открывают полиэдральные критерии качества. В связи можно надеяться на грядущую смену парадигмы квадратичной оптимизации на парадигму полиэдральной оптимизации.

Полиэдральные критерии качества. Обсуждается методология формализации полиэдральных критериев качества в задачах управления с заданным целевым состоянием объекта x.

Критерии должны учитывать динамическую структуру фазовых траекторий и стоимость ресурсов управления. Введем величины (t) = x(t)- x, x(t) = x(t + 1) - x(t), u(t) = u(t + 1) - u(t).

и выберем некоторые полиэдральные нормы:

H: Ч; Hx: Ч; Hu: С Ч; Hu: С Ч.

Процессы управления в текущий момент времени можно характеризовать точечными показателями точности управления и затрат на управление, имеющими полиэдральную структуру и представляющими собой комбинацию величин H((t)), Hx(x(t)), Hu(u(t)), Hu(u(t)). Возможные варианты показателей:

полиэдральные показатели точности управления:

P(t) = (t)H((t)) + x(t)Hx(x(t));

P(t) = max {(t)H((t)), x(t)Hx(x(t))}, полиэдральные показатели затрат на управление:

E(t) = u(t)Hu(u(t)) + u(t)Hu(u(t));

E(t) = max {u(t)Hu(u(t)), u(t)Hu(u(t))}, где (t) 0, x(t) 0, u(t) 0, u(t) 0 - заданные весовые коэффициенты.

Из введенных точностных и ресурсных показателей можно формировать различные полиэдральные критерии качества управления, например:

Х полиэдральный критерий майеровского типа (терминальный критерий):

F = P(T ) ;

M Х полиэдральные критерии лагранжевого типа (интегральные критерии):

T T -F = L P(t)+E(t) ;

t =1 t =F = max P(t)+ max E(t);

L + tT tT + F =max({P(t),tT } {E(t),tT });

L Х полиэдральные критерии больцевского типа (смешанные критерии):

FB = FM + FL, причем здесь предполагаются формальные соотношения:

x(T + 1) = x(T), u(T) = u(T - 1).

Весьма перспективны для задач оптимальной стабилизации критерии:

T -F = (3.6) Q(x(t),x(t),u(t),u(t)) ;

t =F = max Q(x(t),x(t),u(t),u(t)), (3.7) 0t T -где Q(x, x, u, u) = 1(t)q1(x(t)) + 2(t)q2(x(t)) + 3(t)q3(u(t)) + 4(t)q4(u(t)), q1: ЧnЧ, q2: ЧnЧ, q3: ЧrЧ и q4: ЧrЧ - некоторые положительно однородные полиэдральные функции; i(t) 0 - весовые коэффициенты, причем 1(t) + 2(t) + 3(t) + 4(t) > 0, t =0,T-1.

В частности, можно положить:

q1(x)=|x1|+|x2 |+...+|xn |, q2(x)=0, q3(u)=|u1|+|u2 |+...+|ur |, q4(u)=0 ;

1(t) = t ( +), 3(t) 1.

Полиэдральные критерии (3.6) и (3.7) обобщают критерии, предложенные Ю.Г.

Бандаросом и В.К. Шабловским, и получившие развитие в работах А.А. Красовского, Б.М. Миркина, В.А. Шишлякова, М.Х. Гандельмана, Г.И. Ванюрихина и В.М. Иванова.

Особый интерес представляет полиэдральный критерий вида:

F = max || x(t) || = max max |xi (t)|, 1t T 1t T i[1 : n] имеющий смысл максимальной динамической ошибки системы стабилизации и именуемый в литературе критерием равномерного приближения, максимального уклонения, или критерием Чебышева. Его ограничение гарантирует, что переменные состояния не превысят заданных пределов. Впервые данный критерий был применен к задачам оптимального управления в 1956 г. в работе Беллмана (R.E. Bellman), Гликсберга (I. Glicksburg) и Гросса (O. Gross). Впоследствии особую важность его для прикладных задач управления неоднократно подчеркивали практически все ведущие отечественные и зарубежные ученые.

Другим весьма распространенным критерием полиэдрального типа является критерий сумма модулей:

n F = max xi (t) |.

| 1tT i=Различие между полиэдральными критериями (3.6) и (3.7) обусловлено различием между октаэдрической и кубической нормами || x ||1 и || x ||.

Чебышевский критерий качества процессов управления не получил широкого применения из-за отсутствия конструктивных методов решения порождаемых им оптимизационных задач. А.А. Первозванский особо подчеркивал, что задачи такого рода являются наиболее сложными в вычислительном отношении. Настоящее диссертационное исследование направлено, в частности, на возрождение интереса к данным критериям и дальнейшее их развитие на основе полиэдральной методологии.

Полиэдральные терминальные цели управления. Положим, что целе вое множество имеет полиэдральную структуру. Тогда его можно описать в форме полиэдрального неравенства:

= {x : H(x(T)) p}, где H : Ч - некоторая полиэдральная функция; p = const.

В задачах терминального управления возможны два варианта формализации терминальной цели управления в терминах ПП: жесткие критериальные ограничения, либо требование критериальной оптимальности.

В первом варианте необходимо точное попадание терминального состоя ния объекта в целевое множество: x(T) . Данное требование может быть записано в виде терминального условия полиэдральной структуры P(x(T)) = H(x(T)) p.

Во втором варианте необязательно точное попадание терминального состояния в целевое множество. Введем полиэдральный критерий промаха вида P(T) = (x(T), ), где 0 при x ;

(x, ) = H((x) - p при x .

Тогда терминальное требование воплощается в экстремальной форме:

P(T) min.

Полиэдральные фазовые и ресурсные ограничения. Данные ограничения могут быть сформулированы в виде линейных, либо полиэдральных неравенств и/или равенств, например, вида + P(x(t)) p(t), tT ; (3.8) E(u(t))q(t), tT, (3.9) где P: Ч и E: С Ч - некоторые полиэдральные функции.

Частным случаем полиэдральных фазовых и ресурсных ограничений являются естественные прямые двусторонние ограничения вида xi xi (t) xi, i =1,n ; ui ui (t)ui, j =1,r.

Данные неравенства эквивалентны неравенствам (3.8), (3.9), если положить P(x)=max(max(-xi + xi), max(xi - xi)), p(t)0, 1in 1in E(u)=max(max(-ui + ui), max(ui -ui)), q(t)0, 1ir 1ir В ряде задач управления необходимы плавные управляющие воздействия, что требует сужения класса допустимых управляющих воздействий путем учета т.н.

приемистости управления, т.е. введения ограничений не только на величину, но и на скорость изменения управляющих переменных:

u u (t)u, j =1,r, где u (t)=u (t +1)-u (t).

j j j j j j Постановка общей задачи полиэдральной оптимизации дискретных процессов управления. На базе введенных полиэдральных конструкций формулируется общая задача полиэдральной оптимизации дискретных процессов управления: для объекта (3.1) требуется найти управляющее воздействие u(t), обеспечивающее достижение цели управления:

F = F (X,U)extr, с учетом критериальных, фазовых и ресурсных ограничений:

Gi (X,U) gi, i =1,mg, + Pj (x(t)) p, j =1,mp, tT, j Ek (u(t))qk, k =1,mq, tT.

В случае, когда модель динамики объекта является линейной (3.2) данная задача является задачей полиэдральной оптимизации и, в силу своей полиэдральной структуры, относится к классу задач ПП.

В главе предлагается новый тип стратеГлава 4. Полиэдральная стратегия гий управления - полиэдральные стратедискретного упреждающего управгии дискретного упреждающего управлеления ния динамическими объектами в условиях ресурсных ограничений. В основу положена идея объединения многошагового прогнозирования управляемого движения объекта, метода функций Ляпунова и управления по методу наискорейшего спуска.

Обсуждается ретроспектива и современное состояние исследований в области управления с прогнозом. Отличительной особенностью современных методов многошагового упреждающего управления является оптимизация процесса управления на скользящем интервале.

Идея и особенности полиэдральной стратегии дискретного упреждающего управления. Рассматриваемый класс линейных дискретных объектов управления описывается векторным разностным уравнением состояния вида x(t +1)= Ax(t)+Bu(t), x(0)= x0, где t+; x = Чn, uСЧr; A Чnn, B Чnr. Область допустимых управлений С - r-мерный параллелепипед: С={u=col(u1,u2,...,ur )| ui ui ui, i =1,r}.

Решается задача стабилизации целевого состояния объекта x =0.

Будем осуществлять управление посредством экстраполяции движения объекта на T шагов вперед. Пучок всех возможных траекторий движения в последующие T периодов, исходящих из текущего состояния x(t) = x, можно описать дискретной формулой Коши:

(t + )= A x + A-Bv(), =1,T, =где v С. Далее T (x) - множество состояний объекта, достижимых из состояния x не более чем за T шагов.

Поскольку стабилизация означает демпфирование возмущенного движения объекта, то процессу стабилизации можно придать экстремальные свойства. Введем критерий удаленности состояний от целевого состояния x =0 - некоторую выпуклую положительно определенную функцию Q(x):

Q(0) = 0; Q(x) > 0, x 0.

Упреждающее управление с многошаговым прогнозом сводится к оптимизации движения по данному критерию в пределах горизонта прогнозирования: сначала в каждый момент времени решается задача условной оптимизации V (x)= min Q(x)= min min Q((t + )), (4.1) T ( x) [1:T ] v[1:T ] где v[1 : T] = {v() С | = 1,T }, а затем определяется точка прицеливания x, лежащая на экстремальной траектории и являющаяся ближайшей к целевому состоянию в смысле метрики Q(x):

Q( x ) = V(x) при V(x) > 0; x = 0 при V(x) = 0.

На очередном такте управления движение объекта направляется по экст ремальной траектории, ведущей в точку прицеливания x :

u(t) = v(1), причем среди альтернативных экстремальных траекторий выбирается та, которая обеспечивает наискорейшее попадание в данную точку.

На каждом такте управления расчетная процедура повторяется, т.е. осуществляется луправление со скользящим интервалом прогноза.

Основные особенности изложенной стратегии упреждающего управления:

стратегия реализует известный метод наискорейшего спуска, формируя движение объекта в пределах горизонта прогноза к минимуму целевой функции;

стратегия относится к классу немонотонных стратегий управления, теория которых, как подчеркивает Д.А. Поспелов, находится в зачаточном состоянии и не разработаны сколь-нибудь общие подходы к их формированию;

стратегия является программно-позиционной, формирующей управление по принципу алгоритмической обратной связи.

В известном обзоре Моска (E. Mosca), опубликованном в журнале Automatica (2005, V. 41, No 1), в ссылке на работу автора подчеркивается уникальность использования идеи переменного горизонта прогноза в задачах упреждающего управления.

Применение полиэдральной парадигмы к стратегии дискретного упреждающего управления. Вычислительная реализация упреждающего управления сводится к решению задачи условной оптимизации (4.1) и определяется выбором целевой функции Q(x). При выборе последней из класса полиэдральных функций решаемая задача является задачей ПП.

Дано теоретическое обоснование предложенной стратегии упреждающего управления. Изложены варианты ее обобщения на класс нелинейных дискретных динамических объектов. Алгоритмизация упреждающего управления основана на сведении решаемой задачи к задачам ЛП. Приведены иллюстративные примеры синтеза дискретного упреждающего управления.

В главе развивается полиэдральный подГлава 5. Полиэдральный подход к ход к дискретным задачам стабилизации дискретным задачам стабилизации динамических объектов. На его основе разработаны регулярные методы решения задач предельного быстродействия, стабилизирующего и барьерного управлений с учетом фазовых и ресурсных ограничений.

Задачи предельного быстродействия. Объект управления описывается уравнением x(t + 1) = Ax(t) + Bu(t), (5.1) t+; x= Чn; uС Чr; AЧnn, BЧnr.

В общей постановке задачи оптимального по быстродействию управле ния требуется перевести объект из начального состояния x(0) = x0 (x0 ) в це левое множество за кратчайшее время:

З : x(T ) , T min, в условиях заданных фазовых и ресурсных ограничений.

Данная задача занимает ключевое место теории оптимального управления и актуальна для многих инженерных приложений. В диссертации предложен новый, полиэдральный подход к ее формализации и решению.

Полиэдральная формализация задачи предельного быстродействия предполагает полиэдральную структуру целевого множества и ограничений на управляемое движение:

: G(x(T )) g, (5.2) x : P(x(t)) p(t), 1 t T -1;

u : Q(u(t)) q(t), 0 t T -1, где G : Ч, P : Ч, Q : СЧ - полиэдральные функции, g = const.

Для решения задачи З используется основополагающий для метода динамического программирования принцип инвариантного погружения многошагового процесса, согласно которому исходная оптимизационная задача погружается в семейство вспомогательных терминальных задач:

ЗT : G(x(T )) min, T = 1, 2, 3, Е, последовательно решаемых до тех пор, пока не будет достигнута цель управления (5.2). Таким образом, оптимальное время управления T = min {T : G(x(T )) g}, причем решение задачи ЗT* даст решение исходной задачи З.

Поскольку терминальное состояние объекта x(T ) определяется формулой T -T --x(T ) = ATx(0) + A Bu(), =то критерий качества G(x(T )) является полиэдральным функционалом программы управления u(), в силу чего ЗT является задачей ПП на минимум.

В итоге, использование аппарата ПП позволяет свести решение исходной задачи предельного быстродействия к решению семейства задач ЛП.

В задаче предельного быстродействия с целевым состоянием = { x } выбирается полиэдральная метрика dist (x, x) (x, x), которая принимается в качестве целевой функции G(x) = dist (x, x ) и исходная двухточечная задача управления погружается в семейство полиэдральных терминальных задач G(x(T )) min, итерационная схема решения которых продолжается до выполнения условия dist (x(T), x*) = 0.

Целевому состоянию x = 0 отвечает задача стабилизации, обеспечивающая демпфирование возмущенного движения за кратчайшее время.

Полиэдральные функции Ляпунова и задачи стабилизации. Расширение сферы применения второго метода Ляпунова в теории автоматического управления связано с расширением класса функций Ляпунова (ФЛ). Наряду с ФЛ типа квадратичных форм рассматриваются также ФЛ иного типа: однородные формы, модуль линейной формы, взвешенная сумма модулей, кусочно-квадратичные функции. В середине 1990-х гг. автором предложен класс полиэдральных функций Ляпунова.

Рассмотрим класс дискретных систем x(t +1) = f (x(t)), (5.3) где t+; x = Чn; f : .

Полагаем, что начало координат x = 0 является положением равновесия:

f (0) = 0.

Пусть D - некоторая область, включающая начало координат, а V(x) - скалярная функция, которая определена и непрерывна в D, обращается в нуль в начале координат и является положительно определенной.

При выполнении условия V(x(t +1)) < V(x(t)), (5.4) положение равновесия системы (5.3) асимптотически устойчиво и функция V(x) именуется функцией Ляпунова, ассоциированной с данной системой.

Ясно, что для объекта управления, охваченного обратной связью, ассоциированный с ним класс ФЛ определяется выбором обратной связи.

Пусть исследуется класс линейных систем:

x(t +1) = Ax(t). (5.7) Асимптотическая устойчивость положения равновесия x = 0 имеет место тогда и только тогда, когда спектр матрицы A лежит строго внутри единичного круга. В этом случае условие (5.4) записывается в виде V(A(x)) < V(x). (5.8) Пусть функция V(x) обладает свойствами полиэдральной нормы и Pc - полиэдр, ограниченный поверхностью уровня V(x) = с > 0:

Pc = {x : V(x) с}, ((0) ((0) с множеством вершин Pc, причем Pc = { x[], = 1,M }.

Теорема 8 (узловой критерий устойчивости). Если во всех вершинах ((0) xPc полиэдра Pc выполняется условие (5.8):

V(Ax[]) < c ( = 1,M ), (5.9) то система (5.7) устойчива. Для полиэдральной ФЛ вида V(x) = max (x), (x) = d, x , d, = 1, N, 1 N полиэдральные неравенства (5.9) принимают вид линейных неравенств:

d, Ax[] < с = 1, N, = 1,M.

Посредством аппарата полиэдральных ФЛ и узлового критерия устойчивости решается обратная задача робастности - определение максимально возможных допусков на параметры, обеспечивающих устойчивость системы.

Показывается продуктивность применения аппарата полиэдральных ФЛ к исследованию процессов стабилизации. В частности, для класса линейных объектов (5.1) развивается метод решения задач стабилизации, основанный на применении полиэдральных ФЛ V(x) и формировании алгоритмической обратной связи посредством решения задачи полиэдральной оптимизации:

u = arg min V(Ax + Bu).

uС Данный метод распространяется и на нелинейные объекты, линейные по управлению (класс аффинных систем) вида x(t +1) = g(x(t)) + B(x(t))u(t), где g : и B : С.

Задачи барьерного управления. Средства защиты технических объектов управления от недопустимых возмущений нормальных (штатных) режимов их функционирования (для предотвращения критических режимов и аварийных ситуаций) принято называть автоматами ограничений или автоматами безопасности. Среди работ, посвященных синтезу автоматов ограничений, выделяются работы А.А. Красовского и В.Н. Букова, связанные с лоптимальным удержанием движения объекта в допустимой области путем штрафования критерия оптимальности за выход из этой области.

В диссертации предложена концепция двухрежимного автомата ограничений состояния управляемых динамических объектов, обеспечивающего в критических ситуациях скорейшее возвращение их состояния в область нормы.

В основу предложенной концепции автомата ограничений положены следующие соображения. В пространстве состояний управляемого объекта выделяются две области: рабочая G, которая отвечает его нормальному (штатному) режиму функционирования, и аварийная \G, соответствующая его аварийному (нештатному) режиму функционирования. Поскольку реализовать непроницаемую границу между рабочей и аварийной областями практически невозможно, то ставится более реалистичная задача создания проницаемой границы - защитного динамического барьера, охватывающего рабочую область G и препятствующего движению объекта вне ее. Требование безопасности функционирования объекта сводится к требованию минимизации времени выхода и глубины его проникновения в аварийную область \G, а функциональное назначение автомата ограничений - скорейшее возвращение объекта в рабочую область G. Действие автомата ограничений рассматривается с позиций двухрежимного управления: в рабочей области действует штатное управляющее устройство, а в аварийной области - барьерное управляющее устройство, создающее для движения объекта соответствующий защитный барьер.

Ставится задачи барьерного управления как задача обеспечения минимума времени пребывания объекта в аварийной области \G и развивается полиэдральная стратегия упреждающего барьерного управления линейными динамическими объектами (5.1) в условиях ресурсных ограничений.

Если рабочая область G задана полиэдральным неравенством:

G = {x | Q(x) 0}, где Q(x) - порлиэдральная функция, то основу алгоритма формирования барьерного управления составляют следующие задачи. Сначала для промежуточных горизонтов прогнозирования t + , = 1, 2, Е последовательно решаются задачи планирования траекторий управляемого движения объекта x (t), которые за время приближают его текущее состояние x(t) \ G к рабочей зоне G на минимально возможное расстояние:

Q+( x (t + )) = max {Q( x (t + )), 0} min.

Затем решается задача нахождения горизонта прогнозирования t + T, обеспечивающего попадание планируемой траектории в рабочую область G:

Q+( x (t + T )) = 0.

В главе дается полиэдральная постаГлава 6. Полиэдральная оптимизация новка и предлагаются методы решедискретных процессов управления и ния для ряда дискретных задач ананаблюдения в условиях неопределен- лиза и синтеза систем управления в ности условиях неопределенности.

Современная наука управления приблизилась к границе, за которой, по выражению Негойцэ (C.V. Negoita), существенную роль начинают играть способы учета неопределенностей, т.е. возмущающих факторов, препятствующих достижению цели управления, информация о которых заранее неизвестна (текущие значения неконтролируемы, а будущие непредсказуемы). Ограничимся рассмотрением класса аддитивных, регулярных возмущающих факторов, порождающих природную (по терминологии Ю.Б. Гермейера) неопределенность, отражающую неполноту знаний, их недостоверность, а также нечеткость и неточность, относящихся к их содержанию.

Смена парадигм неопределенности и принцип гарантированного результата. В теории управления долгое время доминировала стохастическая парадигма неопределенности. Основное заблуждение ее сторонников связано с отождествлением неопределенности и случайности. Однако, неопределенность - это не случайность. Как утверждает Касти (J. Casti): нет априорных математических оснований полагать, что механизм, порождающий неопределенность, по своей природе непремен но стохастичен. В литературе общепризнанно считать неопределенными величины, для которых не обнаруживается статистическая устойчивость. Возмущающие факторы, порождающие неопределенность, как правило, не относятся к классу повторяемых и не обладают свойством статистической устойчивости. Это обстоятельство явилось основанием для резких высказываний Калмана (R.E. Kalman): Мы должны отрицать, что классические вероятностные структуры класссической теории вероятностей, на самом деле, имеют научное отношение к описанию неопределенности и Н.Н. Моисеева: Стохастические задачи, т.е. задачи, содержащие случайные величины или функции, мы не относим к числу задач, содержащих неопределенные факторы.

В последние десятилетия происходит смена парадигмы неопределенности в сторону ее детерминистических моделей. Важную роль в этом процессе играет принцип гарантированного результата: принимая решение в условиях неопределенности, надо всегда рассчитывать на худшее стечение обстоятельств и принимать то решение, которое дает в этих обстоятельствах максимальный эффект. Данный принцип в наиболее общем виде впервые сформулирован Ю.Б. Гермейером и получил развитие применительно к задачам управления и обработки информации в работах Н.Н. Красовского, А.Б. Куржанского, Н.Ф. Кириченко, Б.Н. Бублика, Ф.Л. Черноусько, А.А. Меликяна, А.И. Субботина, А.Г. Ченцова, Н.Н. Моисеева, В.М. Кунцевича, М.М. Лычака, А.Г. Сухарева, В.М. Кейна, А.Е. Барабанова, Ю.П. Петрова, О.М. Куркина, А.Ф. Шорикова, А.В.

Небылова, Э.Я. Рапопорта, В.В. Александрова, В.Д. Фурасова.

Экстремальные возмущающие факторы. Рассматривается задача определения возмущающих факторов, оказывающих наихудшее действие на процессы стабилизации.

Объект управления описывается линейным разностным уравнением x(t + 1) = A(t)x(t) + B(t)u(t) + H(t)(t), (6.1) где tT = [0 : T-1]+ (T 1); x = Чn; uЧr - управление; Чq - возмущение;

A(t)Чnn, B(t)Чnr, H(t)Чnq.

Пусть цель управления заключается в терминальной стабилизации равновесного состояния x = 0 посредством обратной связи u(t) = - K(t)x(t), K(t)Чrn. (6.2) Управляемое движение объекта x(t) определяется равенством t -x(t) = Ф(t, 0)x(0) + Ф(t, + 1) H()(), =где Ф(t, ) - переходная матрица состояний системы (6.1)-(6.2).

Полагаем, что неизвестные начальное состояние x(0) и возмущающее воздействие (t) удовлетворяют ограничениям:

x(0)X0, (t) (tT), причем области неопределенности X0 и имеют полиэдральную структуру.

Качество стабилизации характеризуется полиэдральным критерием E = max || x(t) || = max max | xi(t) |.

t[1:T ] t[1:T ] i[1 : n] Введем кортеж v = (x(0), (0), (1), Е, (T - 1))V = X0T.

Исследуется задача нахождения наиболее неблагоприятных возмущающих факторов:

Зv(E, T): E = E(v) max, vV являющаяся обобщением дискретного аналога классической задачи Булгакова о максимальном отклонении и имеет структуру задачи ПП на максимум. Изложена схема ее сведения к семейству задач ЛП.

Решение данной задачи позволяет вычислять гарантированную точность дискретных процессов стабилизации, а также проводить компьютерное тестирование соответствующих алгоритмов стабилизации. Здесь автором на полиэдральной основе развивается идея тестирования с использованием экстремальных тестовых воздействий булгаковского типа, предложенная В.В. Александровым.

Гарантированная позиционная стратегия управления в условиях начальной полиэдральной неопределенности. Обратимся к дискретной системе управления (6.1)-(6.2) в условиях отсутствия текущего возмущения ((t) 0).

Пусть преследуется терминальная цель управления:

x(T) = 0, причем считается, что начальное состояние объекта x(0) = x0 неизвестно и область его возможных значений X0 является полиэдральным множеством.

Искомые параметры обратной связи представляет кортеж K = (K(0), K(1), Е, K(T - 1)).

Для характеризации качества процессов управления воспользуемся некоторым полиэдральным критерием F(x0, K), например, вида (3.6) или (3.7), где u(t) = u(t +1) - u(t), x(t) = x(t +1) - x(t).

В условиях начальной неопределенности использование принципа гарантированного результата приводит к задаче на минимакс:

min max F(x0, K), (6.3) K x0X решением которой являются оптимальная настройка обратной связи K и наи худшее с критериальной точки зрения начальное состояние x0.

Обозначим через [X0] множество вершин полиэдра X0.

Эффективный метод решения задачи (6.3) заложен в следующей теореме.

Теорема 9. Для любой позиционной стратегии управления в виде обратной связи (6.2) наихудшее в смысле критерия F(x0, K) начальное состояние объекта совпадает с одной из вершин полиэдра X0 : x0 [X0]. Таким образом, заменой континуального полиэдрального множества Xна конечное множество его вершин [X0], удается свести оптимизационную задачу (6.3) к более простой минимаксной задаче:

min max F(x0, K).

K x0[X0 ] Изложен алгоритм сведения последней к задаче ПП на минимум.

Рассмотренная задача построения гарантированной позиционной стратегии управления в условиях начальной неопределенности дуальна так называемой задаче синтеза ограниченного регулятора (или constrained stabilization).

Робастная стратегия упреждающего управления в условиях параметрической полиэдральной неопределенности. В современной теории автоматического управления все в большей степени проявляется методологическая установка Я.З. Цыпкина: Робастизировать все, что робастизируется, а что не робастизируется - сделать робастизируемым. Здесь термин робастность подразумевает сохранение свойств устойчивости системы при вариациях ее параметров.

Автором предложен новый подход к робастной стабилизации динамических объектов с параметрической неопределенностью, ставший предметом дискуссии в двух номерах журнала European Journal of Control (2001, V. 1, No 6 и 2002, V. 8, No 1) и получивший признание известных зарубежных ученых.

Полагаем, что динамика объекта управления с параметрической неопределенностью представлена в следующей политопической форме:

x(t + 1) = A()x(t) + B()u(t), где t+; x = Чn, uС Чr, q q A() = Ai, B() = Bi, i i i=1 i=AiЧnn, BiЧnr, i - скаляры, причем : 0, i =1,q; q .

= col (1, 2,..., q) Чq, = i i =1 i= Здесь вектор и симплекс играют роль соответственно вектора и множества возможных параметрических возмущений объекта.

Полагаем, что область управления С является параллелепипедом.

Выделим идейные аспекты предложенной полиэдральной стратегии дискретного робастного упреждающего управления.

1) Выбирается целевая полиэдральная функция Q(x), служащая мерой удаленности текущего состояния x от целевого (стабилизируемого) x = 0 и играющая роль локального критерия эффективности управления.

2) Управление основано на прогнозировании возможных вариантов движения объекта x(t + ) из текущего состояния x(t) в пределах заданной глубины прогноза T: [1 : T] с учетом неопределенных параметрических возмущений .

3) Инструментальными средством прогнозирования движения служат две полиэдральные конструкции:

- D(h) - целевое полиэдральное множество, ограниченное уровнем h целевой функции Q(x): D(h) = {x : Q(x) h};

- (h) - область -управляемости объекта относительно целевого множества D(h), образованная всеми состояниями, которые могут быть переведены в D(h) допустимым управлением за тактов при любых возмущениях .

4) На каждом шаге t вычисляются экстремальные траектория и программа управления, обеспечивающие минимизацию целевой функции Q(x) в пределах горизонта прогнозирования.

5) Реализуется первый такт рассчитанного экстремального движения.

Решение локальных задач минимизации целевой функции Q(x) основано на результатах следующей теоремы.

Теорема 10. Область -управляемости (h) может быть описана в виде некоторого линейного векторного неравенства:

(h) = {x : Mx + dh l}, (6.4) где MЧNn и d, lЧN1 - числовые матрица и векторы соответственно. Областям -управляемости (h) присущи два важных свойства: полиэдральность и линейная h-параметризованность. Построение данных областей сводится к формированию системы линейных неравенств (6.4).

Стратегия робастного упреждающего управления сводится к следующему трехэтапному алгоритму, выполняемому на каждом такте управления.

На первом этапе решается экстремальная задача:

h = min {h : x(h), [1 : T]}.

которая сводится к семейству задач ЛП:

h min, M x + dh l.

На втором этапе определяется минимальное число шагов, за которые объект может достигнуть целевое множество с уровнем h:

= min { : x( h), [1 : T]}.

На третьем этапе определяется управление, обеспечивающее перевод состояния объекта в область (h) :

-u(t)С x(t + 1) (h).

-На основе второго метода Ляпунова обоснована работоспособность описанной стратегии робастного управления.

Конфликтное управление противоборствующими объектами в условиях преследования. Специальный класс задач управления в условиях неопределенности составляют задачи конфликтного, или игрового управления, причем в теории игр особый интерес для приложений представляют дискретные динамические игры преследования.

В диссертации исследуется возможность применения полиэдральной методологии в сфере линейных дискретных динамических игр преследования.

Рассматривается дискретная игра перехвата, в которой две противоборствующие стороны - игроки - являются движущимися объектами: первый игроксоюзник P (Pursuer) преследует второго игрока-противника E (Evader). Процесс игры описывается линейным разностным уравнением вида x(t + 1) = Ax(t) + u(t) + v(t), где tT - дискретное время развертывания игры; T+; x - позиция игры, являющаяся вектором относительных координат игрока P в системе, связанной с игроком E; = Чn - пространство игры; uС и vТ - управляющие векторы соответственно игроков P и E; С, Т - области управления; AЧnn.

Игра преследования начинается в момент времени t = 0 из начальной позиции x(0) = x0. Цель игрока P заключается в захвате игрока E, который стремится избежать захвата. Игра рассматривается как игра качества (с исходом типа да/нет), причем захват считается осуществившимся, если расстояние между игроками уменьшилось до некоторого заданного расстояния > 0.

Полагаем, что С и Т - полиэдральные множества. Оба игрока располагают полной информацией о текущей позиции игры - векторе x.

Введем целевое терминальное множество G: условие захвата - достижение точкой x этого множества. Полагаем множество G полиэдральным:

G = {x | || x ||P }, где || x ||P - некоторая полиэдральная норма вектора x.

Близость хода игры перехвата к завершению будем оценивать расстоянием текущей позиции x до начала координат в той же полиэдральной метрике:

(x) = || x ||P.

В основу управления процессом преследования положена идея организации многошагового прогноза развития игры с последующей оценкой прогнозируемой платы - терминального промаха.

На каждом шаге игры преследователь по информации о текущей позиции игры формирует некоторый план преследования в виде жесткой программы на основе прогностической кинематической модели игры. При этом он ориентируется на наибольшее противостояние со стороны преследуемого и, в результате строит стратегию управления с ориентацией на наихудший исход игры - максимальный прогнозируемый терминальный промах.

Положим, что осуществляется T-шаговый прогноз и x (t + T | t) - прогнозируемая позиция игры. Она определяет прогнозируемый промах = || x (t + T) | t)||P. (6.5) Каждый игрок ориентируется на наилучшую игру своего противника и в соответствии с этим придерживается принципа гарантированного результата (по Ю.Б. Гермейеру) для прогнозируемого промаха: стратегия игрока-союзника реализует наилучший результат при наихудшей для него же стратегии игрокапротивника. Данный принцип согласуется с более общим принципом неухудшения позиции (по Н.Н. Красовскому) по показателю (6.5), требующему, чтобы в последующий момент времени он был не хуже, чем в предыдущий.

Терминальную прогностическую конструкцию выражает формула x (t +T | t) = y - z, где yP и zQ, а P и Q - области достижимости игроков P и E в :

T - 1 T - - 1 - - 1 - P = AT x + AT U, Q = - AT V.

=0 =Плата игры записывается в виде = || y - z ||P = f(y - z).

Игрок P руководствуется минимаксной стратегией, которой отвечает задача полиэдрального программирования на минимакс:

min max f(y - z).

yP zQ На основе полученного решения он формирует управление на текущем шаге. На следующем шаге решается новая задача планирования развития игрового процесса и т.д., т.е. план преследования на каждом шаге корректируется.

Таким способом реализуется закон управления u(x).

Предложенное правило построения рациональной стратегии управления для игрока P назван принципом гарантированного прогнозируемого промаха, отлично от принципа экстремального прицеливания Н.Н. Красовского и, на наш взгляд, лучше согласуется с логикой и практикой игровых задач преследования.

Полиэдральная методология в задачах наблюдения. Изучаемый процесс наблюдения представлен уравнениями x(t + 1) = Ax(t) + G(t), (6.6) y(t) = Cx(t), (6.7) z(t) = y(t) + (t), t+; xЧn - состояние объекта наблюдения, zЧ - измеряемый выход; Ч - внешнее возмущение, Ч - шум измерения; AЧnn, GЧn1, СЧ1n.

Решается задача наблюдения (оценивания, идентификации) переменных x(t) и (t) по данным измерения z(t). Источниками неопределенности в модели процесса наблюдения являются неконтролируемые возмущающие факторы - шум и возмущение . Возможны два направления дальнейшей формализации задачи - стохастический и детерминистический.

Со дня своего зарождения теория идентификации поглощена стохастикой и в настоящее время располагает широким спектром статистических методов, включая методы: калмановской фильтрации, марковских и байесовских оценок, максимума апостериорной вероятности и максимума правдоподобия, стохастической аппроксимации и регрессионного анализа. Однако получение экспериментальным путем необходимых статистических характеристик затруднительно, а часто просто невозможно.

Даже ярый сторонник стохастической идентификации Льюнг (L. Ljung) поднимает вопрос о правомерности стохастического подхода, поскольку мы наблюдаем только конкретную последовательность данных, а подход основан на предположении, что эксперимент, порождающий этот набор данных, может быть повторен бесконечно мно го раз при лодинаковых условиях. Вопросу корректности статистических методов наблюдения посвящены работы Нубера (P.J. Huber), Калмана (R.E. Kalman), Ю.И. Алимова, Ю.А. Кравцова, В.Н. Тутубалина, П.Е. Эльясберга, Б.Ц. Бахшияна, Р.Р. Назирова, М.Л. Лидова, И.К. Бажинова, В.Н. Почукаева, Б.М. Шамрикова, В.А. Фурсова, Г.И. Ломако, А.А. Ершова и др. Здесь показательно мнение Калмана (R.E. Kalman): было бы большой неправдой утверждать, что все данные являются выборкой, а вся неопределенность возникает в силу механизма статистического выбора; классический вероятностный подход не может работать в реальных задачах с недостоверными данными; случайность является плохим научным инструментом для работы с зашумленными данными; предположение (априорная гипотеза) о вероятностных структурах для описания неопределенности в задаче идентификации совершенно бесполезно.

Согласно общей тенденции смены стохастической парадигмы неопределенности все большее распространение получает детерминистический подход к задачам идентификации и, в частности, так называемая детерминированная теория гарантированной идентификации.

В диссертации развивается детерминированный метод наблюдения, основанный на полиэдральной методологии равномерного приближения функций.

Пусть задана решетчатая функция f(t), t T = [0 : T] (T+). Требуется найти ее наилучшее приближение в классе обобщенных полиномов вида:

(t) = c11(t) + c22(t) + Е + cLL(t).

Здесь {1(t), 2(t), Е, L(t)} - заданная система базисных функций, c1, c2, Е, cL - неизвестные числовые коэффициенты.

Введем погрешность приближения (невязку) в точке tT:

(t) = f(t) - (t), и вектор погрешностей: E = ((0), (1), Е, (T)).

Задача приближения формализуется как задача минимизации некоторой нормы вектора погрешностей:

|| Е || min.

Наилучшее равномерное приближение дает кубическая норма:

|| Е || = max | (t) | = max | f(t) - (t) |.

tT tT Поскольку здесь критерий || Е || является полиэдральной функцией искомых коэффициентов c1, c2, Е, cL, то, вводя некоторые дополнительные полиэдральные ограничения на эти коэффициенты, например, вида | cj | c (c = const, j = 0, L ), j j приходим к задаче ПП на минимум.

Обратимся к задаче наблюдения состояния x свободной системы: 0.

Из (6.6), (6.7) находим y(t) = CАt x(0) = x1(0)1(t)+ x2(0)2(t)+...+ xn (0)n (t), где i (t) - i-й элемент векторной функции CАt. Отсюда получаем выражение для оценки выходной переменной y:

(t) = x1(0)1(t)+ x2(0)2(t)+...+ xn (0)n (t), (6.8) где xi (0) - оценка координаты xi (0). Определяя невязку (t)= z(t)- (t), задачу наблюдения состояния можно трактовать как задачу наилучшего дискретного приближения эмпирических данных z(t) функцией (6.8). Если возможные начальные состояния стеснить некоторыми полиэдральными ограничениями, то данная задача становится задачей ПП на минимум.

Изложенная алгоритмическая схема применима к более общей задаче наблюдения - одновременному оцениванию текущего состояния системы x(t) и возмущения (t). Для этого необходима линейно параметризованная модель возмущения. Рассматриваются два типа таких моделей.

Сигнальная модель возмущений. Возмущение представляется разложением в ряд по некоторой системе базисных функций {i, i = 1, p }:

p (t) = i(t), i a i=где ai (i = 1, p ) - неопределенные коэффициенты.

Динамическая модель возмущений. Возмущение генерируется динамической системой (экзогенная система, модель внешней среды):

(t + 1) = (t), (t) = (t), где Чp - вектор состояния внешней среды, а Чpp, Ч1p - заданные коэффициентные матрицы. Неопределенными являются координаты начального состояния модели i (0)(i =1, p).

Нетрудно учесть обусловленную возмущением составляющую в структуре реакции выхода системы y(t). Тогда формульное выражение для его оценки (t) будет включать линейным образом неизвестные параметры возмущений ai или i (0). Налагая на эти параметры полиэдральные ограничения, приходим к полиэдральной задаче минимизации нормы вектора невязок.

В приложении методология полиПриложение 1. Полиэдральная оптими- эдральной оптимизации применяется к задачам управления термизация процесса управления посадочным нальным маневром летательных маневром пассажирского самолета аппаратов (ЛА). Исследованы перспективы применения методов полиэдральной оптимизации в двух прикладных задачах управления: посадочным маневром пассажирских самолетов и стартовым маневром автоматических высокоманевренных аэродинамических ЛА. Преимущества данных методов - в естественности и простоте учета динамических свойств аппарата, требований к качеству маневра, а также ресурсных и фазовых ограничений.

Особенности посадочного маневра пассажирских самолетов. Самым ответственным участком полета гражданских самолетов является посадка: выход хотя бы одного режимного параметра из области допустимых значений может привести к аварии. Посадочный маневр самолета (рис. П.1) характеризуется большой сложностью и скоротечностью, сильным аэродинамическим влиянием земли. Ряд переменных за считанные секунды меняются в широком диапазоне, приближаясь к предельно допустимым значениям: в десять раз падает вертикальная скорость, в пять раз уменьшается угол наклона траектории, в два раза увеличиваются углы атаки и тангажа, на 20% падает путевая скорость.

Математический имитатор посадочного маневра самолета представляет собой математическую модель, адекватно отражающую закономерности механики полета. Предполагается, что самолет является абсолютно жестким телом и движение происходит в неспокойной атмосфере в вертикальной плоскости под действием поля тяготения, аэродинамических сил и тяги двигателей.

Переменные, характеризующие посадочный маневр: V - путевая (земная) скорость полета; - угол наклона траектории; H - высота полета; - угол тан гажа; z = - угловая скорость тангажа.

Модель посадочного маневра описывает в переменных состояния кинематику перемещения центра масс самолета в земной системе координат, динамику перемещения центра масс в проекциях на оси скоростной системы координат, динамику вращения самолета вокруг центра масс в проекции на поперечную ось связанной системы координат, функционирование автопилота. Тяга двигателей изменяется по заданной программе. Ограничивающие условия обусловлены конструктивно-аэродинамические особенностями самолета, условиями его нормальной эксплуатации и требованиями безопасности посадки.

Полагаем, что посадочный маневр выполняется за промежуток времени T== [tн, tк ], где tн и tк - моменты начала и окончания маневра соответственно.

Снижение по глиссаде н Выравнивание Hн Vн Выдерживание и пробег Входная кромка ВВП ВПП Начальное состояние: t = tн Конечное состояние: t = tк Рис. П.Задача управления посадочным маневром самолета заключается в нахождении управляющего воздействия u на автопилот, обеспечивающего перевод самолета к заданному моменту времени t =tк в предписанное целевое сос (tк тояние: H (tк ) = Hк ; H (tк ) = Hк ; H ) = Hк.

Управление посадочным маневром самолета осуществляется по принципу гибких корректирующих траекторий. Согласно данному принципу целевое терминальное управляемое движение самолета осуществляется по периодически обновляемым гибким траекториям, обеспечивающим коррекцию номинальной траектории x(t), определяющей его невозмущенное движение. Необходимость коррекции обусловлена неконтролируемыми возмущениями, порождающими отклонение фактического движения x(t) от номинального x(t) :

x(t)= x(t)+ x(t).

При этом управление маневром u(t) формируется из основной номинальной u(t) и дополнительной корректирующей u(t) составляющих:

u(t) = u(t) + u(t).

Жесткая номинальная составляющая u(t) находится решением двух точечной краевой задачи управления: x(tн) = xн, x(tк ) = xк, на основе неупрощенной нелинейной модели маневра. Предлагается оригинальный подход к ее решению на основе методологии обратных задач динамики, предложенной Г.С.

Поспеловым и В.И. Толокновым, с использованием полиномиальной номиналь ной траектории посадки:

H = H (t) = e0 + e1t + e2t2 + e3t3 + e4t4 + e5t5, t T, где коэффициенты ei (i = 0, 5) определяются исходными начальными и заданными конечными условиями маневра.

Полиэдральный алгоритм гибкого корректирующего управления посадочным маневром самолета. Корректирующее управление u(t) является терминальным управлением в малом и синтезируется на основе упрощенной модели маневра, полученной линеаризацией исходной нелинейной модели вертикального маневра самолета относительно номинальной траектории.

Процесс коррекции номинальной траектории посадочного маневра самолета осуществляется дискретно в моменты времени t = tn, n = 0, 1,..., N -1, причем t0 = tн, tN = tк, с постоянным шагом h = (tк - tн ) / N :

u(t) = u(tn ), tn t < tn+1, n = 0, N -1.

Дискретная линейная модель возмущенного движения самолета:

x[n + 1] = A(n)x[n] + B(n)u[n], где n N = [0 : N -1] + - дискретное время; u[n] = u(tn ) и x[n] = x(tn ) дискреты управления u и вектора состояния x = col(x1, x2, x3, x4), компонентами которого являются отклонения фактических значений переменных, характеризующих посадочный маневр самолета от их номинальных значений:

x1 = = - , x2 = = - , x3 = H = H - H, x4 = H = H - H ;

A(n)Ч44 и B(n)Ч41 - функциональные матрицы, зависящие от h.

Начала циклов коррекции t, = 0, L,2L,...,(M -1)L, т.е. N = ML.

Корректирующим управлением для -го цикла является управляющее воздействие u[], u[+1],..., u[+ L-1], которое находится решением задачи терминального управления для отрезка времени [t, tк ], исходя из начального x[] = x(t ) и целевого конечного состояний: x[N] = x(tк ) = 0, с учетом заданных фазовых и ресурсных ограничений: | xi | xiдоп, i =1, 4; | u | uдоп.

Процесс корректирующего управления оптимизируется по критерию комфортности, безопасности и энергозатрат. В качестве такого критерия используется полиэдральный критерий, характеризующий максимальные значения переменных состояния и управляющих переменных возмущенного движения:

F = max Qx (x[n]) + max Qu (u[n]), n[+1 : N ] n[ : N -1] где: Qx (x[n]) = max{| x1[n]|, | x2[n]|, | x3[n]|, | x4[n]|}, Qu (u[n]) = | u[n]|.

Данная оптимизационная задача является задачей ПП на минимум.

Компьютерная верификация алгоритма управления посадочным маневром самолета. Автором предложена концепция компьютерной сертификации посадочного маневра самолета (КС ПМС), предназначенной для подтверждения соответствия посадки самолета требованиям норм летной годности и безопасности полета. Данный вид сертификации логично дополняет летные сертификационные испытания и позволяет избежать риск при выполнении посадочного маневра в нештатных полетных ситуациях. Одна из версий системы КС ПМС реализована в среде программирования Delphi. Основные рабочие окна ее интерфейса представлены на рис. П.2.

Рис. П.Разработанная полиэдральная методология построения алгоритмов управления посадочным маневром самолета апробирована на ряде туполевских пассажирских самолетов, в частности, на сверхзвуковом самолете Ту-144ЛЛ в рамках российско-американской программы по сверхзвуковой авиации, проводимой в ОАО АНТК им. А.Н. Туполева. Синтезированный дискретный полиэдральный алгоритм управления посадочным маневром СПС Ту-144ЛЛ с параметрами полиэдральной коррекции управления:

h = 0.05c, t = t, = 0,10, 20, 30,..., 90, сравнивался с модально-трансцендентным (Г.С. Поспелов и В.И. Толокнов), полиномиально-терминальным (В.В. Солодовников и Н.Б. Филимонов) и классическим финитным (апериодическим) алгоритмами. На рис. П.3 приведены результаты такого сравнения для одной из нештатных, фактически катастрофических ситуаций, соответствующих сходу самолета с глиссады с занижением на 30 % высоты начала маневра. Вычислительные компьютерные сертификационные эксперименты показали высокую эффективность предложенных алгорит мических решений.

Полиэдральная коррекция Полиэдральная коррекция Полиэдральная коррекция Полиэдральная коррекция Рис. П.В приложении представлены акты, подПриложение 2. Акты об использо- тверждающие использование результатов диссертации при разработке перспективвании результатов диссертации ных алгоритмов управления посадочным маневром пассажирских самолетов и стартовым маневром автоматических высокоманевренных аэродинамических летательных аппаратов, а также в учебном процессе.

ЗАКЛЮЧЕНИЕ И ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ В диссертации разрабатываются теоретические основы полиэдральной оптимизации дискретных процессов управления и наблюдения, полиэдральные методы анализа и синтеза систем управления динамическими объектами в условиях ресурсных и фазовых ограничений, параметрической неопределенности и неполноты измерительной информации.

Совокупность положений и результатов диссертационной работы представляется как новое научное направление в теории автоматического управления, связанное с применением аппарата полиэдрального анализа, полиэдрального исчисления и полиэдрального программирования к задачам дискретного управления динамическими объектами.

В диссертации получены следующие новые теоретические результаты, которые можно квалифицировать как крупное достижение в области теории автоматического управления:

Разработаны основы полиэдрального анализа и полиэдрального исчисления. Исследованы фундаментальные свойства и способы построения полиэдральных функций, получены формулы для субдифференциала и конструктивное условие минимума полиэдральных функций.

Разработаны теоретические основы полиэдрального программирования. Дана типизация и исследованы решения задач полиэдрального программирования. Предложены способы их сведения к задачам линейного программирования методами мажорирования целевой функции и погружения, а также к задаче безусловной полиэдральной оптимизации методом точного полиэдрального штрафа.

Разработаны альтернативные численные методы безусловной полиэдральной оптимизации, реализующие схемы жестких и мягких вычислений: субградиентный (в традиционной и нейросетевой реализации) и эволюционный (комбинированная схема эволюционных стратегий и генетических алгоритмов с механизмом адаптивной мутации).

Разработана полиэдральная методология оптимизации дискретных процессов управления, основанная на полиэдральных конструкциях цели управления, динамических критериев качества, фазовых и ресурсных ограничений.

Предложена полиэдральная стратегия дискретного упреждающего управления динамическими объектами в условиях ресурсных ограничений на основе объединения методов многошагового прогнозирования управляемого движения, функций Ляпунова и наискорейшего спуска.

Разработаны полиэдральные методы решения ряда задач дискретного управления, анализа и синтеза систем в условиях фазовых и ресурсных ограничений, неопределенности, в штатных, конфликтных и критических ситуациях: предельного быстродействия; анализа устойчивости, синтеза стабилизирующих управлений; определения экстремальных возмущающих факторов; гарантированного управления в условиях начальной неопределенности; робастного управления в условиях параметрической неопределенности; конфликтного управления противоборствующими объектами; барьерного управления в критических ситуациях; идентификации состояния системы и внешней среды при действии неизвестных возмущающих факторов.

На основе аппарата полиэдральной оптимизации решена прикладная задача управления посадочным маневром пассажирского самолета.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Учебники, учебные пособия и монографии 1. Пупков К.А., Егупов Н.Д., Филимонов Н.Б. и др. Методы классической и современной теории автоматического управления. Учебник в пяти томах. Т. 4. Теория оптимизации систем автоматического управления. - М.: Изд-во МГТУ им. Н.Э.

Баумана, 2004. 744 с.

2. Пупков К.А., Егупов Н.Д., Филимонов Н.Б. и др. Методы классической и современной теории автоматического управления. Учебник в пяти томах. Т. 5. Методы современной теории автоматического управления. - М.: Изд-во МГТУ им. Н.Э.

Баумана, 2004. 784 с.

3. Солодовников В.В., Филимонов Н.Б. Динамическое качество систем автоматического регулирования. Учебное пособие. - М.: МВТУ им. Н.Э. Баумана, 1987. 84 с.

4. Пухов А.Л. Толокнов В.И., Филимонов Н.Б. Компьютерная сертификация посадочного маневра СПС Ту-144. Монография. - М.: Изд-во ОАО Туполев, 2001. 52 с.

Статьи в журналах, рекомендованных ВАК РФ 5. Филимонов Н.Б. Полиэдральное программирование в дискретных задачах управления // Информационные технологии. Приложение. 2004. № 1. 32 с.

6. Филимонов А.Б., Филимонов Н.Б., Бабич А.Н. Метод спуска в задачах минимизации полиэдральных функций и его нейросетевая реализация // Информационные технологии. 2001. № 12. С. 12-16.

7. Филимонов А.Б., Филимонов Н.Б. О минимаксных и максиминных задачах полиэдрального программирования // Информационные технологии. 2000. № 12.

С. 2-9.

8. Филимонов А.Б., Филимонов Н.Б. Полиэдральное программирование: элементы теории и приложения // Информационные технологии. 1999. № 11. С. 2-12.

9. Филимонов Н.Б. Идентификация состояния и внешней среды дискретных динамических объектов методом полиэдрального программирования // Мехатроника, автоматизация, управление. 2003. № 2. С. 11-15.

10. Филимонов Н.Б., Деменков М.Н. Дискретное упреждающее управление линейными динамическими объектами с параметрической полиэдральной неопределенностью // Мехатроника, автоматизация, управление. 2008. № 9. С. 2-7.

11. Филимонов А.Б., Филимонов Н.Б. Модальное управление многомерными объектами // Изв. АН СССР. Техн. кибернетика. 1985. № 2. С. 130-142.

12. Филимонов А.Б., Филимонов Н.Б. Метод динамической развязки каналов управления в многосвязных объектах // Изв. вузов. Приборостроение. 2002. № 7.

С. 28-34.

13. Филимонов Н.Б. Гомеостатические системы и двухрежимный автомат ограничений состояния управляемых динамических объектов // Изв. вузов. Приборостроение. 1998. № 1-2. С. 17-34.

14. Филимонов А.Б., Филимонов Н.Б. Негладкий анализ и синтез систем регулирования на основе прямого метода Ляпунова. II. Синтез и оптимизация систем регулирования // Изв. вузов. Приборостроение. 1996. № 4. С. 8-23.

15. Филимонов А.Б., Филимонов Н.Б. Негладкий анализ и синтез систем регулирования на основе прямого метода Ляпунова. I. Негладкий анализ устойчивости систем и конструирование кусочно-гладких функций Ляпунова // Изв. вузов. Приборостроение. 1994. № 7-8. С. 5-15.

16. Филимонов Н.Б. Системы многорежимного регулирования: концепция, принципы построения, проблемы синтеза // Изв. вузов. Приборостроение. 1988. № 2.

С. 18-33.

17. Солодовников В.В., Филимонов А.Б., Филимонов Н.Б. Аналитическое конструирование оптимальных регуляторов методом фазового пространства. Ч. II.

Многосвязное регулирование // Изв. вузов. Приборостроение. 1982. № 8. С. 28-32.

18. Солодовников В.В., Филимонов А.Б., Филимонов Н.Б. Аналитическое конструирование оптимальных регуляторов методом фазового пространства. Ч. I. Объекты с одномерным управляющим входом // Изв. вузов. Приборостроение. 1982.

№ 6. С. 23-27.

19. Солодовников В.В., Филимонов А.Б., Филимонов Н.Б. Анализ компенсационного подхода к синтезу систем управления // Изв. вузов. Приборостроение. 1979.

№ 2. С. 27-32.

20. Солодовников В.В., Филимонов А.Б., Филимонов Н.Б. Игровые критерии качества систем регулирования и проблема аналитического конструирования регуляторов // Изв. вузов. Приборостроение. 1976. № 12. С. 26-31.

21. Филимонов Н.Б. Оптимизация дискретных процессов управления по полиэдральным критериям качества // Вестн. МГТУ. Сер. Приборостроение. 2000. № 1.

С. 20-38.

22. Филимонов Н.Б. Барьерное регулирование динамических объектов // Вестн.

МГТУ. Сер. Приборостроение. 1998. № 1. С. 53-66.

Статьи в других центральных рецензируемых периодических изданиях 23. Demenkov M.N., Filimonov N.B. Variable Horizon Robust Predictive Control via Adjustable Controllability Sets // European Journal of Control. 2001. V. 7, № 6.

P. 596-604.

24. Filimonov N.B. The AuthorТ Answer to the Letter to the Editor on the Paper Variable Horizon Robust Predictive Control via Adjustable Controllability Sets by M.N. Demenkov and N.B. Filimonov // European Journal of Control. 2002. V. 8, № 1. P. 90-94.

25. Филимонов Н.Б. Наихудшие возмущающие факторы и гарантированные стратегии управления в задачах дискретной стабилизации динамических объектов // Докл. Академии военных наук. Поволжское межрегион. отд. 2003. № 9. С. 123-133.

26. Белоусов И.В., Филимонов Н.Б. Применение генетических алгоритмов в задачах оптимизации терминального управления динамическими объектами // Докл. РАЕН. Поволжское межрегион. отд. 2002. № 3. С. 68-80.

27. Филимонов Н.Б., Деменков М.Н. Кишалов П.А. Дискретное регулирование технических объектов методом прогнозируемого наискорейшего спуска // Приборы и системы управления. 1998. № 3.С. 10-12.

28. Солодовников В.В., Филимонов А.Б., Филимонов Н.Б. Метод фазового пространства в задачах управления линейными конечномерными объектами // Автоматика. 1981. № 2. С. 55-67.

29. Филимонов Н.Б. Локальный и глобальный аспекты в задачах управления нелинейными объектами // Труды МВТУ. № 513. Системы автоматического управления. М.: МВТУ, 1988. С. 3-11.

30. Филимонов Н.Б. Качественный анализ динамики линейных систем управления с кинематическим звеном // Труды МВТУ. № 409. Системы автоматического управления. Вып. 9. М.: МВТУ. 1983. С. 24-34.

31. Филимонов Н.Б. Проблема динамического качества многомерных систем управления // Труды МВТУ. № 360. Системы автоматического управления. Вып. 8. М.:

МВТУ, 1981. С. 39-51.

32. Филимонов Н.Б. К вопросу о разрешимости задачи В.В. Солодовникова // Труды МВТУ. № 314. Системы автоматического управления. Вып. 7. М.: МВТУ, 1979.

С. 60-71.

33. Филимонов Н.Б. Управление фазовыми траекториями в линейных конечномерных нестационарных объектах // Труды МВТУ. № 297. Системы автоматического управления. Вып. 6. М.: МВТУ, 1979. С. 11-17.

34. Филимонов Н.Б. Круговой критерий устойчивости и аналитическое конструирование регуляторов // Труды МВТУ. № 238. Системы автоматического управления. Вып. 4. М.: МВТУ, 1977. С. 56-58.

35. Филимонов А.Б., Филимонов Н.Б. Метод полиэдрального программирования в дискретных задачах идентификации состояния системы и внешней среды // Вестн. РУДН. Сер. Кибернетика. 1999. № 1. С. 23-30.

36. Филимонов А.Б., Филимонов Н.Б. Синтез систем управления линейными динамическими объектами с эталонной динамикой выхода // Вестн. РУДН. Сер. Кибернетика. 1998. № 1. С. 64-80.

37. Филимонов Н.Б., Макашов В.С. Математическое обеспечение ППП МАВР для автоматизированного синтеза высококачественных многосвязных САР // Труды МВТУ. № 458. Автоматизированное проектирование систем управления.

Вып. 4. М.: МВТУ, 1986. С. 125-136.

Статьи в рецензируемых научных сборниках 38. Белоусов И.В., Филимонов Н.Б. Синтез алгоритма управления маневром аэродинамического ЛА на основе эволюционно-генетического метода // Проблемы эксплуатации и совершенствования транспортных систем: Сб. науч. тр. Акад. ГА.

Т. VI. Ч. 2. СПб: АГА, 2001. С. 98-103.

39. Деменков Н.П., Филимонов Н.Б. Экстраполяционный алгоритм дискретной стабилизации состояния динамических объектов // Автоматизированные системы управления и обработки информации: Межвуз. тематич. сб. науч. тр. СПб. АГА.

1999. С. 17-21.

40. Деменков Н.П., Филимонов Н.Б. Одношаговые и многошаговые алгоритмы дискретной стабилизации объектов с параметрической неопределенностью // Проблемы эксплуатации и совершенствования авиационной техники и систем воздушного транспорта: Сб. науч. тр. Т. 3. С.-Петербург: АГА, 1997-1998. С. 44-48.

41. Филимонов Н.Б. Концепция многорежимного регулирования // Автоматическое управление объектами с переменными характеристиками: Межвуз. сб. науч. тр.

Новосибирск: НЭТИ, 1988. С. 88-92.

42. Филимонов А.Б., Филимонов Н.Б. Циклические процессы регулирования в нелинейных объектах // Аналитические методы синтеза регуляторов: Межвуз. науч. сб. Саратов: СПИ, 1988. С. 90-96.

43. Филимонов Н.Б. Концепция квазилинейного управление переходными режимами САР // Управление гибкими производственными системами: Межвуз науч. сб.

.: ЛЭТИ-НПИ, 1987. С. 49-54.

44. Филимонов Н.Б., Макашов В.С. Квазиоптимальное модальное управление // Труды МВТУ. № 486. Автоматизированное проектирование систем управления.

Межвуз. сб. Вып. 5. М.: МВТУ, 1987. С. 38-47.

45. Филимонов Н.Б. Функциональная управляемость и синтез систем управления методом обратных задач динамики // Автоматическое управление объектами с переменными характеристиками: Межвуз. сб. науч. тр. Новосибирск: НЭТИ, 1986. С. 58-68.

46. Филимонов Н.Б. Многообразие установившихся режимов многосвязных САР // Методы и устройства обработки информации в системах управления: Межвуз.

сб. науч. тр. Рязань: РРТИ, 1985. С. 43-46.

47. Филимонов А.Б., Филимонов Н.Б. Модальное управление нестационарными объектами // Адаптивные системы автоматического управления: Респ. межвед.

науч.-техн. сб. Вып. 10. Киев: Технiка, 1982. С. 43-51.

48. Филимонов Н.Б. Критерий устойчивости терминальных систем управления с кинематическим звеном // Системы управления, передачи, преобразования и отображения информации: Межвуз. науч. сб. Рязань: РРТИ, 1981. С. 22-25.

49. Филимонов А.Б., Филимонов Н.Б. К проблеме динамического качества линейных стационарных систем регулирования // Аналитические методы синтеза регуляторов: Межвуз. науч. сб. Саратов: СПИ, 1981. С. 94-106.

50. Филимонов Н.Б. Аналитическое конструирование квазиоптимальной системы терминального управления // Аналитические методы синтеза регуляторов: Межвуз. науч.-техн. сб. Вып. 3. Саратов: СПИ, 1978. С. 100-113.

Авторефераты по всем темам >> Авторефераты по техническим специальностям

Blog