На правах рукописи
Елисеев Владимир Леонидович
Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами
05.13.01 - Системный анализ, управление и обработка информации
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Москва - 2012
Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования УНациональный исследовательский университет УМЭИФ.
Научный консультант: доктор технических наук, профессор, Филаретов Геннадий Федорович
Официальные оппоненты: доктор физико-математических наук, профессор, Лохин Валерий Михайлович доктор технических наук, профессор, Ермуратский Петр Васильевич
Ведущая организация: ОАО УГазпром автоматизацияФ
Защита состоится л 2012 г. в часов на заседании диссертационного совета Д 212.157.08 при ФГБОУ ВПО УНИУ МЭИФ в малом актовом зале, расположенном по адресу: 111250, Москва, Красноказарменная улица, дом 14.
С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО УНИУ МЭИФ.
Автореферат разослан л 2012 г.
Отзывы и замечания по автореферату в двух экземплярах, заверенные печан тью, просьба высылать по вышеуказанному адресу на имя ученого секретаря диссертационного совета.
Ученый секретарь диссертационного совета, кандидат технических наук, доцент Анисимов Д. Н.
Введение
Актуальность работы Искусственные нейронные сети (ИНС) в настоян щее время находят широкое применение в самых разных предметных облан стях. Они используются для идентификации статических и динамических объектов, для построения ассоциативной памяти и моделей временных рян дов, сжатия информации, в системах поддержки принятия решений, для цен лей прогнозирования, классификации и распознавания образов, а также как средство решения некоторых задач вычислительного характера.
Одним из важных направлений использования искусственных нейронн ных сетей являются системы автоматического управления (САУ) различных типов. Работы по данной проблеме велись и ведутся весьма интенсивно как отечественными (А. И. Галушкин, В. А. Терехов, А. Н. Горбань, В. И. Коман шинский, Д. А. Смирнов, Т. А. Бондарь, А. С. Логовский и др.), так и зарун бежными учеными (К. Нарендра, О. Сигеро, С. Хайкин, М. Гупта, С. Осовн ский и др.).
Вместе с тем, необходимо отметить, что многие вопросы, в первую очен редь связанные с практическим использованием ИНС в САУ, исследованы еще недостаточно полно. Большинство работ либо носят постановочный абн страктный характер, где основное внимание уделяется доказательству принн ципиальной возможности использования нейросети некоторой разновидности в определенной предметной области, либо посвящены решению относительно узких прикладных задач и не содержат обобщений, позволяющих использон вать полученные результаты для решения схожих задач. В частности, отсутн ствуют работы, посвященные задаче замены классических регуляторов на нейросетевые, обобщающие накопленный к настоящему времени опыт их исн пользования. Очень слабо освещены вопросы синтеза нейросетевого регулятон ра по критерию минимума среднеквадратической ошибки в сопоставлении со свойствами традиционного линейного регулятора. Достаточно ограничен пен речень работ по нейросетевому управлению нестационарным объектом, где, как правило, рассматривается только случай достаточно плавного непрерывн ного изменения свойств объекта управления. Всё это свидетельствует о необн ходимости дальнейшего развития исследований по данной проблематике, в первую очередь направленную на конкретизацию процедур синтеза нейросен тевых регуляторов, корректное сопоставление их свойств со свойствами анан логичных классических регуляторов. Из изложенного вытекает актуальность темы диссертационной работы.
Цель исследований Целью диссертационной работы является разработн ка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами Задачи исследований В соответствии с указанной целью в рамках дисн сертационной работы поставлены и решались следующие задачи:
1. Обзор и анализ известных вариантов применения ИНС в системах управн ления, используемых для этих целей методов и программных средств.
2. Разработка методики построения нейросетевого регулятора - аналога П, ПИ и ПИД регуляторов и сопоставительный анализ их свойств.
3. Исследование возможностей нейросетевого подхода при построении САУ по критерию минимума среднеквадратической ошибки.
4. Разработка нейросетевых алгоритмов управления нестационарными обън ектами для случая спонтанного скачкообразного изменения их свойств.
5. Применение полученных методических, математических и программноалгоритмических результатов при решении практических задач управн ления подвижным роботом и в учебном процессе.
Научная новизна 1. Разработана методика построения нейросетевого регулятора Ч аналон га П, ПИ и ПИД регуляторов, впервые позволившая формализовать решение задачи его проектирования, включая выбор внутренней архин тектуры и структуры входов используемой ИНС, оптимальное формин рование обучающей выборки, процедуру обучения ИНС и анализ его возможностей для линейного и нелинейного динамических объектов.
2. Сопоставление свойств классического и предложенного в работе нейрон сетевого регуляторов, синтезированных по критерию минимума СКО, впервые позволило показать существенно меньшую чувствительность нейросетевого варианта к отклонениям параметров объекта и сигналов от использовавшихся при их синтезе.
3. Разработан алгоритм управления нестационарным объектом для слун чая спонтанного скачкообразного изменения его характеристик, в кон тором впервые предложено комбинировано использовать нейросетевые и статистические подходы, когда статистическая компонента обеспечин вает наискорейшее обнаружение значимого изменения характеристик объекта на фоне помех и запуск механизма адаптации (дообучения).
Методы исследования Полученные результаты исследования базируютн ся на использовании методов и средств теории искусственных нейронных сен тей, теории автоматического управления, математической статистики, имин тационного моделирования.
Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются результатами имитационного моделирован ния, которые для классических САУ совпадают с известными теоретическин ми результатами, данными о применении разработанных методов, алгоритн мов и прикладных программ в рамках натурных экспериментов по управлен нию подвижным роботом, апробацией полученных результатов среди квалин фицированных специалистов на Международном научном коллоквиуме, Герн мания, 2010 г., научном семинаре кафедры УРобототехнические системы и комплексыФ в МГТУ им. Н.Э. Баумана (сентябрь, 2011 г.).
Практическая значимость работы Результаты исследований, выполненн ных в диссертационной работе, использованы при синтезе нейросетевого алн горитма управления подвижным роботом и опробованы на практике. Разран ботанный подход позволяет легко адаптировать нейросетевой алгоритм для управления широким классом мобильных устройств с различными массоган баритными характеристиками и динамическими свойствами без проведения их аналитической идентификации. Созданные алгоритмы легли в основу прон граммного комплекса моделирования нейросетевых систем управления, котон рый может использоваться для синтеза и исследования нейросетевых алгон ритмов управления и их сравнения с альтернативными подходами. Данный комплекс является интерактивным, модульным, легко расширяется под спен цифические задачи. Его адаптированный вариант предназначен для примен нения в учебном процессе в качестве программного стенда при проведении лабораторных работ.
Реализация результатов Результаты работы были использованы:
для разработки алгоритма нейросетевого управления автономным мон бильным роботом в Московском государственном техническом универн ситете им. Н.Э. Баумана;
при создании учебно-практического лабораторного комплекса по курсу УНейрокомпьютеры и их применениеФ в Национальном исследовательн ском университете МЭИ.
Апробация работы Результаты работы и ее основные положения доклан дывались на российских и международных конференциях УИнформационные технологии в науке, образовании, телекоммуникации и бизнесеФ - IT+SE (Ялта-Гурзуф, 2010 г., 2011 г.), УИнформационные средства и технологииФ (Москва, 1999 г., 2000 г.), УАктуальные проблемы защиты и безопасностиФ (Санкт-Петербург, 2006 г.), УInternational Scientific ColloquiumФ (Ильменау, Германия, 2000 г., 2010 г.), на заседании кафедры УУправление и информатин каФ Национального исследовательского университета МЭИ.
Публикации По результатам исследований опубликовано 12 научных ран бот, в том числе, 2 публикации в рецензируемых журналах, входящих в спин сок ВАК РФ.
Структура и объем работы Диссертационная работа состоит из введен ния, шести глав, заключения и списка литературы из 85 наименований, вклюн чает 207 страниц текста, 73 рисунка, 14 таблиц.
Содержание работы Во Введении обоснована актуальность диссертационной работы, сфорн мулирована цель и аргументирована научная новизна исследований, показана практическая значимость полученных результатов, представлены выносимые на защиту научные положения.
Первая глава содержит обзор литературы и анализ современных тенн денций применения нейронных сетей в задачах автоматического управления.
Отмечено частое использование нейронных сетей (НС) для управления прон мышленными технологическими процессами, а также в робототехнике. Клюн чевыми преимуществами нейронных сетей в этих случаях являются обучен ние на примерах, не требующее аналитической идентификации, и нелинейная природа, адекватная нелинейным объектам.
Основными и наиболее перспективными ролями НС общепризнано счин тается их использование в качестве регулятора (в том числе, с регулятором другого типа) и модели объекта управления. Прочие варианты (настройка регулятора другого типа, классификация состояний объекта и пр.), судя по публикациям, используются существенно реже. Тем не менее, задача сопон ставления нейросетевых регуляторов с другими подходами, в частности, с ПИД регуляторами, систематически не решалась. В публикациях данная тен ма, как правило, затрагивается только с позиций показа преимуществ нейн росетевых регуляторов, в то же время очевидно, что любой подход должен иметь свои ограничения и недостатки.
Другим неисследованным объектом сопоставления является линейный винеровский оптимальный регулятор. Критерий его синтеза Ч минимум средн неквадратической ошибки управления (СКО) Ч совпадает с критерием обучен ния нейросетевого регулятора в контуре управления во многих публикациях как в стационарных, так и нестационарных условиях. Однако такого сопоставн ления никто не проводил, несмотря на его корректность, а также очевидное научное и практическое значение.
Проблема нейросетевого управления нестационарным объектом, как пран вило, рассматривается исследователями в постановке с гладким изменением параметров. Важный в теоретическом и практическом плане случай ступенн чатого изменения параметров в опубликованных работах рассматривается редко и недостаточно систематически, что оставляет много вопросов по мен тодике, быстродействию и устойчивости процесса адаптации нейросетевого регулятора к изменившемся условиям.
Незавершенность теории НС делает обоснованным использование разнон образных эвристик, а также применение имитационного эксперимента как основного метода исследований. Это характерно для большинства опубликон ванных работ. В то же время, авторы редко аргументируют причины принян тия тех или иных решений, а некоторые аспекты, например, формирование обучающей выборки, почти всегда остаются за рамками публикации.
Учитывая эвристический характер проектирования нейросетевых систем управления, особое значение приобретают программные инструментальные средства, позволяющие быстро и удобно настраивать и моделировать такие системы, а также оценивать качество управления в сравнении с традиционн ными подходами. Для использования в учебном процессе такие программы должны быть просты в освоении, иметь скромные требования к производин тельности компьютера и, что весьма желательно, базироваться на открытых и бесплатных технологиях.
Вторая глава посвящена разработке методики синтеза нейросетевого аналога ПИД регулятора в системе управления с одномерным линейным обън ектом. Пусть ek Ч ошибка управления в момент времени tk, uk Ч управляюн щее воздействие на объект, а f(ek, s) Ч функция ПИД регулятора (s Ч его состояние). Для обучения нейросетевого аналога ПИД регулятора вне контун ра управления решалась оптимизационная задача вида:
p f(ek, s) - N (ik) min (1) ikI k p где N Ч функция НС со структурой многослойного персептрона, ik Ч знан чения на входах нейросети, I Ч область возможных значений входов для рен гулятора. Данная задача нейросетевой аппроксимации неизвестной таблично заданной функции f имеет типовое решение градиентным методом (наприн мер, b ack-propa gation of error), однако говорить о методике синтеза можно только при обоснованном выборе набора входов НС, внутренней архитектун ры и обучающих данных.
Эксперименты с различными наборами входов НСЦР выявили зависин мость ошибки имитации от вида рабочего изменения уставки. Для постоянной уставки rk = const оптимальным выбором являются ek... ek-d и ek, ek, где d Ч длительность переходного процесса в исходной САУ в отсчетах. Для перен менной уставки наилучший результат дают входы rk, ek. Для кусочноЦпостон янной уставки наилучшим является вариант rk, ek... ek-d.
При использовании правильно подобранной структуры входов зависимон сти качества имитации от количества слоев НСЦР и нейронов в них не бын ло обнаружено. В этой связи представляется целесообразным использовать простые двух- и трехслойные сети, теоретически обеспечивающие аппроксин мацию произвольной функции. Выбор алгоритма обучения НС также не окан зывает существенного влияния на ошибку имитации и управления НСЦР, а определяет только скорость самого обучения.
В проведенных имитационных экспериментах было обнаружено, что наин лучшим пробным сигналом для формирования обучающего множества являн ется стохастический ряд, распределенный в диапазоне рабочих уставок. Исн пользование моногармонического сигнала дает худший результат, а ступенн чатый пробный сигнал совсем не позволил настроить НСЦР подобно ПИД.
Важным аспектом при формировании обучающей выборки является такое распределение амплитуд сигналов на входе и выходе регулятора, которое охватывает диапазон этих сигналов в основных рабочих режимах контура.
Анализ результатов экспериментов показал, что малая ошибка имитации вне контура не всегда обеспечивает малую ошибку управления в контуре синтезированным НСЦР. В этом проявляется нелинейная природа НСЦР. В частности, как уже отмечалось, настройка НСЦР по ступенчатому пробному сигналу не обеспечивает устойчивое управление в контуре по причине малой площади покрытия обучающими точками рабочего диапазона.
Отмечено, что синтезированный НСЦР в отличие от ПИД не обеспечивал нулевую ошибку управления даже по окончании переходного процесса. Эта ошибка в проведенных экспериментах не превышала 2% от ширины рабочего диапазона уставок. В то же время, сам переходный процесс под управленин ем НСЦР становился короче вследствие отсутствия памяти состояния и обн ратных связей у многослойного персептрона. Также было отмечено меньшее перерегулирование.
Предложенная методика замены ПИД регулятора на нейросетевой прин менена для управления объектом третьего порядка в присутствии аддитивн * ной помехи в канале наблюдения. Структура и параметры объекта P (z), * исходного ПИД-регулятора CP ID(z), а также формирующего фильтра стохан Рис. 1. Архитектура нейросетевого регулятора с входами rk, ek стической уставки R*(z) и помехи N*(z) перечислены ниже:
z3 - 0.* P (z) = (z - 0.8)(z2 - 0.06z + 0.58) z z2 - 2z + * CP ID(z) = 0.01 1 + + (2) 0.05(z - 1) 0.1(z2 - z) 3z R*(z) = z - 0.N*(z) = 0.Архитектура предложенного НСЦР представлена на рис. 1.
В результате проведенной процедуры обучения был получен НСЦР, обесн печивший на стохастической выборке снижение среднеквадратической ошибн ки управления на 33%, а максимальной ошибки управления Ч на 34% по сравнению с исходным ПИД регулятором.
Разработанная методика не опирается на предположение о линейности объекта, поэтому она была проверена на существенно нелинейном объекте Ч химическом реакторе непрерывного действия с перемешиванием (continuous stirred-tank reactor). Синтезированный нейросетевой аналог ПИД регулятон ра обеспечил устойчивость контура управления, лучшее перерегулирование, более короткий переходный процесс, а также меньшую СКО управления.
В третьей главе предложен метод синтеза нейросетевого регулятора, минимизирующего СКО управления в контуре. Данный метод является разн витием косвенного адаптивного управления, однако, в отличие от него, в кан честве начального приближения берется НСЦР, полученный в результате имин тации некоторого линейного регулятора по методике, изложенной в главе 2.
Критерий синтеза для объекта с наблюдаемой функцией g(uk, s) и аддин тивной помехой в канале наблюдения nk:
rk - g(uk, s) - nk 2 min (3) k p где uk = N (ik) Ч управляющее воздействие НСЦР. Приведение ошибки управления к выходу НСЦР можно осуществить с помощью нейросетевой мон дели объекта (НСЦО) по схеме, показанной на рис. 2.
ek uk yk rk ^ НСЦР НСЦО z-ek ^ yk Объект z-ek Рис. 2. Обучение нейросетевого регулятора с помощью инвертирования модели объекта.
Обратное распространение ошибки управления через НСЦО к НСЦР, обон значаемое как Bo(uk, yk+1, rk+1), неявно вычисляет якобиан объекта Jk:
Bo(uk, yk+1, rk+1) = z-1(uk) + (rk+1 - yk)/Jk (4) Задача сформулирована в предположении фиксированной архитектуры НСЦР. В этом случае, вопросы выбора набора входов и архитектуры решан лись только для НСЦО. Поскольку нейросетевая модель объекта с обратнын ми связями имеет известные сложности в использовании (необходим анализ устойчивости, существует проблема исчезающего градиента при обучении), за основу был взят многослойный персептрон, реализующий модель предскан зания выхода объекта за счет информации о прошлых выходах объекта и управляющем воздействии (рис. 3).
yk+^ yk z-НСЦО yk-uk z-yk+Объект o Рис. 3. Пример модели с повторением прошлых состояний yk+1 = N (uk, yk, yk-1).
^ Обучение НСЦО вне контура управления осуществлялось по критерию:
o g(uk, s) + nk - N (uk,..., uk-n, yk,..., yk-d) min (5) k Эксперименты с устойчивыми минимальнофазовыми линейными объекн тами первого-третьего порядков показали, что существенным для обучения НСЦО является не порядок объекта, а его инерционность, то есть, длительн ность переходного процесса. Обучающее множество должно формироваться из временных рядов длины, не меньшей времени установления переходного процесса объекта. Глубина регрессии n = 1, d = 1 для объектов второго и более высоких порядков оказалась достаточной, чтобы обеспечить обучение НОР в контуре.
Увеличение количества слоев с одного до двух и трех в проведенных эксн периментах позволило ускорить обучение НСЦО и увеличить точность имин тации. Число входных нейронов в случае многослойной сети в 1.5Ц3 раза превышало число входов, а каждый последующий слой состоял из меньшего числа нейронов, чем предыдущий.
Систематически исследовался вопрос формирования выборки для обун чения НСЦО. Было выявлено, что определяющим требованием к выборке является распределение амплитуд, соответствующее рабочей области возмун щений и наблюдаемых выходов объекта. Пробный сигнал при этом может быть ступенчатым, гармоническим или стохастическим.
Для исследования влияния НСЦО и параметров обучения нейросетевого оптимального регулятора в контуре управления был проведен ряд имитацин онных экспериментов в специальных идеальных ус ловиях повторяющегося псевдослучайного ряда уставки и помехи. Данный прием позволил устанон вить ряд закономерностей, в частности, в противоположность результату из главы 2, было обнаружено, что более сложные архитектуры нейросетевого оптимального регулятора (НОР) оптимизируются быстрее, чем простые одн нослойные. В случае двух- и трехслойных НОР скорость обучения не зависит от архитектуры НС модели. Коэффициент скорости обучения при пакетном обновлении коэффициентов НОР в контуре управления целесообразно выбин рать обратно пропорционально периоду обновления.
На рис. 4а показаны среднее значение и отклонение ошибки для финальн ной достигнутой СКО (при скорости спада СКО меньше 10-5), а на рис. 4б Ч среднее и отклонение ошибки на тестовой выборке после обучения.
1 Mean Mean StdDev StdDev 0.1 0.управления а 0.01 0.ошибк а Ошибк 0.001 0.0Финальная 0.0001 0.001 10 100 1000 10000 1 10 100 1000 100Длина эпохи Длина эпохи а) б) Рис. 4. Зависимость 2 от длительности эпохи по завершении обучения (а) и на тестовой выборке (б).
Анализ графиков свидетельствует, что в условиях эксперимента длительн ность эпохи (период обновления весов НСЦР при обучении) целесообразно выбрать в пределах от 200 до 400. При меньшем значении обучение НОР подвержено случайным факторам и помехам, а при большем Ч увеличение длительности обучения не дает снижения СКО управления.
Учитывая стохастический характер СКО управления в реальных условин ях и результаты исследований в идеальных условиях, для останова обучения НОР в контуре проверялась гипотеза постоянства среднего значения с пон мощью статистического критерия серий, основанного на медиане. Выявлено, что оптимальное линейное управление или близкое к нему является худшим стартом для синтеза НОР, чем управление значительно худшего качества.
Сравнительные эксперименты обученного НОР и винеровского оптимальн ного регулятора, рассчитанного для заданного объекта и сигналов, показали, что НОР с входами rk, ek обеспечивает меньшую абсолютную и СКО управлен ния как в номинальных условиях, так и при других видах сигналов уставки.
В частности, отмечена меньшая зависимость ошибки управления от частоты гармонической уставки в контуре с НОР по сравнению с винеровским регун лятором (рис. 5).
3 2.Винеровский Винеровский Нейросетевой Нейросетевой 2. 1. 1. 0. 0. 0.01 0.1 0.01 0.Частота, 1/отсчеты Частота, 1/отсчеты а) б) Рис. 5. Зависимость максимальной (а) и среднеквадратической ошибки управления (б) от частоты гармонической уставки при винеровском и нейросетевом оптимальном управлен нии.
В четвертой главе рассматривается задача нейросетевого управления нестационарным объектом. В качестве модели нестационарности было взян то ступенчатое изменение параметров объекта. Предложены и исследованы два подхода адаптации НСЦР к изменившимся условиям Ч метод постоянной СКО управления Ошибка управления адаптации (ПА) и метод адаптации по обнаружению разладки (АР). В рамн ках первого метода реализована схема косвенного адаптивного управления с постоянно обучающейся моделью объекта, таким образом, подстраиваются весовые коэффициенты как НСЦР, так и НС-О независимо от того, изменилн ся объект управления или нет. Второй подход подразумевает, что НСЦР и НСЦО в стационарном режиме неизменны. При этом ошибка идентификации нейросетевой модели используется для обнаружения разладки по дисперсии с помощью алгоритма кумулятивных сумм (АКС).
При изменении параметров объекта в схеме с постоянной адаптацией под обеих НС начинается со следующей эпохи. В схеме с обнаружением разладки необходимо собрать данные для перенастройки нейросетевой модели объекта вне контура управления, обучить её и, вернув в контур, начать обучение НСЦР подобно тому, как это описано в главе 3. При этом важно чтобы, с одной стороны, обучающая выборка для модели была как можно короче, чтобы быстрее начать подстройку НСЦР, с другой стороны, выборка должна быть достаточного объема для обучения НСЦО. Разработан оригинальный подход, позволяющий сформировать обучающую выборку оптимального размера и основанный на оценке параметров двумерного распределения точек (uk, yk+1).
Сравнительные испытания обоих адаптивных подходов проиллюстрирон ваны на рис. 6.
На графиках рис. 6а видно, что при постоянной адаптации реакция на изменение объекта происходит быстрее, не допускается значительного увелин чения ошибки управления, однако уровень СКО снижается достаточно медн ленно. Адаптация по разладке имеет задержку, вызванную сбором данных для перенастройки НСЦР, однако СКО управления после этого снижается значительно быстрее. Кроме того, рассмотрение обоих подходов на длительн ном временном интервале выявляет неустойчивость подхода с постоянной адаптацией (периоды роста ошибки на рис. 6б).
Пятая глава посвящена нейросетевому решению одной из актульных прикладных задачач Ч управлению мобильным роботом при движении к 1 Без адаптации НС-Р Постоянная адаптация НС-Р Ошибка управления (ПА) Адаптация НС-Р по обнаружению разладки Ошибка идентификации (ПА) 0.8 Ошибка управления (АР) 0.0.0.0.0 0.0 2000 4000 6000 8000 10000 12000 14000 0 5e+05 1e+06 1.5e+06 2e+06 2.5e+06 3e+Дискретное время Дискретное время а) б) Рис. 6. Среднеквадратическая ошибка управления сразу после изменения параметров обън екта (а) и во время длительного периода стационарности (б).
неподвижной цели (маяку). Мобильный робот представляет собой тележку с тремя колесами, два из которых являются ведущими, расположены спен реди и одно рояльное сзади. Управление движением робота осуществляется подачей одинакового или различающегося напряжения на ведущие приводы.
Сенсором выступает видеокамера, с помощью которой определяется горизонн тальное отклонение положения робота от направления на маяк.
Задача управления является нелинейной геометрически и динамически, имеет место ошибка в определении направления на маяк, кроме того, паран метры приводов не известны точно. В таких условиях имевшийся на роботе линейный П регулятор давал существенную ошибку попадания в цель. По методикам, изложенным в главах 2 и 3 был сначала синтезирован НСЦР, функционирующий подобно исходному П регулятору, а потом с помощью нан строенной нейросетевой модели НСЦР был обучен в контуре управления для минимизации СКО. Поскольку постановка задачи подразумевает поддержан ние постоянного уровеня уставки rk = 0, а объект управления нелинейный, для НСЦР была выбрана трехслойная архитектура с пятью и тремя нейрон нами в скрытых слоях и входами ek, ek. Модель объекта имела в качестве входов uk, uk-1, yk, yk-1 и один скрытый слой с пятью нейронами.
Адаптация по разладке Среднеквадратическая ошибка Изменение параметров объекта Среднеквадратическая ошибка управления Эксперименты показали, что нейросетевое управление позволило сущен ственно увеличить точность попадания в маяк по сравнению с исходным П регулятором: средняя ошибка уменьшилась с 49.6 мм до 19.1 мм, а среднен квадратическое отклонение уменьшилось с 206.6 мм до 33.0 мм. Графики изменения горизонтальной координаты маяка в поле зрения сенсора робота по времени приведены на рис. 7.
250 31st test 2nd test 2200 3rd test 4th test 5th test 2150 6th test а а 11150 маяк маяк а а --динат динат -1-1-1Коор Коор -1-2-2-250 -20 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 Время, отсчеты Время, отсчеты а) б) Рис. 7. Траектория координаты маяка в поле зрения сенсора робота под управлением П регулятора (а) и нейросетевого регулятора по окончании его настройки в контуре (б).
В шестой главе описывается программный пакет для моделирования и обучения методам нейросетевого управления, разработанный для реализации методик, описанных в главах 2-4 и использовавшийся при проведении всех экспериментов включая управление мобильным роботом. Пакет обеспечивает полный комплекс инструментов для моделирования САУ включая нелинейн ные и нестационарные элементы, а также обладает средствами формирован ния архитектуры и обучения нейронных сетей регулятора и модели.
Состав программного обеспечения включает комплекс вычислительных программ, написанных на языке C++ и реализующих алгоритмы моделирован ния и обучения нейронных сетей, а также интерактивные программы, напин санные на языке Tcl/Tk, обеспечивающие простую и удобную для пользоватен ля среду взаимодействия. Такая структуризация обеспечивает максимальную гибкость программного обеспечения при минимальных требованиях к аппан ратной и программной среде выполнения. В частности, пакет, разработанный для ОС Linux может быть легко адаптирован для ОС Windows и MacOS X.
Для моделирования САУ и обучения нейронных сетей в различных схен мах их использования в рамках пакета разработана объектно-ориентированн ная библиотека, использующая в качестве базовой абстракции сети Петри.
Программный пакет открыт для интеграции с другими программами, так как использует текстовый формат для представления данных, параметн ров вычислительных программ и нейросетей. Кроме того, возможна разран ботка сторонних модулей для реализации нелинейных объектов управления и регуляторов любых видов (например, нечетко-логических) и их использон вания в среде моделирования САУ.
На основе программного пакета разработаны лабораторные работы для использования в учебном курсе по изучению нейронных сетей по темам:
Синтез нейросетевого оптимального регулятора для замены линейного.
Сравнительный анализ нейросетевого, винеровского и ПИД регулятон ров.
Нейросетевое управление нестационарным объектом.
Основные результаты 1. Разработана и успешно опробована в ряде имитационных эксперименн тов методика замены линейных П, ПИ, ПИД регуляторов на нейросетен вой. В рамках методики решены актуальные вопросы выбора архитекн туры нейронной сети регулятора, параметров экспериментальных выбон рок и алгоритма обучения. Исследовано влияние указанных аспектов, а также вида и длины пробных сигналов на качество имитации традин ционного регулятора нейросетевым. Показана применимость методики для управления линейными объектами до 3-го порядка включительно и существенно нелинейным объектом.
2. Предложен алгоритм синтеза нейросетевого регулятора, минимизируюн щий среднеквадратическую ошибку управления. Алгоритм использует нейросетевую инверсию по модели предсказания объекта и рассматрин вается в случае стохастических сигналов уставки и помехи. Эксперин ментально проведен сравнительный анализ нейросетевого оптимальнон го и винеровского оптимального регуляторов. Отмечена большая рон бастность нейросетевого оптимального регулятора по сравнению с вин неровским при сравнимом и лучшем качестве управления. Ещё одним преимуществом нейросетевого оптимального регулятора перед винеровн ским является удобство синтеза, так как нет ограничений на физичен скую реализуемость и нет необходимости в аналитической идентификан ции объекта и сигналов.
3. Разработаны два нейросетевых алгоритма управления нестационарным объектом: с постоянной адаптацией регулятора и модели, и с адаптан цией по обнаружению разладки с помощью алгоритма кумулятивных сумм. Исследован вопрос накопления обучающей выборки для подстройн ки модели объекта. Проведено сравнение обоих алгоритмов. Отмечено, что алгоритм с обнаружением разладки обеспечивает большую эконон мичность и устойчивость управления, чем метод с постоянной адаптан цией регулятора.
4. В рамках натурных экспериментов успешно решена задача нейросетевон го управления автономным мобильным роботом при движении на непон движный маяк. При этом использовались предложенные методики по замене линейного регулятора на нейросетевой и синтеза нейросетевого оптимального регулятора.
5. Развитые методы нейросетевого управления реализованы в оригинальн ном модульном интерактивном программном комплексе, обеспечиваюн щем полную среду для изучения и сопоставления нейросетевых алгоритн мов в системах автоматического управления. Данный комплекс адаптин рован для использования в учебном процессе в качестве базового для проведения лабораторных и исследовательских работ студентами.
Публикации по теме диссертации 1. Елисеев В. Л., Филаретов Г. Ф. Методика синтеза нейросетен вой системы управления нестационарным объектом // Вестник МЭИ. 2010. № 3. С. 100Ц106.
2. Елисеев В. Л., Филаретов Г. Ф. Программный пакет для мон делирования и обучения методам нейросетевого управления // Открытое образование. 2011. № 2(86), Ч.2. С. 98Ц101.
3. Елисеев В. Л. Нейросетевое оптимальное управление движением мобильн ного робота // Доклады 10-го Всероссийского семинара УНейроинформан тика и ее приложенияФ. Красноярск: 2002. Ч октябрь.
4. Елисеев В. Л. Методика построения обучающей выборки при нейросен тевой идентификации в условиях стохастических сигналов // Труды XXXVII международной конференции УИнформационные технологии в науке, образовании, телекоммуникации и бизнесеФ. Алушта: 2010. Ч май.
5. Елисеев В. Л. Нейросетевой аналог ПИД регулятора при управлении нелинейным объектом // Труды XVI всероссийской научно-технической конференции студентов, молодых ученых и специалистов УНовые инн формационные технологии в научных исследованияхФ. Рязань: 2011.
С. 199Ц201.
6. Елисеев В. Л., Зенкевич С. Л. Метод нейросетевого оптимального управн ления // Труды Девятой Всероссийской научно-практической конференн ции УАктуальные проблемы защиты и безопасностиФ. Т. 5. Санкт-Петерн бург: 2006. Ч апрель. С. 251Ц256.
7. Елисеев В. Л., Филаретов Г. Ф. Моделирование ПИД-контроллера с пон мощью искусственной нейронной сети // Перспективные технологии авн томатизации. Вологда: 1999. С. 108.
8. Елисеев В. Л., Филаретов Г. Ф. Особенности настройки нейросетевого регулятора в контуре управления // Труды XV международного научнон технического семинара УСовременные технологии в задачах управления, автоматики и обработки информацииФ. Алушта: 2006. Ч сентябрь. С. 155.
9. Филаретов Г. Ф., Елисеев В. Л. Нейросетевой оптимальный регулятор // Доклады международной конференции УИнформационные средства и технологииФ. Т. 3. Москва: 2000. Ч октябрь. С. 64Ц67.
10. Филаретов Г. Ф., Елисеев В. Л. Особенности применения нейронных сетей в системах управления // Доклады международной конференции УИнн формационные средства и технологииФ. Москва: 2003. Ч октябрь.
11. Филаретов Г. Ф., Елисеев В. Л., Аверченков Е. О. Разработка программн ных средств нейросетевого моделирования случайных процессов и систем управления // Доклады международной конференции УИнформационные средства и технологииФ. Москва: 1999. Ч октябрь.
12. Eliseev V. L., Filaretov G. F. Software tool for neural network control algoн rithm research // 45h International Scientific Colloquium,. Ilmenau Technical University: 2000. Ч October.
13. Filaretov G. F., Eliseev V. L. Modified Algorithm of Neural Network Conн trol for Non-stationary Object // 55h International Scientific Colloquium.
Ilmenau University of Technology: 2010. Ч September.
Авторефераты по всем темам >> Авторефераты по техническим специальностям