На правах рукописи
АФАНАСЬЕВА Татьяна Васильевна
МЕТОДОЛОГИЯ, МОДЕЛИ И КОМПЛЕКСЫ ПРОГРАММ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ НА ОСНОВЕ НЕЧЕТКИХ ТЕНДЕНЦИЙ
Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ А В Т О Р Е Ф Е Р А Т диссертации на соискание ученой степени доктора технических наук
Ульяновск - 2011
Работа выполнена на кафедре Информационные системы в Ульяновском государственном техническом университете.
Научный консультант: доктор технических наук, профессор Ярушкина Надежда Глебовна
Официальные оппоненты: доктор технических наук, профессор Соснин Петр Иванович доктор технических наук, профессор Ковалев Сергей Михайлович доктор технических наук, профессор Еремеев Александр Павлович
Ведущая организация: Таганрогский технологический институт Южного федерального университета (ТТИ ЮФУ)
Защита состоится л ________2012 г. в ___ часов на заседании диссертационного совета Д 212.277.02 при Ульяновском государственном техническом университете по адресу: 432027, г.Ульяновск, ул.Северный Венец, 32 (ауд. 211, Главный корпус).
С диссертацией можно ознакомиться в библиотеке Ульяновского государственного технического университета.
Автореферат разослан л_______________2011г.
Ученый секретарь диссертационного совета, В.Р. Крашенинников доктор технических наук, профессор
Актуальность.
Развитие инфокоммуникационных технологий обеспечило принципиально новую возможность более широкого доступа конечных пользователей к решению задач анализа поведения сложных организационно-технических систем по временным рядам (ВР), накопленных в базах данных в результате мониторинга. Особенностью сложных организационно-технических систем является тот факт, что их поведение часто отражает динамику слабоструктурированных процессов, а соответствующие им ВР характеризуются высокой степенью неопределенности вследствие нестационарности, неточности и недостаточности наблюдений, нечеткости и нестабильности тенденций.
Анализ временных рядов в рамках статистического подхода при несомненных достоинствах и широком признании не ориентирован на прогнозирование ВР с обозначенными свойствами. Так, результаты моделирования ВР, обладающих высокой степенью неопределенности, на основе базовых стохастических и регрессионных моделей, реализованных в статистических ППП, напрямую зависят от математической квалификации и опыта специалистов предметных областей, при этом не всегда удается построить адекватные модели, обеспечивающие требуемую точность прогнозирования и соответствие поведения модели поведению исходного ВР. Кроме того в статистические модели не предусматривают лингвистическую интерпретацию результатов, а в современных условиях помимо специалистов предметных областей конечными пользователями анализа ВР выступают системы аналитической обработки данных (OLAPсистемы), системы добычи данных (DataMining-системы), экспертные системы и системы интеллектуального анализа, оперирующие лингвистически выраженными значениями.
В настоящее время активно развивается новое направление Time Series Data Mining для решения проблемы анализа ВР, обладающих высокой степенью неопределенности, в основе которого лежат методы и модели искусственного интеллекта, в частности нейросетевые и нечеткие модели. Не претендуя на высокую точность, методы направления Time Series Data Mining ориентированы на извлечение полезной для конечных пользователей информации и существенно отличаются от нашедших широкое применение в технике и теории управления методов работы со стационарными и нестационарными случайными процессами. Так, ориентированные на обучение и моделирование нелинейных зависимостей искусственные нейронные сети значительно снижают требования к математической подготовке специалистов предметных областей, однако, нейросетевые модели не имеют формального представления, а также не предусматривают интерпретацию результатов анализа ВР, что ограничивает их применение.
Философия нечеткого моделирования поведения сложных систем по ВР основана на базовой модели нечеткого динамического процесса (Song, Chissom, 1993), получившей название нечеткого временного ряда (НВР). В НВР состояниям динамического процесса сопоставлены нечеткие значения, моделируемые параметрическими функциями принадлежности, извлечении зависимостей между ними в форме совокупности нечетких правил ЕслиТо, количественно выражаемых матрицей нечеткого отношения. Для прогнозирования НВР применяется численный метод на основе алгоритма нечеткого логического вывода.
Методы анализа НВР показали свою продуктивность в прогнозировании процессов на транспорте, в ИКТ, в области образования, экономики, экологии и машиностроении, когда получение полных количественных данных не представляется возможным или не является достаточным.
Анализ возможностей и недостатков методов нечеткого моделирования ВР выявил ряд нерешенных научно-технических и методологических проблем:
проблему повышения точности прогноза, информативности за счет идентификации нечеткой тенденции, проблему определения целостной логически связанной организации объектов анализа ВР, проблему разработки критериев эффективности и методики оценивания результатов нечеткого моделирования.
Выше обозначенные проблемы по сути формируют важную научнотехническую проблему разработки нового подхода и его методологии для анализа ВР, обладающих высокой степенью неопределенности.
В основу нового подхода как представляется целесообразно положить формализацию и анализ нового объекта ВР - нечеткой тенденции, описывающей его локальное (краткосрочное) и долгосрочное поведение.
Решение этой новой проблемы имеет научный и практический интерес для анализа и прогнозирования структурных изменений в поведении ВР и его основной тенденции.
Таким образом, существующее противоречие между практической потребностью в решении задач анализа и прогнозирования накопленных в базах данных ВР, обладающих высокой степенью неопределенности, и ограниченными возможностями существующих методов их моделирования определяет актуальность исследования.
Целью работы является повышение эффективности анализа ВР путем разработки методологии нового подхода, включающего теоретические положения, модели, методы, критерии, алгоритмы, а также комплексы программ моделирования и прогнозирования ВР, обладающих высокой степенью неопределенности, на основе идентификации нечетких тенденций.
Для достижения сформулированной в диссертационной работе цели необходимо решить следующие научные задачи.
1. Проанализировать и оценить применимость известных подходов к анализу ВР и сформулировать принципы методологии нового подхода анализа временных рядов, обладающих высокой степенью неопределенности, включающего задачи, объекты, модели, методы на основе идентификации нечетких тенденций.
2. Разработать теоретические положения, формальную модель нечеткой тенденции, классификацию нечетких тенденций НВР.
3. Разработать теоретические положения, алгоритм построения и математическую модель ВР, включающую компоненту, характеризующую ее поведение в терминах нечетких тенденций.
4. Разработать и исследовать методы прогнозирования нечетких тенденций и значений ВР, обладающих высокой степенью неопределенности.
5. Разработать методику оценки адекватности и новые критерии эффективности для оценивания качества моделей НВР на основе соответствия поведения модели поведению НВР на основе формальной модели нечетких тенденций.
6. Разработать алгоритмы и комплексы программ моделирования и прогнозирования ВР, реализующие модели и методы анализа нечетких тенденций.
Методы исследования.
При решении поставленной научной проблемы были использованы методологические принципы анализа временных рядов, базовые положения теории случайных процессов, теории приближения, нечетких шкал, нечетких моделей, нейронных сетей, нечетких ВР.
Научная новизна положений, выносимых на защиту.
1. Предложен структурно-лингвистический подход, основанный на гранулярном представлении объектов нечеткого моделирования, обеспечивающий повышение эффективности анализа ВР, обладающих высокой степенью неопределенности, за счет снижения погрешности прогнозирования и повышения информативности.
2. Впервые предложены основы теории нового объекта моделирования ВР - нечетких тенденций, включающие формальную модель, классификацию, базовые операции в классе нечетких тенденций.
3. Предложены формальная модель и алгоритм построения нечеткой ACL-шкалы (Absolute Comparative Linguistic), обеспечивающие оценивание значений ВР и компонент нечетких элементарных тенденций, отличающиеся структурой и набором допустимых операций и возможностью учета допустимого уровня погрешности в данных.
4. Предложен метод FT-преобразования (Fuzzy Tendency) ВР, отличающийся решением задач идентификации нечетких элементарных тенденций и преобразования ВР в различные классы нечетких ВР.
5. Разработаны теоретические положения и новая математическая модель ВР в виде нечеткого динамического процесса, отличающаяся включением нечетких приращений для моделирования нечетких элементарных тенденций, обеспечивающая повышение эффективности прогнозирования ВР, обладающих высокой степенью неопределенности, по сравнению с базовыми нечеткими моделями.
6. Предложены методика и новые критерии эффективности моделей ВР, позволяющие решать задачу выбора подходящего класса модели, отличающиеся оценкой соответствия поведения наблюдаемого ВР его модельному представлению.
7. Разработан и исследован новый метод моделирования и прогнозирования ВР (метод НЭТ), отличающийся использованием модели нечеткого процесса с нечеткими приращениями, позволяющий строить оптимальные модели ВР, обеспечивающий повышение точности краткосрочного прогноза значений и нечетких элементарных тенденций для коротких нестационарных ВР (от 7 до 60 наблюдений) базовых моделей класса ARIMA по сравнению с базовыми методами нечеткого и нейросетевого подхода.
8. Разработан и исследован новый интегральный метод прогнозирования ВР, отличающийся от известных интеграцией метода F-преобразования для идентификации нечетких локальных тенденций ВР и метода НЭТ, обеспечивающий повышение точности краткосрочного прогнозирования нестационарных ВР базовых моделей класса ARIMA средней длины (от 60 до 500 наблюдений) по сравнению с методом НЭТ.
9. Разработан комплекс алгоритмов решения задач анализа ВР в терминах нечетких тенденций, включающий алгоритмы построения модели ACL-шкалы, FT-преобразования, лингвистического резюмирования, классификации нечетких динамических процессов, оценивания эффективности моделей, а также модификацию вычислительного алгоритма нечеткого логического вывода для устранения проблем неполноты и избыточности нечеткой модели.
10. Разработаны новые наукоемкие комплексы программ анализа ВР:
комплекс программ интеллектуального анализа ВР FuzzyTend, комплекс программ в форме действующего Internet-сервиса экспресс-анализа состояния предприятий по ВР экономическим показателей, комплекс программ в форме системы автоматизации научных исследований, программный комплекс анализа нечетких и гетерогенных ВР.
Достоверность результатов, представленных в диссертационной работе, обеспечивается корректностью применения математического аппарата, непротиворечивостью фундаментальным положениям методологии анализа ВР, подтверждается близостью расчетных и экспериментальных результатов, сравнением с признанными зарубежными и отечественными аналогами в области анализа ВР, практическим использованием материалов диссертации и разработанных систем на предприятиях.
Практическая значимость исследования. Научные и практические результаты могут быть востребованы в производственных предприятиях, в организациях сферы коммерческих, информационных, телекоммуникационных, транспортных, образовательных, медицинских услуг, связи, финансов, в органах регионального и муниципального управления, в которых в результате мониторинга накоплены данные о функционировании процессов, представляемые в виде временных рядов с высокой степенью неопределенности. Практическая значимость проведенного исследования рассматривается в следующих аспектах:
1. В результате проведенных исследований сформированы новая методология, новый подход и их программные реализации для анализа и прогноза значений и нечетких тенденций временных рядов, ориентированные на нужды пользователей систем анализа ВР за счет учета их профессиональных знаний, представления результатов в лингвистической форме и значительного снижения трудоемкости моделирования временных рядов. Пользователями результатов исследования в виде комплекса прикладных программ интеллектуального анализа ВР FuzzyTend могут быть специалисты-эксперты различных предметных областей без специальной математической подготовки.
2. Важным практическим результатом диссертационной работы является анализ и прогнозирование лингвистически выраженных качественных оценок значений ВР и нечетких тенденций, текстовое представление (лингвистическое резюмирование) результатов анализа ВР.
Именно такие результаты необходимы как исходные данные экспертным системам, активно развивающихся в предметных областях, имеющих важное народнохозяйственное значение.
3. Приложение научных результатов к анализу экономических временных рядов реализовано в действующем Internet-сервисе экспрессанализа деятельности предприятий на основе интегрального метода прогнозирования нечетких тенденций экономических показателей.
Разработанный программный продукт не требует специальной подготовки пользователей, что делает его наиболее востребованным предприятиями малого и среднего бизнеса. Использование Internet-сервиса позволяет значительно сократить время экспресс-анализа экономических показателей предприятий, уменьшить трудозатраты. Зарегистрированными пользователями Internet-сервиса экспресс-анализа предприятия по экономическим показателям в настоящее время являются десять российских предприятий различного профиля.
4. Использование научных результатов диссертации для анализа и прогнозирования временных рядов, представляющих функционирование трафика вычислительных сетей, составляет отдельный аспект практической значимости исследования. Установлено, что анализ и прогноз нечетких тенденций позволяет выявить новые зависимости в поведении ВР, представление результатов в лингвистической форме при решении задачи резюмирования является новым средством интеллектуальной поддержки администраторов сетей при решении задач диагностики и реинжиниринга сетей. Алгоритмы, методы, методика анализа ВР на основе нечетких тенденций используются на ФНП - ОАО НПО Марс в форме программной системы анализа телекоммуникационного трафика.
Реализация результатов работы. Результаты диссертационной работы получили положительное экспертное заключение при выполнении НИР в рамках федеральной целевой программой (ФЦП) Научные и научнопедагогические кадры инновационной России на 2009-2013 годы, государственный контракт от 20 июля 2009 г. № 02.740.11.5021;
использованы при выполнении НИР, поддержанных грантами РФФИ № 0901-99007 (2009-2010гг), № 10-01-00183 (2010-2012гг.); госбюджетной НИР № 012.007.06.621(2006-2010гг.), отмечены на международной выставке в Сеуле CIIF-2010 золотой медалью, отражены в двух учебных пособиях и использованы в учебном процессе в Ульяновском государственном техническом университете, ряд задач исследования решался в рамках х/д НИР № 100/.05, выполняемого УГТУ по заказу ФНП - ОАО НПО Марс.
Апробация результатов работы. Основные положения и результаты диссертации доложены и получили одобрение на 26 международных конференциях и выставках, семинарах и конференциях с международным участием, в том числе:
Непрерывно-логические и нейронные сети и модели, Ульяновск, 1995;
Информационные технологии в науке и образовании, Шахты, 2002;
Применение новых технологий в образовании, Троицк, 2002; Континуальные алгебраические логики, исчисления и нейроинформатика в науке и технике, Ульяновск, 2005; Континуальные алгебраические логики, исчисления и нейроинформатика в науке и технике, Ульяновск, 2006; Интеллектуальные системы(AISТ08) и интеллектуальные САПР (CAD-2008), Дивноморское, 2008; Одиннадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2008,г.Дубна, 2008; Нечеткие системы и мягкие вычисления (НСМВ-2008), г. Ульяновск, 2008;
Математическое моделирование физических, экономических, технических, социальных систем и процессов, г. Ульяновск, 2009; Интегрированные модели и мягкие вычисления, г.Коломна, 2009; 13th IFSA World Congress and the 6th Conference of EUSFLAT, Lisbon, Portugal, 2009; Математическое моделирование в образовании, науке и производстве, г. Тирасполь, 2009;
Interactive Systems and Technologies: the Problems of Human-Computer Interaction. Ulyanovsk, 2009; ИННОВАТИКА-2010, Ульяновск, 2010;
Computational Intelligence. Foundations and Applications, Chengdu, China, 2010; WCCI-2010 2010 IEEE World Congress on Computational Intelligence, Barcelona, Spain, 2010; 9th Int. Conf. on Application of Fuzzy Systems and Soft Computing (ICAFS 2010), Prague, 2010; Seoul International Inventory Fair, Seoul, Korea, 2010 (SIIF 2010); Труды Конгресса по интеллектуальным системам и информационным технологиям AIS-ITТ10. Дивноморское, 2010; Двенадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2010, Тверь, 2010;
Интеллектуальный анализ временных рядов, г. Ульяновск, 2010, Системный анализ и семиотическое моделирование, Казань 2011, Интегрированные модели и мягкие вычисления, г.Коломна, 2011; 13th conference Rough Sets, Fuzzy Sets, Data Mining and Granular Computing, Moscow, 2011; Труды Конгресса по интеллектуальным системам и информационным технологиям AIS-ITТ11. Дивноморское, 2011; 14th IFSA World Asia Congress, Indonesia, 2011.
На 10 всероссийских конференциях, симпозиумах и семинарах, в том числе:
Научно-технической конференции молодых ученых и специалистов Дагестана, Махачкала, 1985; Информационная среда вуза XXI века, Петрозаводск, 2007; Нейроинформатика, ее приложения и анализ данных, Красноярск, 2009; Третьей Всероссийской научной конференции Нечеткие системы и мягкие вычисления НСМВ-2009, Волгоград, 2009; II научнопрактической конференции Инновационное развитие российской экономики, Москва, 2009; Проведение научных исследований в области обработки, хранения, передачи и защиты информации, Ульяновск, 2009;
Информатика, моделирование, автоматизация проектирования (ИМАП-2010), Ульяновск, 2010, Нечеткие системы и мягкие вычисления, Адлер,2011.
Неоднократно основные положения диссертационной работы докладывались на ежегодных научно-технических конференциях Ульяновского государственного технического университета в период с 1993 по 2011 гг.
Публикации. По теме диссертации опубликовано 101 работа, среди которых одна монография, 19 статей в изданиях, рекомендованных ВАК, 5 статей в ведущих зарубежных изданиях, два учебных пособий (одно с грифом УМО), 4 свидетельства о регистрации программ.
ичный вклад автора. Все основные научные и практические результаты, экспериментальные исследования, выводы, составляющие содержание диссертации, получены автором самостоятельно.
Структура и объем диссертации. Диссертационная работа состоит из введения, шести глав, заключения, списка литературы из 138 наименований, 4-х приложений, и содержит 265 страницы машинописного текста.
КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ Во введении обосновывается актуальность темы, приводится общая характеристика работы, сформулированы цель и задачи работы, определены методы исследования, подчеркнута научная новизна и практическая ценность полученных результатов.
В первой главе приведены особенности и примеры ВР, хранимых в базах данных, анализ подходов к анализу ВР, описаны подходы к анализу ВР и классы моделей НВР. В сложных технических, экономических, социальных системах в условиях высокой неопределенности оценка качества функционирования процессов и прогноз их развития основаны на методах анализа ВР, накопленных в результате мониторинга в базах данных.
Примерами могут служить базы данных показателей процессов и индексов развития в ИКТ, в производстве, в экономике, в образовании, в здравоохранении, в энергетике и т.д.
Важной научно-технической проблемой является анализ и прогнозирование ВР, особенностью которых является высокая степень неопределенности, выражающаяся в сочетании факторов: небольшой длине (10-60 наблюдений), нестационарности поведения, неточности значений и нечеткости тенденций.
Решение этой проблемы позволит моделировать поведение слабоструктурированных процессов, что создаст возможность для повышения качества принимаемых решений.
Практическое моделирование и прогнозирование ВР с указанным комплексом свойств на основе стохастических, регрессионных и нейросетевых моделей в рамках существующих ППП в условиях неизвестности класса моделей, к сожалению, не всегда позволяет получить адекватные и точные модели, поведение которых соответствует поведению ВР. Это связано с тем фактом, что короткие ВР, генерируемые моделями стационарных процессов, могут выглядеть как реализации нестационарных процессов, а ВР, генерируемые моделями нестационарных процессов типа DSP, нередко классифицируются как реализация нестационарных процессов типа TSP. Поэтому приведение к стационарности коротких ВР, динамика которых нечетко выражена, часто не приводит к ожидаемому результату.
Анализ новых требований и сравнение степени соответствия им методов моделирования статистического, нейросетового, нечеткого и гибридного подходов показывают преимущества и перспективность развития нечеткого моделирования для решения обозначенных проблем в области анализа ВР, обладающих высокой степенью неопределенности.
Принципиальным отличием нечеткого моделирования является возможность анализировать не только числовые, но и лингвистические временные ряды, снижение требований к математической квалификации пользователей до минимума, возможность включения предметно-ориентированных знаний, высокая интерпретируемость модели и результатов.
Математическую основу НВР составляют нечеткие модели и теоретические выводы, в частности, теорема FAT (Fuzzy Approximation Theorem, Коско, 1992), согласно которой любая функциональная зависимость, заданная на компактном множестве, может быть аппроксимирована нечеткой моделью.
Ванг (1992г.) показал, что нечеткая модель вида Если-То является универсальным аппроксиматором, то есть может приближать любую непрерывную функцию с произвольной точностью. В 1995 г. Кастро доказал справедливость свойства универсальной аппроксимации для широкого спектра нечетких моделей.
В связи с этим с начала 1993 года идет становление теории, методологии и практики моделирования и прогнозирования НВР, которые развиваются в трудах иностранных ученых, таких как Q. Song, B. Chissom, S. Chen, Q.
Tanaka, М. Sah, V. Pedrich, V. Novak, I. Perfilieva, а также в работах отечественных ученых - Н. Ярушкиной, И. Батыршина, С. Ковалева Ю.
Кудинова, К. Дегтярева, Т. Юнусова.
Целью моделирования ВР является идентификация нелинейной модели, описывающей динамику исследуемого динамического процесса, в виде ~ ~ модели нечеткого ВР Хt Хt1 R(t,t 1) (Song&Chissom, 1993), данная модель (обозначим эту модель НВР S) - частный случай модели порядка p:
~ ~ ~ ~ Хt (Хt1 Хt2 ... Хtp) R(t,t p), min max p R(t,t p) ~, хti1,...~ti p хt j ~ х . (1) j,i1,i2,...
ip p Применение модели (1) для прогнозирования первых разностей ВР рассмотрено в работе Sah&Degtyarev (обозначим эту модель НВР Dмоделью). При моделировании числовых ВР в рамках нечеткого динамического процесса числовые значения предварительно преобразуют в ~ нечеткие (фаззифицируют) хt Fuzzy(xt ), а результаты - дефаззифицируют хt deFuzzy(~t ). Численный алгоритм Мамдани наиболее часто используется для x решения системы нечетких луравнений.
Отдельно отметим метод нечеткого сглаживания с сохранением характера поведения ВР на основе F-преобразования (I. Perfilieva), относящийся к численным методам приближенного описания непрерывной функций на основе множества базисных функций. Базисные функции, строятся по оси t.
Положительным свойством F-преобразования, важным для использования в качестве метода сглаживания ВР, наряду с простыми вычислительными процедурами, является выделение основной тенденции в форме кусочнолинейного тренда.
Нерешенными проблемами являются моделирование и прогнозирование нового объекта анализа - нечетких тенденций НВР. Решение этой проблемы позволит получить новую информацию о поведении ВР, в частности об изменении нечетких тенденций, выраженную в лингвистической форме, что будет способствовать более глубокому пониманию природы ВР, обладающих высокой степенью неопределенности.
С учетом этого можно констатировать, что существующие методы моделирования не в полной мере решают важную научно-техническую проблему анализа ВР, обладающих высокой степенью неопределенности, а.
Во второй главе рассмотрен структурно-лингвистический подход к анализу ВР. Известно, что задачи оценки качества и прогноза развития сложных процессов по временным рядам успешно решаются экспертами на основе предметно-ориентированных знаний. В основе экспертной деятельности лежат операции структурирования и лингвистической интерпретации.
Вышеизложенное является обоснованием для разработки нового подхода, названного структурно-лингвистический подход. Предложенный подход, ориентирован на повышение эффективности анализа ВР, обладающих высокой степенью неопределенности, и характеризуется следующими принципами.
1. Принцип лингвистической интерпретируемости.
Моделируются соответствующие материальным или идеальным объектам наблюдения или измерения, которым можно дать лингвистические оценки значений и их изменений.
2. Принцип относительности. Для разных предметных областей один и тот же ВР может иметь разные модели. Для объектов ВР различной природы требуются различные по содержанию классы модели.
3. Принцип дополнительности. Математическое моделирование поведения объектов, имеющих разную природу и уровень абстракции, определяет единственно возможный способ представления поведения ВР конечным множеством независимых моделей, недоступных моделям другой ориентации.
Каждая независимая модель дополняет остальные модели за счет представления и объяснения поведения отдельного объекта ВР.
Сформулирована новая научная проблема в рамках структурнолингвистического подхода, как задача анализа нечетких тенденций нечетких ВР (рис.1). В рамках новой задачи изменения в нечетком временном ряду рассматриваются как результат совместного влияния неизвестных факторов, которые могут быть значимы и незначимы. Значимые влияния приводят к качественному изменению значений и должны быть включены в модель, а незначимыми изменениями можно пренебречь. Такие качественные изменения (нечеткие приращения) в числовых ВР рассмотрены в работах С.Ковалева, Sah&Degtyarev, а в работах Н.Ярушкиной изменения поведения в нечетких временных рядах получили название нечеткие тенденции.
Рис.1. Проблема анализа нечетких тенденций НВР, i [1, n] Пусть задан дискретный ВР Y={ti, xi}. Согласно базовым положениям теории нечетких временных рядов, разработанным Zade, Song, Chissom, любой конечный дискретный ВР - числовой, нечисловой и ~ смешанный - может быть преобразован в нечеткий ВР Y {ti,~i}, i [1,n] при x Х {xi} условии, что его множество значений будет покрыто специальными ~ ~ функциями (нечеткими множествами) xi Х.
Определение 1. Каждая нечеткая тенденция нечеткого временного ряда ~ Y {ti,~i}, i [1,n] может быть представлена структурной моделью в виде x кортежа отношения, построенного на декартовом произведении свойств ~ ~ нечеткой тенденции V A :
~ ~ v, a, t, , где - наименование нечеткой тенденции из множества , ;
~ ~ ~ v - тип нечеткой тенденции (тип изменений) v V выражает основные качественные зависимости временных рядов. Введем инвариантное по отношению к предметным областям и временным рядам множество ~ ~ ~ ~ лингвистических термов типов нечетких тенденций: V V1V 2, где Vопределяет множество базовых типов тенденций НВР, которое конечно и ~ ~ ~2,v ~ ~3} ограничено тремя типами V1 {v1,v, v1=Стабилизация, ~ ~2 ~ v =Падение, v3=Рост, V 2 - множество производных типов тенденций ~ ~4,v ~~5} НВР, которое также конечно и ограничено V 2 {v, v =Колебания, ~ v5=Хаос.
~ ~ ~ a - интенсивность нечеткой тенденции, a A, которое может быть выражено лингвистически, например, значениями из множества {Большое, Среднее, Малое, Отсутствует};
t - продолжительность нечеткой тенденции, t T; ;
- функция принадлежности участка нечеткого временного ряда ограниченного интервалом t нечеткой тенденции .
Классифицируем нечеткие тенденции НВР в зависимости от продолжительности на элементарную (t 1), локальную NN 1 t n 1 ).
( ) и общую GG ( t n Определение 2. Нечеткая элементарная тенденция (НЭТ) - это нечеткая ~ ~ тенденция НВР i , i vi,ai,i , выражающая качественный характер изменения на участке НВР между двумя соседними нечеткими метками НВР ~ ~ хi хi , ~ Утверждение 1. Исходный нечеткий ВР Y {ti,~i}, i [1,n] может быть x представлен в виде НВР нечетких элементарных {ti,i}, i [1,n 1] тенденций и в виде НВР локальных тенденций N {t, N }, j [1,n1], n1 n.
j j Из утверждения 1 и теории нечетких временных рядов следует следующее утверждение.
Утверждение 2. Любой конечный дискретный ВР - числовой, нечисловой и смешанный - может быть преобразован во временной ряд НЭТ.
Основываясь на введенном определении понятия нечеткой тенденции, представим нечеткий ВР НЭТ совокупностью одновременных временных рядов, природа которых обусловлена типом компонент НЭТ:
~ ~ vt,at, t , t 1,2,3....
.
t Содержательно НЭТ определяют нечеткие приращения нечеткого ВР.
Определение 3. Пусть X,(t 1,...) R1 - универсальное множество, на котором t ~ ~ ~ ~ хti,(i 1,2,...) t j,( j 1,2...) ts,(s 1,2,...) определены нечеткие множества,, и Хt ~ ~ ~ ~ хti,(i 1,2,...) t j,( j 1,2...) - коллекция, - коллекция, - коллекция Vt At ~ ~ ~ ~ ~ ~ ~ ts,(s 1,2,...). И пусть существуют отношения RA : X X A такие, RV : X Х V, ~ ~ ~ ~ что V определяет тип, yz A - интенсивность нечеткого приращения yz ~ ~ ~ ~ ~ ~ ~ ~ между нечеткими значениями xy и xz, xy, xz Xt. Тогда НЭТ есть t Vt At, ~ ~ ~ ~ где Vt Vt p Rv, At Atq RA - нечеткие динамические процессы изменения компонент НЭТ.
~ ~ В таком определении и рассматриваются как лингвистические Vt At ~ t j,( j 1,2...) переменные с возможными лингвистическими значениями, ~ ~ ts,(s 1,2,...) соответственно. Так как в каждый момент времени значения и Vt ~ различны, то они могут рассматриваться как функция времени. Согласно At (1) введем модель нечеткого динамического процесса с нечеткими ~ ~ ~ ~ ~ ~ приращениями может быть выражена в форме:
Хt1 t Xt t Vt At где ~ ~ ~ ~ Хt (Хt1 Vt At ) R(t,t 1), где ~ ~ ~ ~ ~ ~ ~ ~ (2) Vt Vt1 Vt2 ...Vt р R~ (t,t р), At At1 At2 ... Atq Ra (t,t q) ~ v Здесь отношения (2) определяют модель поведения НЭТ ВР, которая численно реализуется на основе алгоритма нечеткого логического вывода Мамдани при условии, что компоненты НЭТ в правой части известны.
Достоинство данного вида модели нечеткого динамического процесса, которую назовем Т-моделью ВР, в том, что она позволяет описывать новые нелинейные зависимости, а также в преемственности моделей и методов нечеткого подхода к моделированию нечетких тенденций ВР.
Модель числового ВР будем рассматривать как реализацию нечеткого процесса, полученную в результате дефаззификации (2) в виде динамического процесса с приращениями:
хt xt1 Tendt t, (3) где хt, xt1 - числовые значения, описывающие состояния динамического процесса. Они получены при дефаззификации соответствующих состояний ~ ~ ~ ~ нечеткого процесса :. Считаем, Хt, Хt1 xt deFuzzy(Хt ), xt1 deFuzzy(Хt1),t 1,2,...,n ~ ~ что если, то Tend 0 и хt xt1.Предполагается, что хt есть реализация Хt Хtt ~ нечеткого динамического процесса ; Tendt - числовые значения Хt приращения, полученные в результате дефаззификации НЭТ ~. Значения Tendt представим в виде Tendt = t*t. Здесь t - это Tendt deFuzzy() параметр, определяющий знак приращения (тип НЭТ), t - это параметр, определяющий величину приращения (интенсивность НЭТ). Приращения Tendt в модели (3) назовем элементарной тенденцией, Tendt = t*t - моделью элементарной тенденции, t и t - параметрами модели (компонентами) элементарной тенденции. Тогда модель ВР (3) может быть выражена в виде:
хt xt 1 vt t t (4) n ~ ~ - ошибки модели. Предполагается, что t deFuzzy(t ), t const, t 0, t n tи все значения | t | d. Параметр d будем рассматривать как допустимую погрешность модели. Эта погрешность есть следствие приближенности модели и погрешности в данных.
Допуская, что ошибки есть реализация случайного процесса типа белый t шум модель (3) может рассматриваться и для описания поведения стохастического процесса. Если Tend 0, то модель (3) может быть отнесена t к классу процесса случайного блуждания. В случае Tendt const, и Tendt 0модель (3) содержит линейный тренд и соответствует стохастическому процессу случайного блуждания с дрейфом; в предположении, что Tendt const модель (3) описывает в общем виде стохастический процесс неизвестного класса. В общем случае для временных рядов, обладающих высокой степенью неопределенности, Tendt const и неизвестен характер изменения Tendt, который и требуется оценить.
Введенная модель (2) является частным случаем модели старших порядков, описывающей поведение процесса в терминах нечетких локальных ~ ~ ~ тенденций(t k), тогда Модель числового Хt (Хtk t ) R(t,t k).
представления ВР, полученная в результате дефаззификации, в этом случае хt xtk vt t t.
имеет вид:
Предлагается содержательная классификация нечетких динамических процессов с нечеткими приращениями.
Нечеткий T-процесс порождает нечеткий ВР, если его основная нечеткая тенденция имеет тип рост или падение.
Нечеткий D-процесс порождает нечеткий ВР, если его основная нечеткая тенденция имеет тип хаос.
Нечеткий К-процесс порождает нечеткий ВР, если его основная нечеткая тенденция имеет тип колебания.
Нечеткий S-процесс есть нечеткий процесс, если каждая его составляющая НЭТ имеет тип стабильность.
Нечеткие T- и D-процессы отнесем к классу нечетких нестационарных процессов, а нечеткие К-процесс и S-процесс типа - к классу нечетких стационарных процессов.
В третьей главе рассмотрены теоретические основы анализа нечетких тенденций временных рядов. С методологической точки зрения введение нового объекта, нечеткой тенденции, порождает вопрос о его месте в системе известных объектов анализа ВР.
Рассмотрим ВР на пяти уровнях абстракции, на каждом из которых его поведение может быть представлено в терминах информационных гранул фиксированной семантики и порождаться процессами различных классов.
Для каждого уровня абстракции определим информационную гранулу, кодирующую объект анализа, в виде r x is где r - уровень грануляции ВР;
r = 0: 0 x - гранула числового значения исходного ВР;
~ r = 1: 1 x - гранула нечеткого значения НВР;
r = 2: - гранула НЭТ;
r = 3: 3 n - гранула нечеткой локальной тенденции;
r = 4: - гранула основной нечеткой тенденции.
t4 g Математическое моделирование поведения ВР на заданном уровне грануляции, определяет собой единственно возможный способ его представления конечным множеством моделей, стабильных, независимых и недоступных моделям другой ориентации.
Введем модель гранулярного ВР в виде тройки r r Granule{, Pr, M },r 0,1,...,r где {sr}, (s 1,2...) - совокупность анализируемых объектов ВР на уровне грануляции r; Pr {Pir},(i 0,...,4), i r - совокупность математических соотношений, порождающих гранулы разного уровня (гранулярные r r преобразования) объектов ВР (таблица 1); M {M }, (k 1,2...) - совокупность k математических моделей динамических процессов, порождающих ВР на соответствующем уровне абстракции (таблица 2).
Таблица 1. Математические соотношения гранулярных преобразований Функционал Результат вычисления Вид перехода Pi r ~ ~ Fuzzy: Х r = 0 r = 1 X хt Fuzzy(xt ).
P~ deFuzzy: Х x r = 1 r = 0 X хt deFuzzy(~t ).
P~ ~ ~ r = 1 r = PЕTend: , X X ~ ~ ~ x ~ ~ t ETend (~t1, xt ).
={, } V A ЕTend={Ttend,Rtend}, ~ ~ ~ TTend: , X X V ~ t TTend(~t1,~t ), x x ~ ~ ~ ~ ~ RTend: X X A at RTend(~t1, хt ) х ~ ~ ~ ~ ~ ~ ~ deЕTend: X X r = 2 r = 1 хt = deЕTend ( хt1, vt, t ).
P~ ~ vt deFuzzy(vt ), P02 r = 2 r = 0 deFuzzy: V V, ~ deFuzzy: A A ~ at deFuzzy(at ) ~ deFuzzy: Х ~ хt deFuzzy(t ).
~ ~ ~ STend: r = 2 r = 3 N n STend (1s,,..., ) P32 s 2s ms ~ deSTend: N 1s,,..., (1s,,..., ) deSTend(n ) r = 3 r = P23 2s ms 2s ms s ~ ~ deFuzzy: Х N r = 3 r = 0 хt deFuzzy(n ).
Ps ~ ~ ~ ~ = r = 3 r = 4 GTend: g GTend (n1s, n,..., n ) N N G P43 2s ms ~ ~ deFuzzy: Х G хt deFuzzy(g ).
r = 4 r = P04 q Важной проблемой при этом является формализация соотношений Pi r, позволяющих преобразовывать гранулы разных уровней и, таким образом, обеспечивать их информационное взаимодействие. Для решения этой проблемы и проблемы идентификации компонент нечетких элементарных тенденций для модели (2) представляется целесообразным ввести специальную нечеткую шкалу - ACL-шкалу (Absolute&Comparative Linguistic). Абсолютные оценки, полученные по ACL-шкале, соответствуют нечетким значениям НВР, а сравнительные оценки - нечетким значениям компонент НЭТ НВР.
Таблица 2. Базовые математические модели ВР на разных уровнях грануляции.
r r Математическая модель Подход к анализу ВР M M k 0 Статистический (модель ARIMA) M M Статистический (модель EMA) M St xt (1 ) St0 n Нейросетевой (НС) M y F( xi ) F(WX ) wi i~ ~ ~ ~ Нечеткий (модель: нечеткий Хt (Хt1 Хt2 ... Хt p) R(t,t p) MMдинамический процесс НВР S-модель) ~ ~ ~ ~ Нечеткий (модель: нечеткий Хt (Хt1 Хt2 ... Хt p ) R(t,t p) M динамический процесс для первых разностей НВР D-модель) 2 Нечетко-темпоральный (нечеткий Ф(ta,tb ) (y(ta,tb ) ) & ((ta,tb ) q) M M динамический процесс с нечетким временем) Нечеткий структурно ( ... ) R (t,t p) M t t1 t2 t p лингвистический (Т-модель :
нечеткого динамического процесса с ~ ~ v,a, нечеткими приращениями) ~ ~ ~ ~ ... Rv (t,t р), ~ t t1 t2 t р ~ ~ ~ ~ at t1 t2 ... atq Ra (t,t q) ~ 3 Нечеткий структурноnt (nt1 nt2 ... ntk ) Rn (t,t k) M M лингвистический (ЛТ-модель) 4 Нечеткий структурно~ M M G= {" Рост","Падение","Стабильность", лингвистический (ОТ-модель) "Колебания", " Хаос"} Математическую модель ACL-шкалы представим в виде алгебраической системы:
C={,, }, ~ ~ ~ где ={Х, X, G, P, V, A } - множество объектов;
={F_T, F_C, F_Er} - множество операций на множестве , заданных функциями: F_T = {Fuzzy, DeFuzzy, TTend, RTend} для оценивания нечетких значений ВР; функциями F_C = {STend, GTend} для вычисления новых ~, нечетких значений; функциями F_Er={Er_v, Er_a, Er_ х Er_x} для вычисления погрешностей оценивания (табл. 3).
- множество параметров ={Е, d, MF, nmin, nmax}, где Е - тип ACLшкалы, d - допустимый уровень погрешности в оцениваемых данных, MF - вид функции принадлежности, nmin, nmax - минимально и максимально допустимые значения шкалы.
Предложен следующий алгоритм синтеза ACL-шкалы по наблюдениям.
Шаг 1. Адаптация модели ACL-шкалы к специфике предметной области.
Определение значений вектора ее параметров ={Е, d, MF, nmin, nmax}.
~ ~ хi ~ хi ~ Шаг 2. Определение функций принадлежностей = {x, (x)}, xХ, X, хi i[1,m] класса MF на интервалах длины d универсального множества Х и построение базовой нечеткой шкалы Sx.
Шаг 3. Генерация отношений TTend, RTend, задающих изменения на ~ множестве упорядоченных нечетких градаций X.
Шаг 4. Построение соответствующих нечетких шкал на универсальном ~ множестве Х для оценивания НЭТ Sv с множеством градаций V и ~ интенсивностей НЭТ Sa с множеством градаций A.
Утверждение 3. Две ACL-шкалы с параметрами 1 ={Е1, d1, MF1, nmin1, nmax1} и 2 ={Е2, d2, MF2, nmin2, nmax2} соответственно эквивалентны тогда и только тогда, если Е1= Е2, d1= d2, MF1= MF2, nmin1= nmin2, nmax1= nmax2.
Из эквивалентности ACL-шкал следует, что они имеют одинаковое количество и одинаковую размерность нечетких градаций d, задающую допустимый уровень погрешности в данных.
Определение 4. Мощностью ACL-шкалы будем называть количество нечетких множеств (функций принадлежностей), задающих количество ее градаций m.
Мощность ACL-шкалы m, построенной для ВР Х, обратно пропорциональна средней относительной ошибке аппроксимации (МАРЕ) :
k n 4 (хmax хmin) m int S 1 S ;, = ( x' ) / xi )).
i (abs(xi n n xi i1 iС увеличением мощности шкалы m средняя погрешность нечеткого оценивания значений ВР уменьшается - содержательная интерпретация полученных зависимостей, которая соответствует результатам вычислительного эксперимента.
Нетрудно показать, что 0 при m .
Утверждение 4. Два НВР сравнимы тогда и только тогда, если для их генерации использованы эквивалентные ACL-шкалы. Теоретические положения ACL-шкалы определяют формальный базис для порождения и анализа нечетких временных рядов и нечетких тенденций, позволят оперировать совместимыми значениями нечетких объектов ВР в рамках однородных знаковых структур и гранул, критериев и целей оценки при сравнении эффективности различных классов моделей ВР.
В четвертой главе рассмотрены методы, модели и алгоритмы структурнолингвистического подхода для решения комплекса задач анализа ВР, обладающего высокой степенью неопределенности, в терминах нечетких тенденций.
Таблица 3. Операции ACL-шкалы, моделирующие переходы между гранулами разного уровня Операция Результат оценивания Оценка погрешности оценивания оценивания объекта ВР ~ argmax(~k (xt )), k 1,2,...,m ~ ~ ~ xt x хt Fuzzy(xt ). 0, xt xt' P~ k ER_ хt ~ ~ 1, xt xt' n m ax x Er _ xt | xt xt | P01 хt deFuzzy(~t ) ~(x)dx x x n m in n xt .
1 хi хi n m ax MAPE 100% ~(x) x n хi i n m in n ~ xt (xk ) xk k xt n x (xk ) ~t k ~ ~ ~ ' 1 ~ ~ min( xt1(xt1), xt (xt )) 0 P2 t t t ~ ~ TTend(~t1, xt ), x t ~ ~ ~ ~ ' ~ ~ ~ Er _ 1, , C at min( xt1(xt1), xt (xt )) t t t t ~ ~ at RTend(~t1, хt ) ' х ~ ~ ~ 0.5, , C t t t ~ 1, t t' ~ Er _ at ~ ~ 0, t t' Er _ vt | vt vt | P~ 0, если vi "стабильность" ~ vt deFuzzy(vt ), ~ Er _ at | at at | vt 1,если vi "падение" ~ 1, если vi " рост" n m ax ~ ~ at deFuzzy(at ) x a(x)dx n m in at .
n m ax ~ a(x) n m in Задача идентификации НЭТ исходного ВР решается как задача его преобразования в гранулы уровня r=2. Для этих целей предложен численный метод FT-преобразования (FuzzyTend-преобразования), включающий:
1. Построение параметрической структурно-функциональной модели ACLшкалы C={,,} по исходному ВР.
2. Реализация преобразования P10. Построение гранулярного представления ВР уровня r=1. Результат - нечеткий ВР.
~ 1 ~ ~ 3. Реализация преобразования P2. ЕTend: . Для каждой нечеткой X X ~ ~ ~ хi ~ метки нечеткого ВР X определить нечеткую метку типа НЭТ vij V и ~ ~ нечеткую метку интенсивности A с помощью операций ACL-шкалы ij TTend, RTend соответственно. В результате получим гранулярное представление ВР уровня r=2 и ВР нечетких элементарных тенденций ~ ~ {ti,i}, i [1, n 1] vi, ai, i .
, где i 4. При необходимости получения показателей погрешности оценивания по шкале выполним обратное FT-преобразование с помощью функционалов P~ ~ ~ ~ и P01 : deЕTend: и DeFuzzy: Х.
X X X 5. Вычисление погрешности оценивания нечетких объектов ВР с помощью операции ACL-шкалы Er_x(соответствует МАРЕ).
5. Если полученная погрешность неприемлемая, например, превышает 10%, то перейти к пункту 1, предварительно изменив параметры шкалы в сторону уменьшения погрешности d и увеличения градаций шкалы m.
В результате применения метода FT-преобразования для 22 реальных временных рядов было установлено, что данный метод является продуктивным методом гранулирования уровня r=2, обеспечивающий приемлемую погрешность: МАРЕ_ср=4,45% (станд.отклонение = 5,35%).
Пример фрагмента представления ВР в терминах нечетких элементарных тенденций, полученного с помощью метода FT-преобразования, приведен в таблице 4.
Таблица 4. Результат FT-преобразования ВР ~ ~ ~ Время t i Ряд xi НМ х TTend v RTend a ФП i i i i 1971 13055 1,00 A0 Рост Небольшой 1972 13563 0,76 A1 Стабильность Отсутствует 1973 13847 0,88 A1 Рост Небольшой 1974 14696 0,68 A2 Рост Небольшой Для идентификации локальных тенденций ВР и его преобразования в гранулы уровня r=3 предлагается модифицированный метод FTпреобразования на основе предварительного декомпозиции ВР {ti, xi},i [1, n] Yn= на компоненты Fm[Yn ] [F1,, Fm ] методом Fпреобразования (I. Perfilieva) по формуле:
n Ak (t ) xt j j j(5) Fk n Ak (t ) j jA1,, Am - базисные функции, заданные на интервале где k=1,2..m;
[t1,tn ]. Компоненты Fm[Yn ] [F1,, Fm ] представляют кусочно-линейный тренд ВР Yn, нечеткие элементарные тенденции которого есть нечеткие локальные тенденции исходного ВР с базовыми типами Рост, Падение, Стабильность.
Задача классификации ВР в структурно-лингвистическом подходе рассматривается как задача идентификации класса порождающего ВР нечеткого динамического процесса с нечеткими приращениями и сводится к определению типа основной (общей) нечеткой тенденции GG. Эта задача соответствует идентификации гранул уровня r=4.
Для целей классификации объединим однотипные НТ в виде трех гранул {Nпадение} {Nстабильность} {N },,.
рост Предложен следующий алгоритм классификации ВР:
1 этап. Если количество наблюдений ВР больше или равно 40, провести его нечеткое сглаживание методом F-преобразования.
2 этап. Определить гранулярную модель ВР вида r=3 и вычислить мощность гранул N, N, N по формуле:
рост падение стабильность ns ~ STends ts, где ats deFuzzy(ats ).
t3 этап. Если STendрост 0 и STendпадение 0, то G= Стабильность.
Считать, что ВР порожден нечетким S-процессом, динамика стационарна.
Изменения во временном ряду незначимы.
4 этап. На основе сравнительного анализа вычисленных мощностей STendрост и STendпадение определить тип общей тенденции НВР как представителя базового типа Рост или Падение, если соответствующая мощность гранулы значительно больше мощности другой:
STendрост 2 STendпадение или STendпадение 2 STendрост. Считать, что ВР порожден нечетким Т-процессом, динамика нестационарна.
5 этап. Если мощности STendрост и STendпадение примерно одинаковы 0,85 STendпадение STendрост 1,15 STendпадение или 0,85 STendрост STendпадение 1,15 STendрост, то определить G= Колебание. Считать, что ВР порожден нечетким Кпроцессом, динамика стационарна. Иначе тип основной тенденции G= Хаос и ВР порожден нечетким D-процессом, динамика нестационарна.
Результаты решения задачи классификации ВР представлены на рис. 2.
Предложенный алгоритм классификации НВР позволяет моделировать экспертное оценивание динамики процесса в лингвистической форме, удобное для человека и экспертных систем.
Для модельных нечетких временных рядов, генерируемых известными классами нечетких процессов, точность классификации предложенным алгоритмом составила 100%. Исследования для тестирования на стационарность/нестационарность (300 ВР) показали, что результативность предложенного алгоритма (88%) сопоставима с результатами тестирования ВР по критерию Дики-Фуллера (91%).
Прогнозирование временных рядов на основе нечетких элементарных тенденций в структурно-лингвистическом подходе нацелено на извлечение новых, полезных, лингвистически выраженных зависимостей о поведении ВР, выраженных в терминах НЭТ. Предлагается три способа реализации оценивания Т-модели (2) для генерации модели ВР (4) и оценивания числовых значений параметров элементарной тенденции t и t.
Три способа связаны с тремя типами коллизий, возникающих в ходе реализации численного алгоритма нечеткого логического вывода:
избыточность, неполнота, противоречивость базы правил.
Нечеткий S-процесс Нечеткий T-процесс Нечеткий К-процесс Нечеткий D-процесс Рис. 2. Результат алгоритма классификации временных рядов по типам нечетких тенденций ~ ~ ~ ~ ~ ~ ~ ~ t t1 t2 ... t р Rv at t1 t2 ... atq Ra.
1 способ (F2S): ~, ~, ~) ~) vi deFuzzy(vi, at deFuzzy(at Этот способ основан на реализации Т-модели (2), в которой отсутствуют коллизии в базе правил.
С целью решения проблемы противоречивости базы правил предлагается второй способ реализации Т-модели (2).
~ at 2 способ (F3N1S): представим НЭТ в виде t =(,1t,2t,3t), где 1t, 2t, 3t - числовые ВР степеней принадлежностей типов нечетких элементарных ~ at тенденций соответственно Рост, Падение, Стабильность; - нечеткий ВР интенсивностей НЭТ. Прогнозные значения степеней принадлежностей определим с помощью трех искусственных нейросетевых моделей типа трехслойный персептрон с алгоритмом обратного распространения ошибки с количеством входов, равным порядку модели р, и одним выходом:
р р р 1 F1 ( 1i ) 2 F2 ( 2i ) 3 F3 ( 3i ),,, wi wi wi i1 i1 i 3t, где r - номер типа тенденции.
r arg(max( 1t, 2t, ) Для вычисления интенсивности прогнозной нечеткой тенденции ~ ~ ~ at max(min( at1, at )), применим алгоритм Мамдани, с последующей дефаззификацией.
Ограничение нечетких моделей, связанное с неполнотой нечетких правил, образующих базу правил, наиболее ярко проявляется для нестационарных коротких временных рядов, поэтому предлагается третий способ реализации Т-модели (2) для решения этой проблемы.
~ ~ t t,at,t ), t deFuzzy(t ), at deFuzzy(at ).
3 способ (F1N): Для прогнозирования числовых значений параметров нечеткой элементарной тенденции использована трехслойная нейросетевая модель типа персептрон с алгоритмом обратного распространения ошибки с количеством входов, равным порядку модели р, и одним выходом:
р F( i ), wi iТак как каждое правило имеет свою степень принадлежности, которая в нечетком логическом выводе играет важную роль при вычислении результирующего нечеткого терма, поэтому для решения проблемы избыточности было предложен алгоритм отбора правил по критерию минимума степеней принадлежности повторяющихся правил.
Введение процедуры исследования нечеткой модели и предложенное решение обозначенных ограничений нечетких моделей на основе алгоритма отбора правил позволило повысить точность моделирования значений ВР в среднем в 2,2 раза и нечетких элементарных тенденций в 1,7 раз.
Предложенная Т-модель (2) совместно с (4) обеспечивает получение прогноза не только значений, но и нечетких элементарных тенденций ВР, как в лингвистической, так и в числовой форме по числовым, лингвистическим и смешанным временным рядам. Вторым важным отличием Т-модели является моделирование значений с изначально заданным пользователем допустимым значением погрешности в данных.
Оценка качества моделей ВР основана на вычислении погрешностей, рассмотренных в табл. 3. Для нечетких моделей предлагаются новые критерии эффективности:
da 0 da 1) Новый критерий адекватности ( ), который оценивает соответствие результатов моделирования согласно модели (4) о допустимой погрешности в остатках модели:
n 1, если | xt xt' | d da , xt xt n t0,если | xt xt' | d da 0.Считаем, что при модель адекватна.
2) Новый критерий моделей ВР уровня r=2 для оценки соответствия поведения исследуемого ВР поведению моделируемого (прогнозируемого) ВР в терминах доли количества ошибочных нечетких тенденций Ttend:
Ttend = 100%* k_e/n, где k_e - количество ошибок моделирования нечетких элементарных тенденций.
3) Новый критерий оценки соответствия поведения исследуемого ВР X поведению ВР Y уровня r=2, определяющий расстояние между одновременными нечеткими элементарными тенденциями:
n ~ ~ ~ ~ (tx,ty ) (tx, ty )(x, y) 100 % (vtx,vt y ) n t~ ~ 0 tx t y ~ ~ 1, tx ty ~ ~ ~ ~ ~ ~ ~ (tx, ty ) | tx ty | (atx,ty ) (tx,t y ) 1, tx t y,tx C ~ ~ 0, tx ty y ~ ~ ~ 0.5, tx t,tx C 0 (x, y) Методика оценивания моделей различных классов при анализе множества временных рядов основана:
a) на обязательном применении эквивалентных ACL-шкал для генерации эквивалентных нечетких временных рядов;
b) на решении однотипной задачи анализа ВР, например, краткосрочный прогноз на 10% или прогноз будущей нечеткой элементарной тенденции;
c) на применении критериев оценивания отклонений значений ВР от модельных значений СКО, MSE, МАРЕ;
d) на использовании новых критериев точности для оценки поведения исследуемого ВР поведению моделируемого (прогнозируемого) ВР Ttend и/или (, ) ;
i s e) на анализе критерия адекватности da.
Метод прогнозирования ВР на основе T-модели (метод НЭТ) заключается в идентификации оптимальной прогнозной модели нечетких элементарных тенденций (Т-модели) ВР. Рассматривается решение двух задач:
идентификация Т-модели (2) для прогнозирования гранулярного ВР уровня r=2 и идентификация Т-модели для прогнозирования числовых значений ВР (гранулярного ВР уровня r=0) согласно модели вида (4).
Задача идентификации оптимальной модели прогнозирования лингвистических термов НЭТ (гранулированного ВР уровня r=2) заключается в идентификации параметров p и q минимизирующих функцию ~ ~ ~ ~ 1(t W(t p,tq)) t W (t p, ) min, где, t q W F2S, F1N, F3N1S.
Задача идентификации оптимальной модели прогнозирования числовых значений компонент элементарной тенденции (гранулированного ВР уровня r=0) заключается в идентификации параметров p, q минимизирующих 2(хt F (xt1,t p,tq)) хt F(хt 1,t,t ), min функцию, где ~ ~ F xt 1 vt t vt deFuzzy(vt ), at deFuzzy(at ).
, Лингвистические ~ ~ ~ ~ ~ ~ ~ ~ ~, ~ получены применением значения t t1 t2 ... t р Rv at t1 t2 ... atq Ra W F2S, F1N, F3N1S одной из моделей.
Численный алгоритм метода прогнозирования НЭТ на основе Т-модели для прогнозирования значений гранулярного ВР уровней r=0 и r=2 включает следующие шаги:
Выбор типа решаемой задачи и критерия оценки эффективности модели Krit.
Шаг 1. Построение модели ACL-шкалы C={,, } по исходному ВР.
Шаг 2. Переход к гранулярному представлению r=1 и r=2. Применение метода FT-преобразования ВР для преобразования ВР во временной ряд ~ ~ ~ ~ ~ НЭТ: хt Fuzzy(xt ), t TTend (~t, xt1), at RTend (~t, хt1).
x х Шаг 3. Идентификация оптимальной прогнозной Т-модели, как модели нечеткого динамического процесса для каждой компоненты НЭТ (2):
~ ~ ~ ~ ~ ~ ~ ~ t t1 t2 ...t р Rv at t1 t2 ... atq Ra ~, ~.
В зависимости от ее ограничений определение способа ее реализации F 2S, F1N, F3N1S и порядков Т-модели p и q, минимизирующих функцию Ф1 (для значений гранулированного ВР уровня r=2) и функцию Ф(для значений гранулированного ВР уровня r=0). На практике часто p= q, p<5 и q<5.
Шаг 4. Прогнозирование ВР по идентифицированной Т-модели.
Тестирование и проверка адекватности идентифицированной Т-модели.
Анализ основной тенденции остатков на соответствие нечеткому S-процессу и по критерию da : da 0,2.
Шаг 5. Реализация лингвистического резюмирования ВР и определение типа основной тенденции.
Шаг 6. Прогнозирование компонент нечеткой элементарной тенденции (лингвистическое прогнозирование):
~ ~ ~ ~ ~ ~ ~ ~ t1 t ... t р R~, at1 t t1 ... atq Ra ~.
t1 v Дефаззификация параметров НЭТ и прогнозирование числовых значений ВР:
~ ~ хt 1 хt vt 1 t 1.
vt1 deFuzzy(vt1), at1 deFuzzy(at1), Экспериментальное исследование метода НЭТ показало его результативность, как нового метода прогнозирования ВР, обладающих высокой степенью неопределенности. Установлено, что с увеличением длины ВР, точность прогноза значений заметно снижается, следовательно, область применения метода НЭТ ограничивается нестационарными ВР небольшой длины.
Для решения задачи идентификации и прогнозирования локальных нечетких тенденций и на этой основе числовых значений нестационарных ВР средней длины разработан новый интегральный метод нечеткого моделирования и анализа нечетких тенденций (метод ИМ). Он основан на использовании метода НЭТ для кусочно-линейного тренда, выделенного методом Fпреобразования. Для прогнозирования остатков, полученных после удаления нечеткого тренда, применяется классическая трехслойная искусственная нейронная сеть (ИНС) с обратным распространением ошибки.
Предложен следующий численный алгоритм интегрального метода нечеткого моделирования и анализа нечетких тенденций.
1 этап. Гранулирование ВР уровня r = 0. Применение метода FX xt преобразования (5) для декомпозиции анализируемого ВР на кусочноn линейный тренд Fm[X ] [F1,, Fm ] и матрицу остатков rti.
n 2 этап. Для ВР определение нечеткой ACL-шкалы.
[F1,, Fm ] 3 этап. Гранулирование ВР на гранулы r=1 и r=2..
[F1,, Fm ] 4 этап. Применение метода НЭТ для идентификации оптимальной Т-модели (2) и вычисления прогнозного лингвистического значения компонент нечеткой тенденции и по формуле (4) числового значения.
Fm5 этап. Прогнозирование остатков ri,t1 модели на основе ИНС типа трехслойного персептрона с обратным распространением ошибки.
m 6 этап. Вычисление прогнозного значения исходного ВР xt1 (Fi rit1).
V iПроведенные экспериментальные исследования для 11 временных рядов показали, что применение интегрального метода сохранило точность прогнозирования тенденций и позволило повысить точность числовых значений ВР в 1,8 раз по сравнению с методом НЭТ.
В пятой главе исследуются модели, методы и алгоритмы структурнолингвистического подхода для решения задач анализа ВР, обладающих высокой степенью неопределенности. Результаты сравниваются с базовыми моделями нечеткого, нейросетевого и статистического подходов.
Информационная база вычислительного эксперимента включает 4временных ряда различной длины (от очень коротких до длинных) как модельных, так и реальных.
Эксперимент 1. 78 временных рядов построены по теоретическим моделям стохастических процессов для сравнения моделей НЭТ с известными базовыми нечеткими и нейросетевыми моделями (33% - ВР длиной от 7 до 17 значений, 33% - ВР длиной от 18 до 28 значений и 34% ВР длиной от до 60 значений):
o 31 временной ряд по теоретическим моделям стационарных стохастических процессов (AR(1), AR(2), MA(1), MA(2), ARMA(1,1), ARMA(2,2), ARMA(1,2), ARMA(2,1));
o 47 временных рядов по теоретическим моделям нестационарных стохастических процессов (ARIMA(0,1,1), ARIMA(1,1,1), ARIMA(0,2,2), ARIMA(0,1,0), с линейным трендом ТSР).
Основные результаты эксперимента № 1 сведены в таблицах 5 и 6.
Эффективность метода НЭТ и Т-модели исследована для прогнозирования 47 модельных нестационарных числовых ВР и 13 модельных лингвистических ВР с известными зависимостями в нечетких элементарных тенденциях: адекватность - высокая (da 0,12 и da 0 ); точность прогноза нечетких тенденций - очень высокая (Ttend=3,3% и Ttend=0%); точность прогноза значений ВР - очень высокая (МАРЕ=5,5% и МАРЕ=1,67%).
Установлено, что точность прогноза стационарных ВР методом НЭТ уступает показателям точности для нестационарных ВР: нечетких тенденций в 2 раза, а числовых значений в 4 раза.
Табл. 5. Показатели эффективности прогноза предложенного метода НЭТ Модели Прогноз тенденций Прогноз Прогноз Прогноз на 1 интервал тенденций на 10% значений на 1 значений интервал на 10% TTend% TTend% МАРЕ % МАРЕ % Нестационарные (ARIMA+TS) 2,2 8,45 6,3 7,Стационарные 5,1 11,0 24,3 67,Рис. 3. Пример краткосрочного прогнозирования (на 10%) Т-моделью ВР, построенного по модели нестационарного процесса ARIMA (0,2,2): СКОвнутр = 0.52, СКОвнеш = 0.39, МАРЕвнутр = 5.0, МАРЕвнеш = 4.76, Ttendвнутр = 6.5, Ttendвнеш = 0.
Рис. 4. Пример краткосрочного прогнозирования (на 10%) Т-моделью ВР, построенного по модели стационарного процесса ARMA (1,2): СКОвнутр = 0.32, СКОвнеш = 0.31, МАРЕвнутр=2.5, МАРЕвнеш = 2.9, Ttendвнутр = 0, Ttendвнеш = 0.
Табл. 6. Сравнение результативности моделей различных подходов в прогнозировании нестационарных ВР Прогноз тенденций Прогноз тенденций Прогноз Прогноз на 1 интервал на 10% значений на 1 значений на интервал 10% Модель TTend% TTend% МАРЕ % МАРЕ % Т 2,2 8,45 6,3 7,НВР S 35,68 27,47 19,21 33,НВР D 34,95 38,18 10,76 13,НС 21,3 27,66 14,34 36,Эксперимент 2. 13 коротких ВР (от 8 до 15 значений) сформированы по теоретическим моделям нечетких процессов: 1: С С; 2: Р Р; 3: РП П, ПП Р, ПР Р, РР П; 4: Р Р, Р П, П С, С П.
В результате проведенных экспериментов установлено, что все заданные зависимости были идентифицированы корректно. Для моделирования нечетких элементарных тенденций использовалась T-модель вида F2S первого и второго порядка. Эксперимент показал, что Т-модель адекватно и с высокой точностью моделирует нечеткие элементарные тенденции и значения ВР (табл. 7).
Табл.7. Результаты моделирования и прогнозирования зависимостей НЭТ.
Критерий Ошибка Ошибка Погрешность адекватно оценивания оценивания по критерию сти типа интенсивности МАРЕ% тенденции тенденции Ttend% Rtend% Средние показатели при моделировании 0 2,1 4,2 4,Средние показатели при прогнозировании на 10% 0 0 0 2,Эксперимент 3. Метод НЭТ применен для прогнозирования реального временного ряда Алабама, так как этот ВР является традиционной тестовой задачей (бенчмаркой) для исследования эффективности методов нечеткого моделирования ВР. В таблице 8 приводятся сравнительные результаты тестирования моделей для краткосрочного прогноза ВР Алабама (на 5%), мощность ACL-шкалы выбрана одинаковая (равна 19) для всех нечетких моделей. Определены оптимальные нечеткие S-модель (Song&Chissom,1994), D-модель (Sah&Degtyarev, 2004), НС-модель (трехслойная ИНС с обратным распространением ошибки), метод Брауна экспоненциального сглаживания.
Анализ таблицы 8 показывает, что авторские Т-модели по сравнению с известными базовыми нечеткими моделями при краткосрочном прогнозе ВР Алабама демонстрируют лучшие результаты при прогнозировании значений ВР по критерию МАРЕ (более чем в 2 раза), а также при прогнозировании нечетких тенденций: СКО=68; МАРЕ=0.36%; Ttend=0%.
Таблица 8. Сравнение моделей для прогноза ВР Алабама на 1 интервал Модель(ее параметр) МАРЕ% TTend% Предложенная Т-модель: F2S(2) + алгоритм 0,4 отбора правил НС- модель(3) 0,6 Нечеткая модель [Jilani&Bruney,2007] 1,0 - Нечеткая модель [Chen, 2002, Huarng,2006] 1,5 - ARIMA (0,1,1)(0,1,2) 2,1 - НВР S-модель(1), [Song&Chissom, 1994] 2,4 Метод Брауна (0.3) 4,2 - НВР D-модель(1), [Hwang, 1998, 5,8 1Sah&Degtyarev, 2004] Эксперимент 4. Два модельных ВР использовались для демонстрации возможности моделирования лингвистических и смешанных ВР.
Вычислительные эксперименты показали, что для таких ВР успешно построены Т-модели, адекватно идентифицированы НЭТ и основная нечеткая тенденция, получены приближенные числовые значения ВР, что обеспечивает возможность применения к ним в дальнейшем при необходимости методов анализа статистического и нейросетевого подходов.
Применение структурно-лингвистического подхода для моделирования и прогнозирования объема и нечетких тенденций телекоммуникационного трафика. Применением метода НЭТ получены новые модели изменения объема телекоммуникационного трафика для прогнозирования нечетких элементарных тенденций и значений ВР (реальных временных ряда трафика ВС), для каждого из которых решались задачи прогноза на интервал от 2% до 20%. Проведенный анализ сравнительной эффективности нечетких моделей при прогнозировании временных рядов трафика ВС показывает превосходство авторских нечетких Т-моделей как при прогнозировании числовых значений ВР (по показателю MAPE более чем в 2,5 раза), так и при прогнозировании элементарных тенденций ВР (по показателю Ttend более чем в 5 раз).
Рис. 5. Примеры прогнозирования объема телекоммуникационного трафика Также авторские Т-модели позволяют получить лучшее соответствие модели da исходным данным по показателю. Установлено, что для коротких временных рядов (до 55 значений) точность прогнозирования значений ВР приемлемая и стабильна (от 2,5% до 10,9%).
Для длинных ВР (длиной более 150) точность прогноза невысокая MAPE=72.6%, но при этом выше, чем в базовых нечетких и нейросетевых моделях в 3 и 3,5 раза соответственно; точность прогноза нечетких тенденций высокая Ttend=8,7% и выше конкурирующих моделей в 1,78 раз.
При краткосрочном прогнозировании ВР (длина 190 наблюдений) телекоммуникационного трафика показан потенциал нечетких моделей (S-модель - МАРЕ=67,8%, Т-модель - МАРЕ=83,7%) по сравнению с результатами применения модели ARIMA(1,0,1) - МАРЕ=190,7%.
Таблица 9. Сравнение результатов прогнозирования телекоммуникационных трафиков ВС моделями различных подходов НС-модель НВР D-модель НВР S-модель Предложенная Т-модель MAPE Tten da MAPE Tten da MAРE Ttend da MAPE Ttend% da % d % % d % % % % 140,9 14,3 0,07 1695 39,8 0,74 124,1 27 0,22 42,53 5,24 0,Сред.
Применение структурно-лингвистического подхода для моделирования и прогнозирования технико-экономических показателей, представленных в виде ВР. Двадцать реальных технико-экономических ВР использовались для сравнения Т-модели с различными классами конкурирующих моделей (табл. 10). 35% ВР имели недостаточное количество значений для построения модели класса ARIMA (меньшее 20), поэтому ВР были разделены на две группы: сравнение с моделями ARIMA проводилось для 65% ВР.
Результаты применения метода НЭТ для построения Т-модели демонстрируют ее эффективность при прогнозировании коротких ВР и превосходство по сравнению с исследуемыми моделями в точности прогноза более, чем в 2 раза.
Табл. 10.Сравнение моделей при краткосрочном прогнозе экономических ВР небольшой длины по критерию МАРЕ% Класс ВР модель ARIMA Т-модель S-модель D-модель НС-модель Среднее по 65% ВР 25,35 6,16 16,3 18,4 16,Среднее по100% ВР - 11,34 23,58 34,4 30,Построенные Т-модели для 12 реальных временных рядов небольшой длины экономических показателей организации использовались для сравнения с оптимальными статистическими моделями на основе комплексных моделей, включающих трендовые модели, стохастические модели классов ARIMA и модели класса экспоненциального сглаживания, построенными управляющим алгоритмом в системе ForecastProй. Результаты представленные в табл. 11, показывают, что предложенная Т-модель для исследуемых ВР в среднем генерирует более точный прогноз не только по сравнению с базовыми нечеткими и нейросетевыми моделями, но и по сравнению с моделями, выбранными управляющим алгоритмом пакета ForecastProй.
Табл. 11. Результаты методов пакета ForecastProй при прогнозе коротких нестационарных ВР на 6 интервалов в сравнении с Т-моделью, нечеткими S- и D-моделями и нейросетевой моделью.
Среднее Модели пакета Предложенная S- D- НСТ-модель модель модель модель ForecastProй МАРЕ% 83,1 45,9 103,8 158 63,Применение структурно-лингвистического подхода для моделирования нечетких тенденций в диагностических параметрах агрегатов вертолетов. Для решения задачи обнаружения ситуаций, которые могут в дальнейшем привести к отказам агрегатов вертолетов, связанных со значительным разбросом значений параметров в пределах установленных на них допусков (основная нечеткая тенденция класса нечеткий динамический К-процесс) и постепенных отказов, характеризующихся медленным изменением значений параметров (основная нечеткая тенденция класса нечеткий динамический Т-процесс или D-процесс). Указанные диагностические ситуации естественно описывать в терминах нечетких тенденций (Интенсивные Колебания, Значительный Рост, Небольшое Падение), понятных специалисту по эксплуатации АТ. Анализ и прогнозирование нечетких элементарных и локальных тенденций с помощью методов структурно-лингвистического подхода использовано для моделирования нечетких тенденций ВР диагностических параметров агрегатов вертолетов в межполетный период в рамках экспертной системы.
Проведенные эксперименты для 12 диагностических ситуаций показали, что результаты моделирования нечетких тенденций диагностических параметров, подаваемые на вход экспертной системы, необходимы для адекватного обнаружения потенциально опасных ситуаций.
На использованной информационной базе краткосрочное прогнозирование нечетких тенденций и значений ВР в рамках предложенного структурнолингвистического подхода показало его эффективность по точности и конкурентоспособность по сравнению с базовыми аналогами в нечетком, нейросетевом и статистическом подходах.
В шестой главе приводится описание структуры и функций программных комплексов, реализующих модели, методы и алгоритмы структурнолингвистического подхода анализа ВР на основе идентификации нечеткой тенденции:
1. Программный комплекс нечеткого моделирования и прогнозирования временных рядов и нечетких тенденций FuzzyTend. Программная система FuzzyTend содержит в себе шесть параметрических нечетких моделей ВР и одну нейросетевую модель. Совокупность нечетких моделей включает авторские нечеткие Т-модели временных рядов на основе элементарных нечетких тенденций вида F2S, F1N, F3N1S, а также методы нечеткого Fпреобразования, FT-преобразования, метод НЭТ, алгоритмы построения ACL-шкалы, сегментации, классификации и лингвистического резюмирования. Кроме перечисленных в программной системе FuzzyTend реализованы нечеткие S- и D-модели, их модификации, модуль генерации временных рядов и алгоритм выбора оптимальной модели (рис. 6 ).
2. Программный комплекс программ BESTS для автоматизации научных Библиотеки для TSDM Библиотека Библиотека Библиотека нечеткого вывода нейронных сетей нечеткой логики Модель ВР Модель ACL-шкалы Расчет критериев Интерфейс настройки Резюмирование Результирующие ВР Интерфейс получения результатов Пользовательский интерфейс Диалоги настройки Информация о применении модели Настройка Настройка Вывод Генерация шкалы моделей графиков отчетов Поиск лучшей модели Резюмирование Лингвисти- Определение Модуль Поиск ческая общей распарал- наилучшей интерпретация тенденции леливания модели исследований, включающий методы построения базовых стохастических ARIMA-моделей, моделей экспоненциального сглаживания, нейросетевых и нечетких моделей по ВР.
3. Программный комплекс анализа гетерогенных временных рядов FATS.
Рис. 6. Структура программного комплекса FuzzyTend 4. Internet-сервис экспресс-анализа деятельности предприятий по временным рядам экономических показателей (рис. 7).
Коэффициент финансовой независимости в части оборотных средств По представленным Вами данным и проведенному экономическому анализу, система дает прогноз на следующий период: Предприятие имеет возможности для проведения независимой финансовой политики, однако снижение показателя сигнализирует о возможном ослаблении финансовой устойчивости организации.
Прогнозная тенденция Спад Малый Рис. 7. Пример работы Internet-сервиса: выдача рекомендации по прогнозной тенденции В заключении приводятся основные результаты диссертационной работы, ограничения и перспективы дальнейших исследований.
Главным итогом диссертационной работы является разработка методологии нового подхода, моделей, алгоритмов и программных комплексов моделирования и прогнозирования временных рядов, обладающих высокой степенью неопределенности, выражающейся в малой длине и нестационарном характере поведения, с целью извлечения полезных знаний и повышения эффективности их прогнозирования. Данная методология, развивая научное направление анализа ВР, ориентирована на прикладного пользователя и включает новые теоретические положения структурнолингвистического подхода, новую классификацию и гранулярное представление ВР, совокупность новых моделей, методов, алгоритмов, методик и критериев.
К числу наиболее важных относятся следующие результаты:
1.Предложена новая методология структурно-лингвистический подхода, основанная на технологии извлечения знаний о нечетких тенденциях ВР, гранулярном представлении, которая обеспечивает повышение эффективности прогнозирования ВР, расширяет круг пользователей и сферу применимости систем анализа ВР на данные, обладающие объективной неопределенностью. Гранулярное представление ВР обеспечивает методологические принципы соотношения и сравнения моделей различных подходов.
2. Впервые предложена формальная модель нечеткой тенденции, проведена классификация нечетких тенденций и выделен класс нечетких элементарных тенденций, как минимальной единицы знаний о поведении ВР в виде нечетких приращений нечеткого ВР.
3.Разработанные теоретические положения нечеткой ACL-шкалы являются новым формальным средством, позволяющим с единых методологических позиций моделировать нечеткие объекты ВР, учитывать погрешность в исходных данных и идентифицировать параметры нечетких элементарных тенденций. Достоинство ACL-шкалы заключается также в том, что при решении проблемы сравнительной эффективности моделей ВР она является необходимым инструментом, генерирующим нечеткие значения лодной размерности.
4. Впервые предложен метод FT-преобразования для решения задачи идентификации нечетких элементарных тенденций и гранулирования временных рядов. Вторым отличительным свойством FT-преобразования является возможность с приемлемой погрешностью (4,5%) получать приближенные значения исходных числовых ВР.
5. Предложена новая классификация нечетких динамических процессов.
Впервые разработан алгоритм идентификации класса нечетких динамических процессов на основе нечетких элементарных тенденций, обеспечивающий извлечение знаний в лингвистической форме о поведении ВР. Для модельных нечетких ВР, генерируемых известными классами нечетких процессов точность идентификации предложенным алгоритмом составила 100%. Экспериментальные исследования, проведенные для 300 временных рядов, генерируемых стохастическими процессами, показали применимость предложенного алгоритма классификации и для тестирования стационарности/нестационарности ВР (средняя точность составляет 88%).
6. Впервые предложена новая модель (Т-модель) в виде нечеткого процесса с нечеткими приращениями, для моделирования и прогнозирования ВР, обладающих высокой степенью неопределенности. Вторым важным отличием Т-модели является моделирование и прогнозирование значений с изначально заданным пользователем допустимым значением погрешности.
Третье отличие заключается в принципиально новом качестве модели, позволяющей моделировать нечеткие значения и представляющей в лингвистической форме зависимости в новом объекте ВР - нечетких элементарных тенденциях.
7. Впервые предложен метод (метод НЭТ) на основе Т-модели для моделирования и прогнозирования ВР, обладающих высокой степенью неопределенности, обеспечивающий повышение эффективности и информативности за счет идентификации и прогнозирования нечетких элементарных тенденций и резюмирования результатов.
Экспериментальное исследование метода НЭТ на искусственных ВР продемонстрировало его результативность при краткосрочном прогнозировании 47 модельных нестационарных коротких числовых ВР (760 наблюдений), построенных по базовым моделями ARIMA и 13 модельных ВР с известными зависимостями в нечетких элементарных тенденциях:
адекватность - высокая ( da 0,12 da 0 ); погрешность прогноза нечетких и элементарных тенденций - низкая (8,45 % и 0%); погрешность прогноза значений - низкая (МАРЕ=7,05 % и МАРЕ=1,67 %). Установлено, что метод НЭТ позволяет существенно повысить точность прогнозирования ВР, обладающих высокой степенью неопределенности, по сравнению с базовыми методами нечеткого и нейросетевого моделирования: нечетких тенденций - в 3 раза, числовых значений ВР - более чем в 1,9 раза.
Выявлены ограничения метода НЭТ, заключающиеся в недостаточной точности краткосрочного прогнозирования значений стационарных ВР (погрешность МАРЕ=67,2 %).
8. Экспериментально установлено, что применение нового интегрального метода нечеткого моделирования и анализа нечетких тенденций позволило повысить точность прогнозирования значений ВР средней длины (60-5наблюдений) в 1,8 раз по сравнению с методом НЭТ.
9. Показана эффективность применения методологии структурнолингвистического подхода в решении практических задач.
применением метода НЭТ получены новые модели изменения объема телекоммуникационного трафика, имеющие при краткосрочном прогнозировании нечетких элементарных тенденций и значений ВР значимое превосходство по сравнению с известными базовыми нечеткими моделями и методами нейросетевого моделирования (более чем в 2,5 раза).
применением интегрального метода получены новые модели динамики технико-экономических показателей, имеющие при краткосрочном прогнозировании преимущество по сравнению с нечеткими (в 2 раза), нейросетевыми (в 1,3 раза) и стохастическими моделями, представленными ППП ForecastProй в 1,8 раз.
применение теоретических основ нечетких тенденций к интерпретации локальных тенденций позволило построить новые модели динамики диагностических параметров агрегатов летательных аппаратов в между полетный период в задаче идентификации возможных отказов.
11. Разработанные новые алгоритмы и комплексы программ, реализующие предложенную методологию, являются наукоемкими информационными ресурсами, обеспечивают быстрое моделирование и оперативный анализ ВР, результаты которого представлены в лингвистической форме, ориентированы на широкое использование конечными пользователями как в практических и научных, так и в учебных целях.
Основное содержание работы
(положения диссертации) опубликовано в 1работе, в том числе:
Монография: Афанасьева Т.В. Нечеткое моделирование временных рядов и анализ нечетких тенденций / Т. В. Афанасьева, Н. Г. Ярушкина. - Ульяновск :
УГТУ, 2009. - 299 с.
Учебные пособия:
1. Ярушкина Н.Г. Интеллектуальный анализ данных : учебное пособие / Н. Г.
Ярушкина, Т. В. Афанасьева, И.Г. Перфильева. - Ульяновск : УГТУ, 2010. - 324 с.
2. Ярушкина Н.Г. Интеллектуальный анализ данных : учебное пособие / Н. Г.
Ярушкина, Т. В. Афанасьева, И.Г. Перфильева. - М. : ИД ФОРУМ : ИНФРАМ, 2012. - 160 с. - (Высшее образование).
Статьи из перечня, рекомендованных ВАК 1. Ярушкина, Н. Г. Моделирование трафика терминал-сервера на основе анализа нечетких тенденций временных рядов / Н. Г. Ярушкина, Т. Р. Юнусов, Т. В. Афанасьева // Программные продукты и системы. - 2007. - № 4. - С. 15 - 19.
2. Ярушкина, Н. Г. Нечеткие временные ряды как инструмент для оценки и измерения динамики процессов / Н. Г. Ярушкина, Т. В. Афанасьева, Т.
Р.Юнусов // Датчики и системы. - 2007. - № 12. - С. 46-51.
3. Афанасьев А.Н. Использование нейросетевого подхода при автоматизированном проектировании средств вычислительной техники / А. Н.
Афанасьев, Н. Н. Войт, Т. В. Афанасьева.// Автоматизация и современные технологии.: М. - №1, 2008, с. 21-24.
4. Валеев С.Г. Программный комплекс моделирования и анализа образовательной деятельности / С. Г. Валеев, Т. В. Афанасьева, А.В. Мадышев // Вопросы современной науки и практики. Университет им. В.И.Вернадского. - Тамбов: ТГТУ. - 2008. - № 2(12). - с. 144-148.
5. Афанасьева, Т. В. Структурно-лингвистический подход в анализе нечетких временных рядов / Т. В. Афанасьева // Программные продукты и системы. - 2008. - № 4(84). - С. 61-65.
6. Новак, В. Интегральный метод принятия решений и анализа нечетких временных рядов / В. Новак, И. Перфильева, Н. Ярушкина, Т. Афанасьева. // Программные продукты и системы. - 2008. - № 4(84). - С. 65-68.
7. Афанасьева, Т. В. Модель ACL-шкалы для генерации лингвистических оценок в принятии решений / Т. В. Афанасьева // Вопросы современной науки и практики. Университет им. В.И.Вернадского. Т.2. Серия Технические науки. - Тамбов: ТГТУ. - 2008. - № 4(14). - С. 91-97.
8. Афанасьева Т.В. Концептуальная модель гибридной системы анализа нечетких временных рядов / Т. В. Афанасьева, С. Г. Валеев, Н. Г. Ярушкина // Вопросы современной науки и практики. Университет им. В.И.Вернадского.
Т.2. Серия Технические науки - Тамбов, ТГТУ, 2008. - № 4(14). - С. 85-91.
9. Ярушкина Н.Г. Оценка результативности метода анализа нечетких тенденций временных рядов на примере моделирования трафика / Н. Г.
Ярушкина, Т. В. Афанасьева, Т. Р.Юнусов // Известия Самарского научного центра Российской академии наук. Специальный выпуск. Четверть века изысканий и экспериментов по созданию уникальных технологий и материалов для авиастроения УНТЦ-ФГУП-ВИАМ. - Самара: Самарский научный центр РАН. - Том 2. - 2008 - с.186-190.
10. Ярушкина Н.Г. Моделирование нечеткого и гранулированного временного ряда на основе элементарных тенденций / Н.Г. Ярушкина, Т.В.
Афанасьева, В.В. Шишкина // Известия Самарского научного центра Российской академии наук. Специальный выпуск. Технологии управления организацией. Качество продукции и услуг. - Самара: Самарский научный центр РАН. - Выпуск 10. - 2008. - с.223-227.
11. Афанасьева, Т.В. Моделирование временных рядов в терминах нечетких тенденций / Т. В. Афанасьева, С. Г. Валеев, А. О. Козлов // Материалы Десятого Всероссийского Симпозиума по прикладной и промышленной математике Обзор прикладной и промышленной математики, т.16, 2009 - С.1019-1020.
12. Ярушкина, Н. Г. Интеграция нечетких моделей для анализа временных рядов / Н.Г.Ярушкина, И.Г.Перфильева, Т.В.Афанасьева // Известия Самарского научного центра российской академии наук. - Самара: Самарский научный центр РАН. - Том. 12 - №4(2) - 2010. - С. 506-509.
13. Ярушкина, Н. Г. Интегральный метод нечеткого моделирования и анализа нечетких тенденций / Н.Г.Ярушкина, Т.В.Афанасьева, И.Г.Перфильева // Автоматизация процессов управления. - Ульяновск: - № 2(20). - 2010. - С. 5964.
14. Афанасьева, Т.В. Решение задач интеллектуального анализа ВР в рамках структурно-лингвистического подхода / Т.В.Афанасьева // Автоматизация процессов управления. - Ульяновск: - № 2(20). - 2010. - С. 54- 59.
15. Ярушкина Н.Г. Метод нечеткого моделирования и анализа тенденций временных рядов / Н.Г.Ярушкина, Т.В.Афанасьева // Интеллектуальные системы управления. Коллективная монография / под ред. Академика РАН С.Н.
Васильева. - М.: Машиностроение, 2010 г.- С. 301-305.
16. Афанасьева Т.В. Нечеткий динамический процесс с нечеткими тенденциями в анализе временных рядов / Т.В.Афанасьева, Н.Г.Ярушкина // Вестник РГУПС. - Ростов на Дону: РГУПС. - №3. - 2011. - с. 6-15.
17. Ярушкина Н.Г. Диагностика узлов вертолета на основе модели гранулированного временного ряда / Н.Г. Ярушкина, В.В. Шишкина, Т.В.Афанасьева // Автоматизация процессов управления. - Ульяновск: - № 4(26). - 2011. - С. 50- 54.
18. Афанасьева Т.В. Математическое моделирование коротких временных рядов на основе нечетких тенденций / Т.В. Афанасьева, Н.Г. Ярушкина // Обозрение промышленной и прикладной математики. - Москва: ОП и ПМ, 2011. - № 4 - С. - 1003-1011.
19. Афанасьева Т.В. Анализ эффективности модели нечеткой тенденции в прогнозировании временных рядов / Т.В. Афанасьева, Н.Г. Ярушкина // Автоматизация процессов управления. - Ульяновск: - № 4(26). - 2011. - С. 43- 49.
Основные результаты диссертационной работы изложены в следующих работах:
20. Афанасьева, Т.В. FT-преобразование нечетких временных рядов / Т. В.
Афанасьева // Нечеткие системы и мягкие вычисления (НСМВ-2008):сборник научных трудов второй всероссийской научной конференции с международным участием (г. Ульяновск, 27-29 октября, 2008 г.). В 2 т. Т.1. - Ульяновск : УГТУ, 2008. - С. 122.
21. Афанасьева, Т. В. Модель элементарной тенденции нечеткого временного ряда / Т. В. Афанасьева // Труды Седьмой Международной конференции Математическое моделирование физических, экономических, технических, социальных систем и процессов, 2-5 февраля 2009 года, г. Ульяновск / под ред.
д. т. н., проф. Ю. В. Полянскова, д. ф.-м. н., проф. В. Л. Леонтьева. - Ульяновск :
УГУ, 2009. - С.35Ц37.
22. N.G. Yarushkina, T.R.Unusov, T.V.Afanasieva Fuzzy Tendency-based Time Series Model for Forecasting Server Traffic// Proceeding of 13th IFSA World Congress and the 6th Conference of EUSFLAT, July, 2009, Lisbon, Portugal 23. Perfilieva, I. Relaxed Discrete F-Transform and its Application to the Time Series Analysis / I Perfilieva, N Yarushkina, T Afanaseva // Da Ruanetal (Eds.):
Computational Intelligence. Foundations and Applications (Proc.of the 9th Int. FLINS Conf.), pp. 249 --255, World Scientific, Emei, Chengdu,China, 2-4 August, 2010.
24. Perfilieva, I. Time Series Analysis by Discrete F-Transform / I. Perfilieva, N.
Yarushkina, T. Afanasieva //WCCI-2010 2010 IEEE World Congress on Computational Intelligence, Barcelona, Spain, 18-23 июля, 2010.
25. SOFT COMPUTING TOOLS FOR TIME SERIES ANALYSIS AND FORECAST/I. Perfilieva, N. Yarushkina, T. Afanasieva, A. Igonin, A. Romanov, V.
Shishkina РROCEEDINGS of the 9th Int. Conf. on Application of Fuzzy Systems and Soft Computing (ICAFS 2010) Eds. R. A. Aliev, K. W. Bonfig, M. Jamshidi, W.
Pedrycz, I.B. Turksen, Prague, August 26-27, 2010, VERLAG b- Quadrat Verlag, pp.
50--60 ISBN: 3-933609-28.
26. Yarushkina, N. Fuzzy Tend Program / N. Yarushkina, T. Afanasieva / Proc.Seoul International Inventory Fair, Seoul, Korea, 2010 (SIIF 2010). - p.266.
27. Афанасьева, Т. В. Программная реализация интегрального метода нечеткого моделирования и анализа нечетких тенденций временных рядов / Т.
В. Афанасьева, А. Г. Чекмарев, Д. Е. Савельев // Сборник трудов всероссийской конференции Проведение научных исследований в области обработки, хранения, передачи и защиты информации. Т.2. - Ульяновск : УГТУ, 2009. - С. 542-549.
28. Ярушкина Н.Г. Обзор методологических подходов интеллектуального анализа данных для прогнозирования временных рядов / Н.Г. Ярушкина, Т.В.
Афанасьева // Труды Конгресса по интеллектуальным системам и информационным технологиям AIS-ITТ10. Научное издание в 4-х томах. - М..
: Физматлит, 2010. - Т. 1. - С. 319-327.
29. Афанасьева Т.В. Internet-сервис экспресс-анализа экономического состояния предприятия/ Афанасьева Т.В. и др. / Двенадцатая национальная конференция по искусственному интеллекту с международным участием КИИ2010(20 сентября-24 сентября, 2010г., Тверь, Россия):Труды конференции. - Т.4.
- С.54-62.
30. Афанасьева Т.В. Исследование метода анализа нечетких элементарных тенденций для прогнозирования временных рядов / Т. В. Афанасьева, Н.Г.
Ярушкина // Информатика, моделирование, автоматизация проектирования:
сборник научных трудов под ред. Н.Н.Войта. - Ульяновск : УГТУ, 2010. - С.
68-75.
31. Афанасьева Т.В. и др. Time Series Processing and Forecasting using Soft Computing Tools. - Lecture Notes in Computer Science, Vol. 6743, Proceedings of 13-th International Conf. RSFDGrC-2011. Springer-Verlag, 2011, XIII.-p. 155-163.
32. Афанасьева Т.В. и др. Granular TS and fuzzy Tend Forecast// Proc. of World Congress of International Fuzzy Systems Association 2011 and Asia Fuzzy Systems Society International Conference 2011, Р. 1231-1235.
33. Афанасьева Т.В. Анализ эффективности моделирования трафика нечеткими моделями/ Т.В. Афанасьева, Н.Г. Ярушкина// Материалы первой Российской конференции с международным участием Системный анализ и семиотическое моделирование. SASMТ2011. - Казань, Изд-во ФЭН. - 2011. - с. 195-198.
34. Афанасьева Т.В. и др. Программа нечеткого моделирования и анализа нечетких тенденций (Fuzzy Tend). Свидетельство о государственной регистрации программ для ЭВМ № 2010613774, 2010 г.
35. Афанасьева Т.В. и др. Интернет-сервис экспресс-анализа деятельности организации на основе анализа временных рядов. Свидетельство о государственной регистрации программ для ЭВМ № 2011614304, 2011 г.
Афанасьева Татьяна Васильевна Автореферат диссертации на соискание ученой степени доктора технических наук МЕТОДОЛОГИЯ, МОДЕЛИ И КОМПЛЕКСЫ ПРОГРАММ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ НА ОСНОВЕ НЕЧЕТКИХ ТЕНДЕНЦИЙ Подписано в печать 2012. Формат 60 х 84/16. Бумага писчая, Усл.п.л. 2,56.
Уч.-изд.л. 2.50. Тираж 100 экз. Заказ Типография УГТУ, 432027, Ульяновск, Северный Венец, 32.
Авторефераты по всем темам >> Авторефераты по техническим специальностям