Isbn 978-5-7262-1226 нейроинформатика 2010
Вид материала | Документы |
- Isbn 978-5-7262-1226 нейроинформатика 2010, 142.85kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 9.21kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 113.94kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 89.17kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 124.83kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 86.68kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 101.88kb.
- Isbn 978-5-7262-1377 нейроинформатика 2011, 107.92kb.
- Isbn 978-5-7262-1375 нейроинформатика 2011, 127.94kb.
- Isbn 978-5-7262-1375 нейроинформатика 2011, 25.66kb.
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 2
С.А. ГОРБАТКОВ1, Д.В. ПОЛУПАНОВ2, С.А. ФАРХИЕВА1
1Филиал Всероссийского заочного финансово-экономического института, Уфа
2 Башкирский государственный университет, Уфа
1gorbatkov.ufa@vzfei.ru, 1sagor@ufanet.ru, 2demetrious@mail.ru, 3ok-xi@yandex.ru
ОБОБЩЕНИЕ МЕТОДА ВЛОЖЕННЫХ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ НА ОСНОВЕ
БАЙЕСОВСКОГО ПОДХОДА К РЕГУЛЯРИЗАЦИИ ЗАДАЧ
НЕЙРОСЕТЕВОГО МОДЕЛИРОВАНИЯ
НАЛОГОВОГО И ФИНАНСОВОГО КОНТРОЛЯ
Исследованы вопросы обеспечения состоятельности регуляризированных по принципу квазиминимизации А.Н. Тихонова обратных задач восстановления многофакторных экономических зависимостей в нейросетевом базисе. На основе байесовского подхода систематизирован и разработан в деталях метод вложенных математических моделей для нейросетевых экономических объектов с существенным искажением данных. Теоретические положения подтверждаются вычислительными экспериментами на реальных данных муниципальных образовательных учреждений при планировании фонда материального развития.
Предметом исследования в работе являются вопросы регуляризации обратных задач восстановления многофакторных нелинейных зависимостей, «зашитых» в данных, в рамках построения нейросетевых моделей (НСМ) налогового и финансового контроля. Круг приложений таких моделей весьма широк [1-3]. Как известно [4-6], рассматриваемые задачи относятся к классу задач, некорректно поставленных по Адамару. В случае ограниченного объема данных, а именно такие приложения рассматриваются авторами, необходима регуляризация обратных задач [7]. Положение усугубляется при сильном зашумлении данных (вплоть до сознательного их искажения! [1]).
В наших исследованиях по регуляризации НСМ мы основывались на принципе регуляризации по А.Н. Тихонову [4], который сводит ее к решению задачи квазиминимизации для операторного уравнения:
![](images/214528-nomer-21ac7c66.gif)
![](images/214528-nomer-6ad88eee.gif)
где
![](images/214528-nomer-6db22780.gif)
![](images/214528-nomer-m3b423ee.gif)
![](images/214528-nomer-2fbea9d7.gif)
![](images/214528-nomer-40638679.gif)
![](images/214528-nomer-m6297510.gif)
![](images/214528-nomer-m3f473d71.gif)
Математический анализ, основанный на теореме А.Н. Тихонова [4], приводит к выводу, что выбор (2) решения
![](images/214528-nomer-12db643a.gif)
![](images/214528-nomer-m5fc5065f.gif)
![](images/214528-nomer-m6af593d7.gif)
В решении обратной задачи (1)-(2) участвует разнородная информация об изучаемом явлении: его НСМ
![](images/214528-nomer-9a299a6.gif)
![](images/214528-nomer-617e032c.gif)
![](images/214528-nomer-m3f473d71.gif)
![](images/214528-nomer-9a299a6.gif)
![](images/214528-nomer-6d22ae0f.gif)
Связанная с этой ситуацией потеря устойчивости НСМ подробно анализировалась в [1, 2, 9]. Следовательно, для практической регуляризации А.Н. Тихонова по (1)-(2) необходимо разработать три алгоритма:
- алгоритм I обеспечения состоятельности задачи регуляризации (1)-(2), исключающий ситуацию (3);
- алгоритм II построения подходящей числовой меры оценки погрешности для данных и инструмент управления этой погрешностью;
- алгоритм III построения числовой меры оценки качества НСМ и инструмента управления этим качеством.
Отдельные предложения по алгоритмам I, II и III были сформулированы и апробированы авторами в вычислительных экспериментах в [1, 2, 9-12]. Эти предложения можно объединить под названием «метод вложенных математических моделей (ВММ) для НСМ экономических объектов с сильным зашумлением данных».
В настоящей работе метод ВММ для регуляризации обратных задач восстановления данных согласно принципу (1)-(2) систематизирован и разработан в деталях на основе байесовского подхода к сравнению моделей, развитому в [7].
Алгоритм I обеспечения состоятельности задачи регуляризации. Постулируется, что в некоторых пределах интенсивности шума и объема сильнозашумленных вектор-столбцов данных
![](images/214528-nomer-44fe7b98.gif)
![](images/214528-nomer-m779a742b.gif)
![](images/214528-nomer-c157cda.gif)
![](images/214528-nomer-m2c624d17.gif)
![](images/214528-nomer-44fe7b98.gif)
![](images/214528-nomer-m2a44935c.gif)
![](images/214528-nomer-m99563b0.gif)
![](images/214528-nomer-m2119c49f.gif)
Предлагается следующая концепция разработки методов и алгоритмов обеспечения состоятельности задач регуляризации: уменьшение числовых мер ошибок эксперимента δ и ошибок аппроксимации
![](images/214528-nomer-m99563b0.gif)
- оптимальная кластеризация;
- оптимальная очистка данных в образованных кластерах;
- «ремонт» сильнозашумленных вектор-столбцов данных с помощью НССМ.
Указанные процедуры, разработанные с использованием общесистемных законов энтропийного равновесия, появления дисфункций структурируемой системы и фоновой закономерности [13], описаны достаточно подробно в [1, 2, 9-12], поэтому излагать их здесь не будем.
Алгоритм II построения подходящей числовой меры оценки погрешности данных на основе байесовского подхода. Формулировке алгоритма предпошлем краткое изложение формализма байесовского подхода к сравнению моделей, развитого в [7].
Байесов подход к обучению, основанный на решении обратной задачи, более последователен и, соответственно, применим к более широкому классу моделей с большими возможностями моделирования сложных явлений. Тем более, что в общем виде эта задача решается «в одну строку» и ее решение, следующее из общих принципов теории вероятностей, было известно уже в XVIII веке. Действительно, если трактовать как выбор гипотезы, так и наблюдение данных в вероятностном смысле и записать согласно определению условных вероятностей
![](images/214528-nomer-3603e375.gif)
получим теорему Байеса:
![](images/214528-nomer-m6b644333.gif)
Здесь
![](images/214528-nomer-111b8c14.gif)
![](images/214528-nomer-m7b6c8f7a.gif)
![](images/214528-nomer-m53c6a49d.gif)
![](images/214528-nomer-230c963b.gif)
Как видим, решение обратной задачи требует формализации наших априорных (prior) предположений
![](images/214528-nomer-m7b6c8f7a.gif)
![](images/214528-nomer-3b407535.gif)
Выбор метода регуляризации, то есть класса гипотез, в свою очередь, является мета-гипотезой H более высокого порядка, которые в теории машинного обучения принято называть моделями:
![](images/214528-nomer-50bc8b24.gif)
![](images/214528-nomer-71157226.gif)
Фундаментальный характер теоремы Байеса позволяет в едином ключе сравнивать между собой не только гипотезы, но и различные модели регуляризации. Тем самым, байесовский подход позволяет расширить рамки традиционной теории регуляризации, не предполагающей сравнение между собой регуляризирующих функционалов
![](images/214528-nomer-141f34d.gif)
Главный результат из работы [7], который «эксплуатируется» авторами при разработке алгоритма II формулируется так. Модель порождения данных в байесовской трактовке представлена ансамблем гипотез. Обучение увеличивает наше знание относительно такой модели. Ему предшествует некий априорный ансамбль гипотез, а результатом является более компактный апостериорный ансамбль гипотез. Предсказания модели подразумевают усреднение по этому ансамблю. При этом, качество предсказаний ансамбля выше, чем качество предсказания его наилучшей гипотезы. Оптимальному апостериорному ансамблю соответствует максимальная вероятность (знаменатель формулы Байеса).
В общем виде алгоритм II, предлагаемый в настоящей работе, можно сформулировать следующим образом: в качестве числовой меры δ погрешности данных выбирается обобщенный (векторный) мультипликативный критерий Ф, оцениваемый согласно алгоритму I в НССМ путем осреднения в ансамбле НС и определенный на обучающем множестве данных
![](images/214528-nomer-m6900db7f.gif)
![](images/214528-nomer-m450a9b37.gif)
где
![](images/214528-nomer-m9ce490e.gif)
![](images/214528-nomer-7024a4b8.gif)
![](images/214528-nomer-751e5ad9.gif)
![](images/214528-nomer-6aaebe80.gif)
![](images/214528-nomer-m7469be91.gif)
![](images/214528-nomer-9a299a6.gif)
![](images/214528-nomer-20cc8bf4.gif)
![](images/214528-nomer-m7469be91.gif)
Таким образом, обобщенный критерий качества НСМ Ф оценивает как точностные и прогностические свойства НС, так и ее устойчивость по вариации данных.
Осреднение в ансамбле гипотез
![](images/214528-nomer-75ce15b7.gif)
![](images/214528-nomer-m230057fd.gif)
где Q – число вспомогательных НССМ в ансамбле.
Алгоритм III построения числовой меры оценки качества НСМ
![](images/214528-nomer-m30072dd0.gif)
![](images/214528-nomer-m1d2853d.gif)
![](images/214528-nomer-446c6203.gif)
![](images/214528-nomer-m1d2853d.gif)
![](images/214528-nomer-24030c31.gif)
![](images/214528-nomer-m3d9bda97.gif)
![](images/214528-nomer-363d9209.gif)
![](images/214528-nomer-m48fce20b.gif)
![](images/214528-nomer-e735392.gif)
где
![](images/214528-nomer-m1be6d496.gif)
![](images/214528-nomer-3e42cc19.gif)
![](images/214528-nomer-7c78b558.gif)
Пример использования байесова подхода к прогнозным оценкам. Рассмотрим задачу ранжирования муниципальных образовательных учреждений при планировании фонда материального развития из [2]. Постановка задачи: входы описываются n-мерным вектором X, а выход – скалярным агрегированным показателем
![](images/214528-nomer-1142909d.gif)
В качестве пространства гипотез выбрано W-параметрическое семейство функций
![](images/214528-nomer-m5474bbf7.gif)
В качестве мета-гипотезы H принята парадигма НС многослойный персептрон с алгоритмом обучения типа обратного распространения ошибки. В пространстве гипотез
![](images/214528-nomer-75ce15b7.gif)
- гипотеза
– НС с одним скрытым слоем с сигмоидной функцией активации:
![](images/214528-nomer-m35a7af91.gif)
- гипотеза
– НС с двумя скрытыми слоями с функцией активации (11) в обоих слоях;
- гипотеза
– НС с двумя скрытыми слоями с функцией активации (11) в первом слое и гиперболический тангенс во втором слое:
![](images/214528-nomer-7d186818.gif)
- гипотеза
– НС с одним скрытым слоем с функцией активации (12);
- гипотеза
– НС с двумя скрытыми слоями с функцией активации (12) в обоих слоях;
- гипотеза
– НС с двумя скрытыми слоями с функцией активации (12) в первом слое и (11) во втором слое.
В табл. 1 приведены прогнозные значения показателя Ф для объекта № 2 (школа-лицей) в ансамбле НСМ (гипотез
![](images/214528-nomer-75ce15b7.gif)
Таблица 1
Результаты моделирования для объекта № 2
НСМ | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
Ф | 0,0265 | 0,0235 | 0,0238 | 0,0272 | 0,0245 | 0,0243 |
| 11% | 2% | 1% | 13% | 7% | 3% |
Для оценки ошибки прогноза выбрана точка горизонта прогноза (t = 21 месяц), где были известны данные. В таблице также приведена относительная ошибка аппроксимации (в процентах). Максимальная ошибка по ансамблю составила 13%, средняя ошибка равна 6,5%.
Взаимная согласованность гипотез
![](images/214528-nomer-m1770c005.gif)
![](images/214528-nomer-4522cea3.gif)
![](images/214528-nomer-3398de1e.jpg)
![](images/214528-nomer-414513ed.jpg)
Рис. 1. Прогноз показателя Ф по второму объекту
Таким образом, предварительные вычислительные эксперименты на реальных данных [2] показали работоспособность предлагаемого подхода к регуляризации НСМ на основе байесовского подхода.
Список литературы
- Горбатков С.А., Полупанов Д.В. Методы нейроматематики в налоговом контроле / Под ред. д.т.н., проф. С.А. Горбаткова. – Уфа: РИЦ БашГУ, 2008. – 136 с.
- Гатауллин Р.Ф., Горбатков С.А., Бирюков А.Н., Глущенко О.И. Моделирование бюджетных процессов на муниципальном уровне на основе нейросетей. – Уфа: Изд-во Восточного университета, 2008. – 220 с.
- Бэстенс Д.-Э., Ван-ден-Берг В.-М., Вуд Д. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. – М.: Научное изд-во ТВП, 1997. – 235 с.
- Тихонов А.Н., Кальнер В.Д., Гласко В.Б. Математическое моделирование технологических процессов и метод обратных задач в машиностроении. – М.: Машиностроение, 1990. – 264 с.
- Тихонов А.Н., Леонов А.С., Ягола А.Г. Нелинейные некорректные задачи. – М.: Наука, 1995. – 312 с.
- Федотов А.М. Некорректные задачи со случайными ошибками в данных - Новосибирск: Наука. Сибирское отделение, 1990. – 280 с.
- Шумский С.А. Байесова регуляризация обучения // Научная сессия МИФИ-2002. IV Научно-техническая конференция «Нейроинформатика – 2002»: Лекции по нейроинформатике. Часть 2. – М.: МИФИ, 2002. – С. 30-93.
- Хайкин С. Нейронные сети: полный курс. – М.: Изд. дом «Вильямс». – 1104 с.
- Горбатков С.А., Фархиева С.А., Бесхлебнова Г.А. Об одном алгоритме предобработки сильнозашумленных входных данных в аспекте обеспечения состоятельности задачи регуляризации для нейросетевых моделей // Научная сессия МИФИ-2009. XI Научно-техническая конференция «Нейроинформатика-2008»: Сборник научных трудов. В 2-х частях Часть 1. – М.: МИФИ, 2009.– С. 18-26.
- Горбатков С.А., Полупанов Д.В. Повышение качества гибридных нейросетевых моделей ранжирования объектов налогового контроля с помощью метода вложенных математических моделей // Научная сессия МИФИ-2008. X Научно-техническая конференция «Нейроинформатика-2008»: Сборник научных трудов. В 2-х частях Часть 1. – М.: МИФИ, 2008.– С. 41-51.
11. Gorbatkov S.A., Polupanov D.V. The regularization of neural networks for economioc objects with a strong data distraction // Материалы XV Международной конференции по нейрокибернетики. Том 2. Симпозиум «Интерфейс “Мозг-Компьютер”», 3-й Симпозиум по нейроинформатике и нейрокомпьютерам. – Ростов-на-Дону: Изд-во ЮФУ, 2009. – С. 263-266.
12. Горбатков С.А., Полупанов Д.В. Концепция разработки алгоритмов обеспечения состоятельности задачи регуляризации нейросетевых моделей с сильным зашумлением данных // Нейроинформатика, ее приложение и анализ данных: материалы XVII Всеросс. Семинара. – Красноярск: ИПК СФУ, 2009. – С. 42-44.
13. Прангишвилли И.В. Системный подход и общесистемные закономерности. – М.: СИГНЕТ, 2000. – 528 с.
УДК 004.032.26(06) Нейронные сети