Прогнозирование объема реализации продукции ООО "Славянка"
Дипломная работа - Экономика
Другие дипломы по предмету Экономика
?ой сети является минимизация функции ошибок, или невязки, Е на данном множестве примеров путем выбора значений весов W. Целью процедуры минимизации является отыскание глобального минимума - достижение его называется сходимостью процесса обучения. Поскольку невязка зависит от весов нелинейно, получить решение в аналитической форме невозможно, а поиск глобального минимума осуществляется посредством итерационного процесса - так называемого обучающего алгоритма, который исследует поверхность невязки и стремиться обнаружить на ней точку глобального минимума.
В качестве функции ошибки, численно определяющей сходство всех текущих выходных сигналов сети и соответствующих требуемых выходных сигналов обучающей выборки, в большинстве случаев используется среднеквадратичное отклонение. Однако в ряде нейропакетов существует либо возможность выбора, либо задания своей функции ошибки.
Реализуемые в нейропакетах алгоритмы обучения нейронных сетей можно разделить на три группы: градиентные, стохастические, генетические. Градиентные алгоритмы (первого и второго порядков) основаны на вычислении частных производных функции ошибки по параметрам сети. В стохастических алгоритмах поиск минимума функции ошибки ведется случайным образом. Генетические алгоритмы комбинируют свойства стохастических и градиентных алгоритмов: на основе аналога генетического наследования реализуют перебор вариантов, а на основе аналога естественного отбора - градиентный спуск [17].
При обучении нейронных сетей, как правило, используются следующие критерии остановки:
при достижении некоторого малого значения функции ошибки;
в случае успешного решения всех примеров обучающей выборки (при неизменности выходных сигналов сети).
Для проверки правильности обучения построенной нейронной сети в нейроимитаторах предусмотрены специальные средства ее тестирования. В сеть вводится некоторый сигнал, который, как правило, не совпадает ни с одним из входных сигналов примеров обучающей выборки. Далее анализируется получившийся выходной сигнал сети.
Тестирование обученной сети может проводиться либо на одиночных входных сигналах, либо на тестовой выборке, которая имеет структуру, аналогичную обучающей выборке, и также состоит из пар (вход, требуемый выход). Обычно, обучающая и тестовая выборки не пересекаются. Тестовая выборка строится индивидуально для каждой решаемой задачи [6, с. 221].
Итак, процесс создания нейросетевой модели состоит из следующих последовательных этапов:
. Определение пространства признаков. Решение о том, какую входную информацию использовать и что сетевая модель должна делать.
. Решение о том, как представить информацию и сбор ее в виде примеров.
. Определение нейронной сети. Выбор входов сети и спецификация выходов.
. Обучение модели.
. Тестирование обученной модели.
Далее этот пятишаговый процесс применяется для различных проблем с разным представлением данных в нейросетевой модели [2, с.72].
В Deductor используются самые мощные технологии, такие как многомерный анализ, нейронные сети, деревья решений, самоорганизующиеся карты, спектральный анализ и множество других. При этом акцент сделан на самообучающиеся методы и машинное обучение, что позволяет строить адаптивные системы [15].Studio - программа, реализующая функции импорта, обработки, визуализации и экспорта данных. В Deductor Studio включен полный набор механизмов, позволяющий получить информацию из произвольного источника данных, провести весь цикл обработки (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удобным образом (OLAP, диаграммы) и экспортировать результаты на сторону.
Архитектура системы построена таким образом, что вся работа по анализу данных в Deductor Studio базируется на выполнении следующих действий:
импорт данных;
обработка данных;
визуализация;
экспорт данных.
Процесс построения моделей в Deductor основывается на следующих трех принципах:
. Использование обработчиков;
. Использование визуализаторов;
. Создание сценариев.
Обработка и визуализация - две атомарные операции с данными в Deductor. Под обработкой понимаются любые манипуляции над набором данных: от самых простых (например, сортировка) до сложных (построение нейронной сети). Обработчик можно представить в виде черного ящика, на вход которого подается набор данных, а на выходе формируется преобразованный набор данных. Реализованные в Deductor обработчики покрывают основную потребность в анализе данных и создании законченных аналитических решений.
Любой набор данных можно визуализировать каким-либо доступным способом или несколькими способами, поскольку визуализация помогает интерпретировать построенные модели. В Deductor предусмотрены следующие способы визуализации данных.
) OLAP - многомерное представление данных. Любые данные, используемые в программе, можно посмотреть в виде кросс - таблицы и кросс - диаграммы.
) Таблица - стандартное табличное представление с возможностью фильтрации данных.
) Диаграмма - график изменения любого показателя.
) Гистограмма - график разброса показателей.
) Статистика - статистические показатели набора данных.
) Диаграмма рассеяния - график отклонения прогнозируемых при помощи модели значений от реальных. Может быть построена только для непрерывных величин и только после использования механизмов построения модел