Прогнозирование объема реализации продукции ООО "Славянка"
Дипломная работа - Экономика
Другие дипломы по предмету Экономика
и, например, нейросети или линейной регрессии. Используется для визуальной оценки качества построенной модели.
) Таблица сопряженности - предназначена для оценки результатов классификации вне зависимости от используемой модели. Таблица сопряженности отображает результаты сравнения категориальных значений исходного выходного столбца и категориальных значений рассчитанного выходного столбца. Используется для оценки качества классификации.
) Что - если - таблица и диаграмма. Позволяют прогонять через построенную модель любые интересующие пользователя данные и оценить влияние того или иного фактора на результат.
) Обучающая выборка - набор данных, используемый для построения модели.
) Диаграмма прогноза - применяется после использования метода обработки - Прогнозирование. Прогнозные значения выделяются цветом.
) Граф нейросети - визуальное отображение обученной нейросети. Отображается структура нейронной сети и значения весов.
) Дерево решений - отображение дерева решений, полученного при помощи соответствующего алгоритма.
) Дерево правил - отображение в иерархическом виде (в виде дерева) ассоциативных правил.
) Карта Кохонена - отображение карт, построенных при помощи соответствующего алгоритма.
) Описание - текстовое описание параметров импорта/обработки/экспорта в дереве сценариев обработки[16].
Сценарий представляет собой иерархическую последовательность обработки и визуализации наборов данных. Сценарий всегда начинается с импорта набора данных из произвольного источника. После импорта может следовать произвольное число обработчиков любой степени глубины и вложенности. Каждой операции обработки соответствует отдельный узел дерева, или объект сценария. Любой объект можно визуализировать тем или иным доступным средством. Набор данных служит механизмом, соединяющим все объекты сценария. Можно сказать, что сценарий - наиболее естественный с точки зрения аналитика способ представления этапов построения модели.
Все сценарии создаются на основе запуска мастеров. В распоряжение аналитика имеется 4 мастера: импорт, экспорт, обработка, отображение.
Мастер импорта предназначен для автоматизации получения данных из любого источника, предусмотренного в системе. На первом шаге мастера импорта открывается список всех предусмотренных в системе типов источников данных. Число шагов мастера импорта, а также набор настраиваемых параметров отличается для разных типов источников.
Мастер обработки предназначен для настройки всех параметров выбранного алгоритма.
Мастер отображений позволяет в пошаговом режиме выбрать и настроить наиболее удобный способ представления данных. В зависимости от обработчика, в результате которого была получена ветвь сценария, список доступных для него видов отображений будет различным.
Мастер экспорта позволяет в пошаговом режиме выполнить экспорт данных в файлы наиболее распространенных форматов [15].
Прогнозирование - одна из самых востребованных, но при этом и самых сложных задач анализа. Проблемы при ее решении обусловлены многими причинами: недостаточное качество и количество исходных данных, изменения среды, в которой протекает процесс, воздействие субъективных факторов [14, с.17].
В Deductor включено несколько механизмов построения прогностических моделей, в том числе с использованием самообучающихся алгоритмов. Кроме этого в системе имеются механизмы очистки данных, которые приносят особенно большую пользу при решении задачи прогнозирования. Имеющийся набор позволяет получать качественные прогнозы и обладает большими возможностями по адаптации, т.е. способен подстраиваться под изменяемую ситуацию. Реализованы механизмы, позволяющие автоматически строить прогнозы на основе временного ряда на несколько шагов вперед. Достаточно построить модель, прогнозирующую изменение на один шаг, и автоматически использовать ее на произвольное количество отсчетов вперед. Рассмотрим основные этапы прогнозирования.
Очистка данных - очень важный этап обработки. В реальных данных почти всегда присутствуют пропуски, аномалии и т.п., что значительно ухудшает качество выборки. Deductor Studio содержит набор инструментов для решения задач очистки данных:
Редактирование аномалий;
Заполнение пропусков;
Очистка от шумов;
Сглаживание;
Редактирование дубликатов и противоречий.
Трансформация данных является последним шагом перед построением прогностической модели. На этом шаге данные приводятся к виду, пригодному для использования различных способов построения моделей.
В Deductor Studio реализованы следующие механизмы трансформации:
Преобразование к скользящему окну;
Квантование;
Группировка;
Сортировка;
Приведение типов.
В случае прогнозирования необходимо решать задачу регрессии. В Deductor Studio имеются механизмы построения как линейных моделей (линейная регрессия), так и нелинейных (нейронные сети) [15].
Из общеизвестных преимуществ нейросетевого подхода следует выделить одно, самое привлекательное в нем - отсутствие необходимости в строгой математической спецификации модели, что особенно ценно при анализе плохо формализуемых процессов [4, с.401].
Работы по прогнозированию не оканчиваются при построении первой модели. Необходимо проводить регулярную верификацию результатов. Для этого нужно применять экспертные оценки, тестировать на данных, неизвестных пр?/p>