Разработка интеллектуальной системы подбора товара
Курсовой проект - Компьютеры, программирование
Другие курсовые по предмету Компьютеры, программирование
?онная сеть модифицирует весовые коэффициенты до тех пор, пока предсказываемый выходной параметр соответствует действительному значению. После обучения нейронная сеть становится моделью, которую можно применить к новым данным с целью прогнозирования.Генетические алгоритмыЭтот метод использует итеративный процесс эволюции последовательности поколений моделей, включающий операции отбора, мутации и скрещивания. Для отбора определенных особей и отклонения других используется функция приспособленности (fitness function). Генетические алгоритмы в первую очередь применяются для оптимизации топологии нейронныхГенетические алгоритмысетей и весов. Однако, их можно использовать и самостоятельно, для моделирования.Кластерный анализПодразделяет гетерогенные данные на гомогенные или полугомогенные группы. Метод позволяет классифицировать наблюдения по ряду общих признаков. Кластеризация расширяет возможности прогнозирования.Вывод путем сопоставления (Memory-Based Reasoning, Mbr) или вывод, основанный на прецедентах (Case-Based Reasoning, Cbr)Эти алгоритмы основаны на обнаружении некоторых аналогий в прошлом, наиболее близких к текущей ситуации, с тем, чтобы оценить неизвестное значение или предсказать возможные результаты (последствия).
Существует широкий спектр инструментов для поддержки проектов Data Mining. К ним относятся как общедоступные алгоритмы визуализации и машинного обучения, так и сложные программные пакеты, где используются обе стратегии, работающие на параллельных процессорах. Стоимость последних может достигать нескольких сотен тысяч долларов. Поиск наилучшего инструмента для Data Mining решения зависит от ряда условий, таких как цель проекта (например, анализ потребительской корзины) и размер исследуемой базы данных. При выборе инструментов и алгоритмов очень важна гибкость, поскольку в зависимости от выбора стратегии может быть получен разный результат [8-9].
Для анализа природной среды в настоящее время широко применяются методы, получившие в литературе название интеллектуального анализа данных (ИАД), этому русскому понятию соответствуют английские термины Data Mining (добыча данных), On line Analytical Processing, OLAP (оперативный анализ данных), Knowledge Discovery (обнаружение знаний) или Intelligent Analysis Data (разведывательный анализ данных). Термин ИАД кажется несколько рекламным. Методы ИАД едва ли более интеллектуальны, чем методы, применяющиеся в других разделах программного обеспечения, но поскольку термин устоялся, будем его использовать. В табл. 2.1. приведено краткое описание основных алгоритмов Data Mining [8-9].
2.1ЗАДАЧА ПОИСКА АССОЦИАТИВНЫХ ПРАВИЛ
Ассоциация - это одна из задач Data Mining. Целью поиска ассоциативных правил (association rule) является нахождение закономерностей между связанными событиями в базах данных [10-16].
Очень часто покупатели приобретают не один товар, а несколько. В большинстве случаев между этими товарами существует взаимосвязь. Так, например, покупатель, приобретающий лак для ногтей, скорее всего, захочет приобрести также средство для снятия лака. Эта информация может быть использована для размещения товара на прилавках.
Часто встречающиеся приложения с применением ассоциативных правил:
а)розничная торговля: определение товаров, которые стоит продвигать совместно; выбор местоположения товара в магазине; анализ потребительской корзины; прогнозирование спроса;
б)перекрестные продажи: если есть информация о том, что клиенты приобрели продукты A, Б и В, то какие из них вероятнее всего купят продукт Г?
в)маркетинг: поиск рыночных сегментов, тенденций покупательского поведения;
г)сегментация клиентов: выявление общих характеристик клиентов компании, выявление групп покупателей;
д)оформление каталогов, анализ сбытовых кампаний фирмы, определение последовательностей покупок клиентов (какая покупка последует за покупкой товара А);
е)анализ Web-логов.
Простой пример ассоциативного правила: покупатель, приобретающий шампунь для волос, приобретет кондиционер для волос с вероятностью 50%.
Впервые задача поиска ассоциативных правил (association rule mining) была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда ее еще называют анализом рыночной корзины (market basket analysis) [10-12].
Рыночная корзина ? это набор товаров, приобретенных покупателем в рамках одной отдельно взятой транзакции.
Транзакции являются достаточно характерными операциями, или, например, могут описывать результаты посещений различных магазинов.
Транзакция ? это множество событий, которые произошли одновременно.
Регистрируя все бизнес-операции в течение всего времени своей деятельности, торговые компании накапливают огромные собрания транзакций. Каждая такая транзакция представляет собой набор товаров, купленных покупателем за один визит.
Полученные в результате анализа шаблоны включают перечень товаров и число транзакций, которые содержат данные наборы.
Транзакционная или операционная база данных (Transaction database) представляет собой двумерную таблицу, которая состоит из номера транзакции (TID) и перечня покупок, приобретенных во время этой транзакции.? уникальный идентификатор, определяющий каждую сделку или транзакцию.
Пример транзакционной базы данных, состоящей из покупательских транзакций, приведен в таблице 2.2. В таблице первая колонка (TID) определяет номер транзакции, во второй колонке таблицы приведены товары, приобретенные во время опред