Информационные системы в построении взаимоотношений с потребителями

Дипломная работа - Маркетинг

Другие дипломы по предмету Маркетинг

µ данных поступают из транзакционной базы данных, из внутренних бизнес-процессов предприятия: производства, учета и контроля, логистики; из внешних источников: исследований, демографической информации. Очень важен основной принцип действия хранилища данных: единожды занесенные туда данные затем многократно извлекаются из него и используются для анализа. Отсюда вытекает одно из основных преимуществ использования хранилища данных в построении взаимоотношений с покупателями - контроль за критически важной информацией, полученной из различных источников. Наиболее уязвимым местом использования хранилища данных на предприятии, с точки зрения бизнеса, является корректность его данных, полученных из разных источников. Данные перед загрузкой в DW должны быть либо "очищены от шума", либо обработаны методами нечеткой логики, допускающей наличие противоречивых фактов. Данные из разных источников должны быть представлены согласованно по их типу, размерности и содержательному описанию.

Хранилища данных содержат огромные массивы самых различных данных, тогда как для решения конкретной задачи требуется далеко не все данные, причем пользователю (аналитику, сотруднику службы продаж или операторского центра) практически не возможно самостоятельно решить какие именно данные нужны для решения проблемы или принятия решения. Эти задачи призваны решить технологии, которые получили название добычи знаний (data mining) и оперативной аналитической обработки данных (OLAP - Online Analytical Processing).

Mining по-английски означает добычу полезных ископаемых, а поиск закономерностей в огромном наборе фактических данных действительно близок к этому. Другими словами, термин добыча знаний реально обозначает не столько технологию, сколько сам процесс поиска корреляций, тенденций, взаимосвязей и закономерностей посредством различных математических и статистических алгоритмов - кластеризации, создания субвыборок, регрессионного и корреляционного анализа. Цель этого поиска - представить данные в таком виде, чтобы стало возможным понять поведение покупателей , а также построить модель, с помощью которой можно прогнозировать это поведение. Data mining - это процесс автоматического выделения действительной, эффективной, ранее неизвестной и совершенно понятной информации из больших баз данных и использование ее для принятия ключевых бизнес-решений. Следует отметить, что процесс обнаружения знаний не полностью автоматический - он требует участия пользователя то есть, пользователь должен знать, что он ищет, основываясь на собственных гипотезах. В итоге часто вместо подтверждения имеющейся гипотезы процесс поиска вызывает появление новых гипотез. Добыча знаний - это не один, а совокупность большого числа различных методов обнаружения знаний. Выбор метода часто зависит от типа имеющихся данных и от того, какую информацию вы пытаетесь получить. Некоторые методы перечислены ниже:

  1. объединение - выделение структур, повторяющихся во временной последовательности. Обнаруживает правила, по которым присутствие одного набора элементов коррелирует с другим. Цель - найти закономерности среди большого числа транзакций. Этот метод может применяться для совместного предложения покупателю продуктов, которые обычно покупаются вместе покупателями подобного профиля. Эта информация может использоваться для модификации расположения полок и последовательности товаров в торговом зале. Классический пример из американской жизни, когда в одном из универсамов обнаружили, что по субботам молодые отцы, купив памперсы и исполнив таким образом свою миссию, покупают пиво. Расположив полку с пивом рядом с полкой памперсов, универсам в четыре раза увеличил продажу пива по субботам;
  2. анализ временных рядов позволяет найти временные закономерности между транзакциями. Например, можно ответить на вопрос, покупки каких товаров предшествуют покупке данного вида продукции, также используются для управления жизненным циклом клиента. Выделяются те клиенты, в жизненном цикле взаимодействия с компаний наметились негативные для компании перемены, с тем, чтобы воздействовать на таких клиентов;
  3. кластеризация - группировка записей, имеющих одинаковые характеристики, например, по близости значений полей. Кластеризация часто рассматривается как первый необходимый шаг для дальнейшего анализа данных;
  4. классификация (classification) - отнесение записи к одному из заранее определенных классов. Используется, например, при оценке рисков при выдаче кредита;
  5. статистические методы, позволяющие находить кривую, наиболее близко расположенную к набору точек данных;
  6. нейронные сети - данные пропускаются через слои узлов, "обученных" распознаванию тех или иных структур. Используются для анализа предпочтений покупателей, их удержания, а также для обнаружения мошенников.

Оперативный анализ данных или OLAP предоставляет возможности быстрого анализа разделяемой многомерной информации, это означает, что:

  • анализ должен производиться одинаково быстро по всем аспектам информации, приемлемое время отклика - 5 с или менее;
  • должна быть возможность осуществлять основные типы числового и статистического анализа, предопределенного разработчиком приложения или произвольно определяемого пользователем;
  • множество пользователей должно иметь доступ к данным, при этом необходимо контролировать доступ к конфиденциальной информации;
  • система должна обеспечить многомерное концептуа