1: Информационные системы (ИС)

Вид материалаДокументы

Содержание


Тема 12: Данные, информация, знания.
Нейронные сети
Подобный материал:
1   ...   4   5   6   7   8   9   10   11   12

Тема 12: Данные, информация, знания.



Данные  информация  знания  управление  прибыль  нужды




Данные.


Есть данные, которые мы можем получить бесплатно, а есть, которые мы получаем за деньги: нужно ясно представлять, какие цели у организации, какие данные вам нужны.

П
реобразование базы данных в информационное хранилище (data house mining).

Д

анные  информация.

Информационные хранилища содержат информацию о группе клиентов, о типе клиентов и т.д.

Информационные хранилища – многомерные базы данных. Например, одна из осей – время.

Если в базе данных можно менять адрес, то в информационных хранилищах нельзя ничего добавить в хронологию. Это хорошо с одной стороны. Но для хранилища информации нужны большие объёмы (Гб (гигабайты), Тб (терабайты)).

Фирма САС любит приводить в пример компанию ГАУ, которая имеет по всему миру огромное количество филиалов.

О
бсуждение в офисе: почему появилась разница?

Режим реального времени (5-30 сек).

OLAP-технологии (online analytical processing).

Скопление информации в одном месте (вычищенной, структурированной) позволяет применять более серьёзные средства, чем графики, диаграммы, схемы.

Б
олее серьёзные технологии – статистические методы, механизмы прикладной статистики.

Статистическая классификация.

Разделив, классифицировав клиентов, мы получаем знания о них и принимаем решения. Сделать это мы можем волевым решением, разделив самостоятельно на группы, а можно посмотреть распределение.

Нейро-сетевые технологии.

Принципиально то, что база должна быть большой. Опыт, который можно превратить в знания.

Можно рисовать клеточки клиентов и попытаться понять, а можно и не пытаться понять, а выработать математические методы, с помощью которых можно делать прогнозы для каждого вновь вступившего.

Р
егрессионный анализ не работает с прерванными линиями, а разрывы = обычное дело тут.

x – описание вашего клиента (либо балансовые данные, либо тип деятельности, либо…)

Подсчитываем скалярное произведение.

Нейроны составляют сеть.

Нейронные сети. Нейросеть и есть ваши знания, то, что вам известно. На выходе получаем рекомендации.

Примеры применения нейросетей для принятия решений:

Аукцион акций.

Опцион – право купить эти акции в определённое время за определённую сумму. Выгода продавца – даже если вы не купите акции, то всё равно уже заплатили за опцион.

Инсайдер – человек, который знает, что творится в компании.

Хеджирование – страхование на рынке ценных бумаг (например, покупка опционов).

Пример:

Акции "Филлипс" на бирже, опционы "Филлипс" на Европейской бирже опционов. Одна открывается раньше и закрывается раньше. Получали бы 12% годовых, если бы играли на обученной нейросетевой схеме.

Оказывается, обучать надо было по месячной схеме, а потом дообучать по недельной схеме. Информация очень быстро стареет на рынке ценных бумаг.

Если есть несколько методов прогнозирования, то надо использовать все.

Пример: Как можно зарабатывать деньги в Москве. Информатик играет на Чикагской фьючерсной бирже. Монитор. Режим TIT (каждые две секунды ползёт схема).

Есть нейросеть, есть вся предыстория. Почему бы не научить нейросеть отдавать команды "покупать"/"продавать" вместо вас?

Всё это реализовано на обычном домашнем компьютере.

Сеть надо постоянно дообучать.

Случайный поиск – дейтамайнинг. Система считает, что выдаёт некую точку: либо прорыв, либо провал.

f – передаточная нелинейная функция. Позволяет нам заниматься аппроксимацией более сложной функции.

Contraintuition – то, что противоречит интуиции.

Когда обратная связь (с которой связано управление) задерживается и происходит нелинейно, то интуиция отказывается работать.

P
(t) = a + bP(t) + c P
2(t)



Независимо от начальной точки, процесс придёт к устойчивой точке (например, договорная цена).

Но есть другая модель. Зависимость от стратегии поведения. Странный аттрактор. Аттракторная модель детерминированный хаос. Хаотическая модель. Малые отклонения в начале сильно влияет.

Точка бифуркации. Сначала устойчивая ситуация. Далее - разрушение стабильности, хаотическое движение.

П
ример: Сжимаем металлический стержень прессом. В какой-то определённый момент нам необходимо приложить силу, чтобы стержень изогнулся в нужном направлении. До этого момента прилагать силу нельзя, т.к. стержень выскочит. А после него будет уже невозможно изменить произвольное направление изгиба. Этот момент – точка бифуркации.

Дейтамайнинг.


Дейта – данные,

майнинг – обогащение, насыщение.

Вопрос технического анализа – типичный вопрос дейтамайнинга. Есть ли среди хаотических точек сгущения типы точек, которые можно классифицировать? Методы интеллектуального анализа.

Постеризация – в многомерном пространстве есть точки. Надо проверить гипотезу о существовании сгущений, где всё непонятно.

Есть точки, требующие отдельного управления.

Нейросети – мы ничего не знаем, но можем управлять, если доверяем системе.

Из большого массива данных можно извлечь закономерность, знания. Надо успевать рисовать формулы, а то уже не нужны формулы, вычисляющие "вторники".

Управление.


Откуда-то из пространства окружающей среды поступают данные (ресурсы).

К
ак из этого знания получить управление?

Ставим задачу производить больше или снизить затраты, потери.

Допустим, рабочие не справляются. Добавление двух рабочих сводит к нулю запасы на складе, т.к. они быстро выполняют работу. Надо увеличить количество комплектующих.

As is (как есть)  What if (что будет, если) – переход от знаний к управлению.

SPSS – пакет, первоначально статистический, теперь выпускается как пакет What if.

Деньги, вложенные в информатизацию хранилища не всегда возвращаются.