1: Информационные системы (ИС)
Вид материала | Документы |
СодержаниеТема 12: Данные, информация, знания. Нейронные сети |
- Направление 230400 «Информационные системы и технологии», 20.25kb.
- Программа дисциплины «информационные сети» Индекс дисциплины по учебному плану: опд., 123.28kb.
- Многоуровневая учебная программа дисциплины электротехника и электроника для подготовки, 409.29kb.
- Программа дисциплины «вычислительная математика» Индекс дисциплины по учебному плану:, 550.42kb.
- Программа государственного экзамена по специальности: 230201. 65 «Информационные системы, 450.31kb.
- В. П. Информационные системы в технике и технологиях. Ч. Диплом, 1332.77kb.
- Информационные технологии управления лекция 6 Информационные системы планирования (бюджетирования), 41.66kb.
- Конспект лекций по дисциплине «Информационные системы в экономике», 1286.5kb.
- Рабочая программа по дисциплине "алгоритмизация и программирование" для специальности, 136.78kb.
- Рабочая программа По дисциплине «Интеллектуальные информационные системы» По специальности, 353.65kb.
Тема 12: Данные, информация, знания.
Данные информация знания управление прибыль нужды
Данные.
Есть данные, которые мы можем получить бесплатно, а есть, которые мы получаем за деньги: нужно ясно представлять, какие цели у организации, какие данные вам нужны.
П
реобразование базы данных в информационное хранилище (data house mining).
Д
анные информация.
Информационные хранилища содержат информацию о группе клиентов, о типе клиентов и т.д.
Информационные хранилища – многомерные базы данных. Например, одна из осей – время.
Если в базе данных можно менять адрес, то в информационных хранилищах нельзя ничего добавить в хронологию. Это хорошо с одной стороны. Но для хранилища информации нужны большие объёмы (Гб (гигабайты), Тб (терабайты)).
Фирма САС любит приводить в пример компанию ГАУ, которая имеет по всему миру огромное количество филиалов.
О
бсуждение в офисе: почему появилась разница?
Режим реального времени (5-30 сек).
OLAP-технологии (online analytical processing).
Скопление информации в одном месте (вычищенной, структурированной) позволяет применять более серьёзные средства, чем графики, диаграммы, схемы.
Б
олее серьёзные технологии – статистические методы, механизмы прикладной статистики.
Статистическая классификация.
Разделив, классифицировав клиентов, мы получаем знания о них и принимаем решения. Сделать это мы можем волевым решением, разделив самостоятельно на группы, а можно посмотреть распределение.
Нейро-сетевые технологии.
Принципиально то, что база должна быть большой. Опыт, который можно превратить в знания.
Можно рисовать клеточки клиентов и попытаться понять, а можно и не пытаться понять, а выработать математические методы, с помощью которых можно делать прогнозы для каждого вновь вступившего.
Р
егрессионный анализ не работает с прерванными линиями, а разрывы = обычное дело тут.
x – описание вашего клиента (либо балансовые данные, либо тип деятельности, либо…)
Подсчитываем скалярное произведение.
Нейроны составляют сеть.
Нейронные сети. Нейросеть и есть ваши знания, то, что вам известно. На выходе получаем рекомендации.
Примеры применения нейросетей для принятия решений:
Аукцион акций.
Опцион – право купить эти акции в определённое время за определённую сумму. Выгода продавца – даже если вы не купите акции, то всё равно уже заплатили за опцион.
Инсайдер – человек, который знает, что творится в компании.
Хеджирование – страхование на рынке ценных бумаг (например, покупка опционов).
Пример:
Акции "Филлипс" на бирже, опционы "Филлипс" на Европейской бирже опционов. Одна открывается раньше и закрывается раньше. Получали бы 12% годовых, если бы играли на обученной нейросетевой схеме.
Оказывается, обучать надо было по месячной схеме, а потом дообучать по недельной схеме. Информация очень быстро стареет на рынке ценных бумаг.
Если есть несколько методов прогнозирования, то надо использовать все.
Пример: Как можно зарабатывать деньги в Москве. Информатик играет на Чикагской фьючерсной бирже. Монитор. Режим TIT (каждые две секунды ползёт схема).
Есть нейросеть, есть вся предыстория. Почему бы не научить нейросеть отдавать команды "покупать"/"продавать" вместо вас?
Всё это реализовано на обычном домашнем компьютере.
Сеть надо постоянно дообучать.
Случайный поиск – дейтамайнинг. Система считает, что выдаёт некую точку: либо прорыв, либо провал.
f – передаточная нелинейная функция. Позволяет нам заниматься аппроксимацией более сложной функции.
Contraintuition – то, что противоречит интуиции.
Когда обратная связь (с которой связано управление) задерживается и происходит нелинейно, то интуиция отказывается работать.
P
(t) = a + bP(t) + c P2(t)
Независимо от начальной точки, процесс придёт к устойчивой точке (например, договорная цена).
Но есть другая модель. Зависимость от стратегии поведения. Странный аттрактор. Аттракторная модель детерминированный хаос. Хаотическая модель. Малые отклонения в начале сильно влияет.
Точка бифуркации. Сначала устойчивая ситуация. Далее - разрушение стабильности, хаотическое движение.
П
ример: Сжимаем металлический стержень прессом. В какой-то определённый момент нам необходимо приложить силу, чтобы стержень изогнулся в нужном направлении. До этого момента прилагать силу нельзя, т.к. стержень выскочит. А после него будет уже невозможно изменить произвольное направление изгиба. Этот момент – точка бифуркации.
Дейтамайнинг.
Дейта – данные,
майнинг – обогащение, насыщение.
Вопрос технического анализа – типичный вопрос дейтамайнинга. Есть ли среди хаотических точек сгущения типы точек, которые можно классифицировать? Методы интеллектуального анализа.
Постеризация – в многомерном пространстве есть точки. Надо проверить гипотезу о существовании сгущений, где всё непонятно.
Есть точки, требующие отдельного управления.
Нейросети – мы ничего не знаем, но можем управлять, если доверяем системе.
Из большого массива данных можно извлечь закономерность, знания. Надо успевать рисовать формулы, а то уже не нужны формулы, вычисляющие "вторники".
Управление.
Откуда-то из пространства окружающей среды поступают данные (ресурсы).
К
ак из этого знания получить управление?
Ставим задачу производить больше или снизить затраты, потери.
Допустим, рабочие не справляются. Добавление двух рабочих сводит к нулю запасы на складе, т.к. они быстро выполняют работу. Надо увеличить количество комплектующих.
As is (как есть) What if (что будет, если) – переход от знаний к управлению.
SPSS – пакет, первоначально статистический, теперь выпускается как пакет What if.
Деньги, вложенные в информатизацию хранилища не всегда возвращаются.