Хранилища данных (курс лекций)
Вид материала | Курс лекций |
- Конспект лекций по курсу "базы данных" (Ч., 861.92kb.
- Мирончик Игорь Янович ClipperIgor@gmail com (496)573-34-22 курс лекций, 28.92kb.
- Курс лекций Барнаул 2001 удк 621. 385 Хмелев В. Н., Обложкина А. Д. Материаловедение, 1417.04kb.
- Курс лекций "Базы данных и субд" Ульянов В. С. Лекция. Манипулирование реляционными, 276.31kb.
- Курс лекций "Базы данных и субд" Ульянов В. С. Лекция Язык sql. Выборка данных, 168.86kb.
- Сейфы, сейфовые комнаты и хранилища. Требования и методы испытаний на устойчивость, 904.31kb.
- Курс лекций "Базы данных и субд" Ульянов В. С. Лекция Язык sql. Создание таблиц и ограничений, 146.46kb.
- Интернет-Университет Информационных Технологий, 446.77kb.
- Курс лекций по автоматизированному электроприводу для итр проектный организаций с применением, 24.37kb.
- Работы по формированию коллекции осуществляются с марта 2005 года, 52.81kb.
Хранилища данных
(курс лекций)
СОДЕРЖАНИЕ
Введение 3
Эволюция корпоративных информационных систем 4
Что такое OLAP 6
Общие свойства хранилищ 10
Ориентированность на предметную область 10
Интегрированность 11
Зависимость от времени 11
Постоянство 12
Данные хранилища 13
Источники данных 13
Хранилище данных (в узком смысле) 13
Оперативный склад данных (Operational Data Store - ODS) 13
Витрины данных (Data mart) 14
Метаданные 14
Компоненты хранилища 15
Подсистема загрузки данных 15
Подсистема обработки запросов и представления данных 15
Подсистема администрирования хранилища 16
Методика (методология) построения хранилищ данных 16
Постановка задачи 17
Системно-аналитическое обследование 17
Техническое задание 18
Проектирование 18
Автоматизируемые процессы и функции 18
Информационное обеспечение 19
Компонентная архитектура 21
Техническая архитектура 21
Реализация 22
Внедрение 22
Выбор метода реализации Хранилищ данных 22
Продукция Microsoft 24
Продукция Sybase 26
Продукция Oracle 30
Oracle BI Suite EE - самая «интеллектуальная» из аналитических платформ 32
Архитектура 33
Рис.1.Архитектура Oracle BI Suite EE 33
Клиентские приложения 34
Метаданные 35
36
Рис. 2. Слои корпоративной семантической модели 36
Выбор продукта 37
Многомерные кубы 38
Некоторые термины и понятия 42
Типичная структура хранилищ данных 44
Таблица фактов 45
Таблицы измерений 47
OLAP на клиенте и на сервере 51
Технические аспекты многомерного хранения данных 52
Data mining 54
Условные сокращения и обозначения 60
Словарь 60
Список использованных источников 62
Введение
Эффективное управление крупным и средним бизнесом сегодня немыслимо без применения передовых информационных технологий — систем поддержки принятия решений (СППР).
Процесс управления сводится к решению 3 задач:
- Где мы находимся?
- Куда мы хотим прийти?
- Как мы туда попадем?
Процесс управления — итерационный характер (принятие решения — применение управляющего воздействия — оценка состояния системы — оценка правильности выбранного решения — при наличии отклонений снова принятие решения).
Современные информационные технологии позволяют аналитику формулировать и решать следующие классы:
- Аналитические (вычисление заданных показателей и статистических характеристик).
- Визуализация данных
- Добыча знаний (data mining —проверка статистических гипотез, кластеризация, нахождение ассоциаций и временных шаблонов и т.п.)
- Имитационные (проведение на ЭВМ экспериментов на моделях, описывающих поведение сложных систем, например, в интервалы времени для анализа возможных последствий принятия того или иного решения)
- Синтез управления (для определения допустимых управляющих воздействий, обеспечивающих достижение заданной цели, оценка достижимости цели, определение множества возможных управляющих воздействий)
- Оптимизационные (интеграция имитационных, управленческих, оптимизационных и статистических методов моделирования и прогнозирования, выбор наиболее эффективного решения).
Однако в настоящее время нет информационных средств для решения всех задач в комплексе.
Бизнес — это сложный объект, который состоит из множества различных по свойствам подсистем, между которыми действует большое число разнородных связей. В кибернетике такие объекты получили название сложных систем, а методы их изучения — системным анализом (эта наука развивается с начала 40-х гг. в период 2-й мировой войны).
Общая с точки зрения теории познания триада имеет вид:
Гипотеза — модель — решение.
Гипотеза — это открытие, которое является новым положением, осуществляется на основе интуиции (из глубин человеческого подсознания, сформированного на основе личного опыта).
По гипотезе строится модель — формальное математическое описание — и находится решение. Полученное решение проверяется в эксперименте (отвергается или принимается). В результате получается знание, которым можно руководствоваться в практике.
Проблемы (в бизнесе):
- динамичное изменение экономической ситуации, что мешает применять накопленный опыт, не успевает вырабатываться интуиция.
- в условиях свободного рынка нет возможности проводить целенаправленные эксперименты.
В настоящее время актуальна разработка и использование комплексного ПО, реализующего задачи 1, 2 и 3-го классов. Сейчас стремительно развиваются OLAP- технологии.
Сейчас более 100 крупных производителей программ включились в конкуренцию.
OLAP — это инструменты оперативного анализа данных, содержащихся в хранилище, которые предназначены для общения аналитика с проблемой, а не с компьютером.