.php> Содержание: "Хранилища данных (курс лекций)"

Хранилища данных (курс лекций)



СодержаниеЭволюция корпоративных информационных систем
Хранилища данных (Datawarehouse) и оперативный анализ данных (On-LineAnalyticalProcessing, OLAP
Опр.: Хранилище данных
Что такое OLAP
Отличия хранилищ от обычных БД
Системы хранилищ данных
Общие свойства хранилищ
Ориентированность на предметную область
Первая причина
Вторая причина
Зависимость от времени
Данные хранилища
Источники данных
Хранилище данных (в узком смысле)
Оперативный склад данных (Operational Data Store - ODS)
Витрины данных (Data mart)
Компоненты хранилища
Подсистема загрузки данных
Подсистема обработки запросов и представления данных
Подсистема администрирования хранилища
Методика (методология) построения хранилищ данных
Постановка задачи
Техническое задание
Автоматизируемые процессы и функции
Информационное обеспечение
Базовые показатели
Производные показатели
Общая структура репозитария хранилища
Персональную информацию
Информацию по бизнес-темам
Детальные данные
Компонентная архитектура
Техническая архитектура
Выбор метода реализации Хранилищ данных
Продукция Microsoft
В СУБД MicrosoftSQLServer 7.0
Приложение MicrosoftRepository
Продукция Sybase
СУБД Sybase Adaptive Server IQ
Технологии Adaptive Server IQ
Продукция Oracle
Корпорация Oracle
Oracle9i Database
Компонент Data Warehouses
ETL компонент
Опция OLAP Services
Oracle BI Suite EE - самая «интеллектуальная» из аналитических платформ
Рис.1.Архитектура Oracle BI Suite EE
Клиентские приложения
Рис. 2. Слои корпоративной семантической модели
Доступ к данным и обработка запросов
Выбор продукта
Многомерные кубы
SELECT dbo.Invoices.Country
SELECT Invoices.Country, Invoices.City
SELECT Country, SUM (ExtendedPrice) FROM invoices1
SUM (ExtendedPrice)
Некоторые термины и понятия
Типичная структура хранилищ данных
Таблица фактов
Таблицы измерений
OLAP на клиенте и на сервере
Технические аспекты многомерного хранения данных
Data mining
Разведочный анализ данных (РАД)
Кластерный анализ
Факторный анализ как метод редукции данных
Анализ временных рядов
Условные сокращения и обозначения
Склад данных (СД, data warehouse, DWH)
Секция данных (data mart)
Исследование данных (data mining)
Первичная обработка данных (data cleansing and scrubbing)
Администратор данных (data steward)
Огромная база данных (точнее всего - сверхбольшая; огромный, или сверхбольшой, склад данных, very large database, VLDB)
Система поддержки принятия решений (СППР, decision support system, DSS)
Сложный анализ данных (intelligent data analysis)
Список использованных источников