Привод ленточного конвеера
Курсовой проект - Разное
Другие курсовые по предмету Разное
сов счетов. Данная модель позволяет ответить на широкий спектр аналитических вопросов.
Давайте рассмотрим компоненты схемы "звезда".
Размерности
В технологии многомерного моде лирования размер ность это аспект, в разрезе которого можно получать, фильтровать, группировать и отображать информацию о фактах.
Типичные размерности, встречающиеся практически в любой модели:
- Клиент
- Продукт
- Время
- География
- Сотрудник
Размерности, как правило, имеют многоуровневую иерархическую структуру. Например, размерность ВРЕМЯ может иметь следующую структуру: ГОД КВАРТАЛ МЕСЯЦ ДЕНЬ
Факты
Факты это величины, обычно числовые, хранящиеся в таблице фактов и являющиеся предметом анализа. Примеры фактов: объем операций, количество проданных единиц товара и т.д.
Факты имеют ряд свойств, на которых мы вкратце остановимся. Более подробное описание фактов и их свойств можно найти в литературе [1, 8, 9].
Аддитивные факты
Аддитивность определяет возможность суммирования факта вдоль определенной размерности.
Аддитивные факты можно суммировать и группировать вдоль всех размерностей на любых уровнях иерархии.
Полуаддитивные факты
Полуаддитивный факт это факт, который можно сум мировать вдоль определённых размерностей, и нельзя вдоль других. Примером может служить остаток на счете (или остаток товара на складе). Данную величину нельзя суммировать вдоль размерности ВРЕМЯ. Однако сумма остатков по счетам вдоль размерности смысл для анализа.
Неаддитивные факты
Неаддитивные факты вообще нельзя суммировать. Пример неаддитивного факта отношение (например, выраженное в процентах).
Специалисты рекомендуют моделировать полуаддитивные факты таким образом, чтобы сделать их более аддитивными. Например, представить процент составляющими его величинами [1].
Таблицы покрытия
Таблицы покрытия используются с целью моделиро вания сочетания размерностей, для которых отсутству ют факты. Например, нужно найти количество категорий продуктов, которые сегодня ни разу не продавались. Таб лица фактов продаж не может ответить на данный воп рос, поскольку она регистрирует только факты продаж. Для того чтобы модель позволяла отвечать на подобные вопросы, нужна дополнительная таблица фактов (кото рая, по сути дела, не содержит фактов), которая и назы вается таблицей покрытия.
Схема "снежинка"
Данная схема (рис.9) используется для нормализации схемы "звезда". Она несколько сокращает избыточность в таблицах размерностей. Одним из достоинств является бо лее быстрое выполнение запросов о структуре размерностей (запросы вида "выбрать все строки из таблицы размерности на определенном уровне"), которые очень часто выполняют ся при анализе данных, и могут задерживать ход анализа.
Однако основным достоинством схемы "снежинка" является не экономия дискового пространства, а возможность иметь таблицы фактов с разным уровнем детализации. Например, фактические данные на уровне дня, а плановые на уровне месяца.
Моделирование времени в витринах данных
Витрины данных, как правило, характеризуются нали чием явной размерности ВРЕМЯ. При этом структура данной размерности может меняться в зависимости от моделируемой предметной области и требований, предъявляемых пользователями к представлению времени.
Помимо стандартных атрибутов времени, как правило, возникает необходимость моделирования специальных атрибутов времени, таких как:
- Недели
- Времена года
- Сезоны
- Выходные и праздники
- Рабочие смены
Моделирование времени в витринах данных достаточно сложный момент, освещение которого заслуживает отдельной статьи, мы же перейдем к выбору инструментов для моделирования.
Критерии, определяющие выбор инструментов для моделирования
Для создания и поддержки успешных моделей хранилищ и витрин данных необходимы соответствующие средства моделирования. В настоящее время на рынке присутствует достаточно большое количество поставщиков программных продуктов данного класса.
При выборе инструмента для проекта необходимо при нимать в учет ряд требований, которым должны удовлетворять инструменты. Вот некоторые из этих требований:
- Поддержка традиционного ER-моделирования (для моделирования хранилищ данных) и многомерного моделирования (для моделирования витрин данных)
- Открытый репозиторий метаданных (возможность обмена данными с приложениями класса ETL, OLAP/Reporting, репозиториями метаданных, инструментами контроля качества данных)
- Поддержка коллективной разработки (контроль версий, checkin, checkout)
- Поддержка свойств, определяемых пользователем (UDP) - для расширения круга метаданных, поддерживаемых моделью
- Поддержка возможности проверки качества моделей (стандарты именования объектов, полнота описания объектов)
- Поддержка повторного использования компонентов моделей
- Поддержка обратного проектирования (reverse engineering)
- Многоплатформенность (поддержка промышленных СУБД)
Проектирование хранилищ и витрин данных инте ресный и достаточно трудоемкий процесс, требующий использования приемов и методик, отличных от техноло гических принципов, применяемых при проектировании оперативных информационных систем. Данная тема будет продолжена в последующи