Привод ленточного конвеера

Курсовой проект - Разное

Другие курсовые по предмету Разное

выми. При этом старые данные теряются.

  • Создание новой записи в таблице размерности с новыми данными и временем изменения. В этом случае сохраняются старые данные и можно проследить историю изменения редактируемых данных, но необходимо генерировать ключ для ссылки на старые данные.
  • Запись новых данных в дополнительном поле той же самой записи. В этом случае сохраняется первоначальное и последнее новое значение. Все промежуточные данные теряются.
  • Правила хранения данных (Data Warehouse Rules). Для каждой таблицы можно задать шесть типов правил манипулирования данными: обновление (Refresh), дополнение (Append), резервное копирование (Backup), восстановление (Recovery), архивирование (Archiving) и очистка (Purge). Для задания правила следует выбрать имя правила из соответствующего списка выбора. Каждое правило должно быть предварительно описано в диалоге Data Warehouse Rule Editor (меню Edit / Data Warehouse Rule). Для каждого правила должно быть задано имя, тип, определение. Например, определение правила дополнения данных может включать частоту и время дополнения (ежедневно, в конце рабочего дня), продолжительность операции и т.д. Связать правила с определенной таблицей можно с помощью диалога Table Editor.

    Создание спецификаций для источников данных

    При проектировании хранилища данных важно определить источник данных (для каждой колонки), метод, которым исходные данные извлекаются, преобразовываются и фильтруются прежде, чем они импортируются в хранилище данных. Хранилище данных может объединять информацию из текстовых файлов и многих баз данных, как реляционных (в том числе других БД на платформе Informix), так и нереляционных в единую систему поддержки принятия решений. Чтобы поддерживать регулярные обновления и проверки качества данных, необходимо знать источник для каждой колонки в хранилище данных. Для документирования информации об источниках данных используется редактор Data Warehouse Source Editor(рис.6.)

    Рис.6. Диалог Data Warehouse Source Editor.

    Источник данных может быть описан вручную в диалоге Data Warehouse Source Editor, либо импортирован. В качестве источника при импорте могут быть использованы другие модели Erwin, хранящиеся в файле, SQL скрипты, модели, хранящиеся в репозитории ModelMart, либо системные каталоги СУБД, на основе которых в результате обратного проектирования могут быть созданы модели Erwin (рис.7).

    Каждому источнику может быть задано имя и определение.

    В редакторе Column Editor можно внести информацию об использовании источников данных для каждой колонки таблиц хранилища данных, а так же дополнительную информацию о способах, режимах и периодичности переноса данных из источника в хранилище данных (рис.8).

    Рис.8. Описание источника данных для колонки хранилища в диалоге Column Editor.

    Поддержка специализированных СУБД

    Хотя хранилище данных можно создать, используя любую СУБД, существуют специализированные СУБД, позволяющие значительно увеличить производительность обработки данных при использовании схемы “звезда”. Erwin поддерживает на физическом уровне две такие СУБД - Red Brick и Teradata. При прямом и обратном проектировании поддерживаются специфические свойства как Red Brick, так и Teradata.

    Для Red Brick поддерживаются специфические свойства индексов:

    • уникальность (unique);
    • распределение по сегментам;
    • FILLFACTOR;
    • определение типа индекса BTREE (только для версии Red Brick 5.0 и выше), STAR или TARGET (только для версии Red Brick 4.0 и выше) с указанием размера домена;

    Редактор Red Brick Physical Object Editor (меню Server / Red Brick Physical Object) позволяет создавать сегменты (Segment) Red Brick и изменять их свойства:

    • имя сегмента;
    • имя файла сегмента, его максимальный размер, начальный размер (больше 16 KB) и размер расширения.

    Для каждой таблицы Red Brick можно указать сегменты для хранения данных и индекса первичного ключа, максимальное количество сегментов (для версии 5) и максимальное количество строк в сегменте (для Red Brick версии 5).

    Для Teradata Erwin также поддерживает специфические объекты физической памяти. В диалоге Teradata Physical Object Editor Editor (меню Server / Teradata Physical Object) можно создать базы данных Teradata и определить их свойства:

    • имя владельца базы данных;
    • резервированный размер базы данных;
    • возможность создания дубликатов таблиц для аварийного восстановления;
    • размер spool-файлов;
    • место для создания журнала (базы данных и таблицы) и его свойства;
    • описание базы данных.

    В закладке Physical Props диалога Teradata Table Editor можно определить параметры аудирования и восстановления после сбоя:

    • имя таблицы, которая используется для ведения журнала;
    • опция FALLBACK PROTECTION создание одновременно основной и резервной копии таблицы;
    • размер пространства, резервируемый для редактируемых данных;
    • размер блоков данных.

    Закладка Teradata MACRO диалога Teradata Table Editor позволяет создать шаблоны для хранимых процедур Teradata.

    Архитектурные решения и моделирование данных для хранилищ и витрин данных

    Константин Лисянский, архитектор хранилищ данных линии программных продуктов DiasoftMIS

    Хранилища данных уже не являются экзотикой в России. Стабилизация экономики ведет к росту конкуренции и повышению важности принятия правильных решений для успешной работы предприятий. Многие компании проводят оценку возможности построения централизованного хранилища данных для создания аналитических приложений, некоторые уже инициировали такие проекты. В силу того, что технологии ?/p>