Привод ленточного конвеера

Курсовой проект - Разное

Другие курсовые по предмету Разное

атом выхода на этап анализа, однако, является вовсе не завершение работы, а запуск очередной итерации в процессе развития хранилища данных - пересмотра его проекта с целью расширения круга обрабатываемой информации, повышения производительности системы и включения новых аналитических задач. С этими модификациями процесс запускается сначала - и так в течение всего жизненного цикла хранилища данных.

Чтобы облегчить работу групп информационных технологий по постоянной поддержке и развитию хранилищ данных, было предложено множество методологий их проектирования. Разнообразие решений, в свою очередь, породило бурные дискуссии относительно того, какая из архитектур разработки корпоративных хранилищ данных является наилучшей.

Архитектуры хранилищ данных

Несмотря на все разнообразие подходов к практической реализации систем поддержки принятия решений, основных видов хранилищ данных всего два: общекорпоративные хранилища данных (enterprise data warehouse) и киоски (или витрины) данных (data mart). Оба типа хранилищ имеют своих сторонников, а также свои сильные и слабые стороны.

Корпоративное хранилище данных содержит информацию о всех сторонах деятельности организации, интегрированную из множества оперативных источников данных и предназначенную для решения на ее базе задач консолидированного анализа данных. Обычно оно формируется на основании данных, касающихся нескольких различных аспектов - например, клиентов, продуктов и продаж - и служит для поддержки принятия как тактических, так и стратегических решений. Корпоративное хранилище содержит наряду с детализированными данными, относящимися к каждому моменту времени, также и агрегированную информацию, а общий объем его данных варьируется от 50 Гбайт до более чем 1 Тбайт. Корпоративные хранилища данных могут потребовать больших затрат денег и времени на разработку и администрирование. Обычно их реализацией занимаются централизованные ИТ-организации, применяя методологию нисходящего проектирования.

Киоски данных содержат некоторое подмножество всех данных корпорации, которое создается для использования его отдельными подразделениями или отделами организации. В отличие от корпоративных хранилищ, киоски данных часто строятся снизу вверх на основе информационных ресурсов подразделения, используемых конкретным приложением поддержки принятия решений или группой пользователей. Киоски данных содержат агрегированные, а также часто и детализированные, данные о предметной области. Хранимая в киоске данных информация может быть подмножеством корпоративного хранилища (такой киоск называется зависимым), или же, что встречается чаще, она поступает непосредственно из оперативных источников данных (независимый киоск данных).

Независимо от используемой архитектуры хранилища и киоски данных создаются и поддерживаются в рамках описанного выше итеративного процесса.

Компоненты, используемые при построении хранилищ данных

Хранилище данных состоит из множества компонентов, среди которых могут быть следующие:

  • Оперативные источники данных.
  • Инструменты проектирования и разработки.
  • Инструменты извлечения и преобразования данных.
  • Система управления базами данных.
  • Инструменты доступа к данным и анализа.
  • Инструменты системного администрирования.

Microsoft вполне допускает, что некоторые из перечисленных компонентов в реализации у конкретного клиента могут не быть продуктами Microsoft. На практике в большинстве случаев хранилища данных строятся именно так - с использованием самых разнообразных инструментов различных производителей, да еще в сочетании со специализированным программированием для некоторых задач.

Несколько лет назад Microsoft пришла к выводу о существовании насущной потребности в наборе интегрирующих технологий, которые бы обеспечивали легкость совместной работы продуктов разных производителей. Такое понимание привело к созданию концепции Microsoft Data Warehousing Framework (инфраструктура построения хранилищ данных Microsoft), представляющей собой план развития не только будущих продуктов Microsoft, таких как SQL Server 7.0, но и технологий, необходимых для интеграции продуктов множества сторонних производителей, включая как деловых партнеров Microsoft, так и ее конкурентов.

Инфраструктура Microsoft Data Warehousing Framework

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Целью создания Data Warehouse Framework является упрощение проектирования, реализации и администрирования решений в области хранилищ данных за счет обеспечения таких возможностей как:

  • Открытая архитектура, легко интегрируемая с продуктами сторонних поставщиков и расширяемая ими.
  • Службы импорта, экспорта, контроля корректности и очистки гетерогенных данных с возможностью фиксирования их происхождения.
  • Интегрированные метаданные, предназначенные для проектирования хранилища, извлечения и преобразования данных, администрирования серверов и аналитических инструментов конечных пользователей.
  • Базовые административные службы для планирования графиков работ, управления памятью, мониторинга производительности, использования механизмов предупреждений, событий и уведомления.

Архитектура Microsoft Data Warehousing Framework представляет собой план разработки и интеграции продуктов, базирующихся на платформе Microsoft

Microsoft Data Warehousing