Привод ленточного конвеера

Курсовой проект - Разное

Другие курсовые по предмету Разное

 

  • "Сырые" данные собираются из неинтегрированных оперативных и унаследованных приложений, очищаются от ошибок, затем агрегируются и представляются в виде, понятном бизнес-пользователям.
  • На основании откликов пользователей, а также закономерностей, обнаруженных с помощью хранилища данных, архитектура последнего со временем претерпевает изменения - то есть процесс создания хранилища является итеративным.

Построение хранилищ данных - процесс сложный по самой своей природе и поэтому обычно дорогостоящий и длительный. В последние несколько лет Microsoft совместно с другими компаниями отрасли работала над созданием платформы построения хранилищ данных, включающей в себя как компонентные технологии, так и передовые продукты и способной снизить затраты и повысить эффективность создания, администрирования и эксплуатации хранилищ данных. Microsoft также занималась разработкой инструментов и продуктов - таких как версия 7.0 СУБД Microsoft SQL Server™ - хорошо приспособленных к использованию в процессе создания хранилищ данных. Эти средства в сочетании с продуктами сторонних фирм, интегрируемыми на базе инфраструктуры Microsoft Data Warehousing Framework, предоставляют клиентам широкий выбор способных

 

 

 

 

 

 

 

 

 

к совместному функционированию первоклассных продуктов, которые могут удовлетворить любые их потребности в построении хранилищ данных.

Microsoft SQL Server 7.0 предлагает широчайший набор функций, предназначенных для поддержки процессов создания хранилищ данных. Сочетая возможности этой СУБД с архитектурой Data Warehousing Framework, Microsoft предоставляет платформу, повышающую эффективность и снижающую стоимость и сложность проектов построения хранилищ данных.

Поскольку процесс создания хранилищ данных является итеративным по своей природе, он требует регулярного перепроектирования в течение всего жизненного цикла приложения.

Процесс создания хранилищ данных

С точки зрения информационных технологий построение хранилищ данных имеет целью обеспечить своевременное предоставление нужной информации именно тем сотрудникам организации, кому это необходимо. Этот вопрос невозможно решить один раз и навсегда, к нему нужно возвращаться постоянно, поэтому здесь требуется подход, отличный от применяемого при проектировании транзакционных систем.

Хранилище данных - это собрание данных, предназначенное для поддержки принятия управленческих решений и отличающееся предметной ориентированностью, интегрированностью , поддержкой хронологии и неизменяемостью. Проще говоря, это означает, что хранилище данных ориентировано на бизнес-понятия (например, продажи), а не на бизнес-процессы (например, выписку счетов), и содержит всю существенную информацию, относящуюся к этим понятиям, которая собрана из различных обрабатывающих систем. Эта информация собирается и представляется за согласованные периоды времени и не подвержена оперативным изменениям.

Хранилище данных интегрирует оперативные данные с помощью согласованных правил именования, измерений, физических атрибутов и семантики. Первым шагом в построении хранилища данных является организационный процесс, состоящий в выявлении предметных областей, которые необходимо отразить в хранилище, и в выработке некоторого набора согласованных определений. На этом этапе необходимо тесное общение с конечными пользователями, бизнес-аналитиками и руководством, целью которого является четкое понимание и документирование круга их информационных потребностей. Только после того как такое понимание будет достигнуто, возможен переход от логического к физическому проектированию хранилища данных.

Вслед за проектированием физической структуры хранилища необходимо запустить в работу системы, обеспечивающие его регулярное пополнение данными из оперативных систем. Поскольку представление данных в оперативных системах и в хранилище различается, пополнение хранилища данных требует преобразования информации: агрегирования, трансляции, декодирования, отбраковки ошибочных данных и т.д. Такие процессы необходимо автоматизировать, чтобы они могли запускаться регулярно, выполняя извлечение, преобразование и транспортировку исходных данных настолько часто, насколько это необходимо для удовлетворения бизнес-требований, предъявляемых к хранилищу данных.

В оперативных системах данные являются достоверными и точными на текущий момент времени - тот, когда происходит обращение к ним. Например, приложение ввода заказов всегда показывает текущее количество имеющихся на складе продуктов по каждому их наименованию. Результаты выполнения двух последовательных запросов о количестве единиц данного продукта могут оказаться различными, даже если между запросами прошло совсем немного времени. Напротив, данные в хранилище представляют информацию за длительный период времени и ожидается, что они будут точными для каждого конкретного момента. Фактически хранилище содержит длинные последовательности "мгновенных снимков" текущего состояния ключевых предметных областей бизнеса.

В итоге бизнес-аналитики и руководство получают возможность обращаться к информации для просмотра, анализа и построения отчетов. На этапе анализа можно применять различные инструменты, от простейших генераторов отчетов до высокоразвитых средств интеллектуального анализа данных (иначе "добычи данных", data mining). Результ