Управления реляционными базами данных и анализа данных
Вид материала | Руководство |
- Программа дисциплины Системы управления базами данных Семестры, 22.73kb.
- Проектирование базы данных, 642.58kb.
- «Прикладная информатика (по областям)», 1362.72kb.
- Тема Базы данных. Системы управления базами даннях (12 часов), 116.1kb.
- Реляционная модель данных в системах управления базами данных, 200.05kb.
- Системы управления базами данных, 313.7kb.
- Системы управления базами данных (субд). Назначение и основные функции, 30.4kb.
- 1. 2 Системы управления базами данных. Основные функции, 630.95kb.
- Развитие объектно-ориентированных систем управления базами данных, 122.52kb.
- Любая программа для обработки данных должна выполнять три основных функции: ввод новых, 298.05kb.
Обеспечение масштабируемости и надежности решений для хранилищ данных
Хранилища данных и средства их анализа выдвигают собственный перечень проблем, связанных с масштабируемостью и быстродействием. Требования к хранению многомерных данных и обеспечению доступа к ним растут очень быстро и возможности проведения сложного анализа данных и обработки больших массивов не всегда поспевают за ними. SQL Server 2000 обладает рядом новых средств, позволяющих выполнить анализ в таких условиях.
Индексированные представления
Сложные сценарии по созданию отчетов, которые часто встречаются в приложениях хранилищ данных, при выполнении запросов предъявляют повышенные требования к серверу базы данных. При обращении этих запросов к представлениям быстродействие может снижаться, поскольку база данных вынуждена динамически совмещать логические операции по выполнению запросов с логическими операциями по созданию самих представлений. Издержки от этого могут быть весьма значительны, особенно для представлений, включающих сложную обработку большого числа строк (например, агрегирование большого объема данных или объединение данных нескольких таблиц). Поскольку результирующий набор не хранится постоянно в базе данных (для стандартного представления), последующий доступ к этому представлению, скорее всего, потребует дополнительных затрат на построение результирующего набора данных при каждом новом выполнении запроса.
SQL Server 2000 обеспечивает значительное повышение быстродействия запросов, обращающихся к таким представлениям, благодаря созданию уникальных кластерных индексов этих представлений. Если создается такой индекс, то после построения представления его результирующий набор хранится в базе данных так же, как и таблица с кластерным индексом. Этот метод позволяет эффективно хранить («материализовать») результаты выполнения запроса в базе данных. Оптимизатор запросов сервера SQL Server будет использовать индекс представления в запросах, в которых название этого представления явно не задано в предложении FROM. Повышение эффективности извлечения данных из индексированного представления проявляется и в уже существующих запросах, без необходимости их изменения. При работе с определенными типами представлений этот метод может значительно повысить быстродействие.
С точки зрения простоты использования, реализация индексированных представлений в SQL Server 2000 не имеет аналогов в отрасли. Выпускаемые конкурентами продукты, которые имеют встроенные индексированные или «материализованные» представления, для обращения к ним требуют создания специальных запросов. Поэтому уже существующие запросы необходимо обновлять, добавляя к ним подсказки, заставляющие обработчик запросов распознавать эти индексированные или «материализованные» представления. Как уже было упомянуто, реализация индексированных представлений в сервере SQL Server 2000 не требует переписывания запросов, поскольку обработчик запросов SQL Server в подходящих ситуациях автоматически распознает и использует индексированные представления без вмешательства администратора базы данных.
Распределенные разделенные кубы данных
В решениях для создания хранилищ данных сервер SQL Server 2000 дополняет методы распределения вычислительной нагрузки технологией распределенных разделенных кубов данных (Distributed Partitioned Cubes). Чтобы добиться гибкости при хранении данных и повысить быстродействие системы, разработчики, используя мастер создания разделов, могут легко распределить один логический куб данных по отдельным физическим разделам на нескольких серверах, поддерживая прозрачность данных.
Р
ис. 4. Настройку распределенных разделенных кубов данных легко выполнить с помощью нового мастера создания разделов
Анализ крупных массивов данных
Службы анализа сервера SQL Server 2000 благодаря возможности использовать до 64 ГБ оперативной памяти поддерживают работу с измерениями MOLAP (Multidimensional OLAP), имеющими десятки миллионов компонентов. С помощью измерений ROLAP (Relational OLAP), хранимых в реляционных таблицах, службы анализа могут поддерживать работу с измерениями, содержащими сотни миллионов компонентов. При использовании режима хранения ROLAP результаты агрегирования хранятся в реляционных таблицах, не имеющих ограничений размера, присущих MOLAP. В некоторых случаях, когда исходные данные разделов хранятся на сервере SQL Server 2000 и выполняются определенные условия, вместо таблиц создаются индексированные представления. Для удобства разделения логического куба данных на отдельные физический разделы, прямо из диспетчера Analysis Manager можно вызвать мастер создания разделов.
В отличие от режима хранения MOLAP режим ROLAP не предполагает хранения копии исходных данных. Если результаты не могут быть извлечены из агрегированных данных или кеша клиента, осуществляется доступ к таблице фактов раздела. При использовании режима хранения ROLAP реакция на запросы обычно медленнее, чем при работе с двумя другими режимами, MOLAP и HOLAP (Hybrid OLAP). Поэтому приложения ROLAP, как правило, содержат большие массивы данных, к которым редко выполняются запросы (например, фактические данные за прошедшее время), или массивы данных, которые слишком велики, чтобы хранится в режимах MOLAP или HOLAP.
Увеличение времени безотказной работы и повышение надежности
Хотя масштабируемость и является важным фактором, вычислительные ресурсы и быстродействие сервера оказываются бесполезны, если установленная на нем база данных не работает. Поэтому особое значение приобретает увеличение продолжительности безотказной работы сервера. Для этого в SQL Server 2000 расширено число операций, которые можно выполнять без перехода в автономный режим, что позволяет постоянно поддерживать сервер в рабочем состоянии. Кроме того, новые возможности архивации обеспечивают ее выполнение без заметного влияния на быстродействие или доступность сервера.
Увеличение числа операций, выполняемых без перехода в автономный режим
В базах данных, где выполняется большой объем транзакций или регулярно происходят обновления, опасение вызвать перебои в работе из-за реорганизаций индекса часто заставляет системных администраторов выполнять эти операции в моменты минимальной загруженности системы. В сервере SQL Server 2000 реорганизация индекса может выполняться без перехода в автономный режим с незначительным влиянием на быстродействие системы даже при работе приложений OLTP, предъявляющих высокие требования к ресурсам. Кроме того, такая реорганизация индекса использует мало места для хранения данных, полностью протоколируется в журнале (обеспечивая возможность восстановления) и всегда может быть остановлена и запущена заново.
Разностная архивация базы данных
В сервере SQL Server 2000 предусмотрена возможность разностной архивации базы данных. При ее выполнении копируются те страницы базы данных, которые были изменены со времени последней архивации. Используя этот метод, можно относительно быстро выполнять архивацию, а резервные копии получаются меньшими по размеру, чем при других видах архивации. Помимо этого, разностные архивации могут выполняться непосредственно во время доступа пользователей к базе данных. Благодаря быстрому выполнению и малому влиянию на работу сервера разностные архивации могут выполняться чаще, чем при использовании других видов архивации баз данных, таким образом снижается риск потери информации.
Архивация Server-less с созданием «мгновенных снимков»
Еще одной новой возможностью сервера SQL Server 2000, которая приводит к увеличению продолжительности его безотказной работы, одновременно снижая влияние архивации на использование ресурсов, является архивация Server-less с созданием «мгновенных снимков». Этот метод архивации функционально эквивалентен полной архивации БД, файла или группы файлов, но может выполняться без снижения быстродействия сервера (отсюда и название: Server-less буквально означает «без сервера»).
Для архивации Server-less с созданием «мгновенных снимков» необходимо наличие приложения VDI (Virtual Device Interface – интерфейс виртуального устройства), выпускаемого независимыми производителями. У этого приложения должна быть возможность напрямую связываться с усовершенствованной корпоративной системой хранения данных, поддерживающей операции зеркалирования и копирования при записи. Типичный случай применения архивации Server less с созданием «мгновенных снимков» – это выполнение трехстороннего зеркалирования. Выполняющее архивацию приложение VDI может «выхватить» одну из зеркальных копий БД (две другие копии в этот момент продолжают поддерживать работу пользователей) и либо выполнить ее архивацию на магнитную ленту, либо сделать ее доступной другой системе. В последнем случае эта копия мгновенно превращается в доступную для работы резервную базу данных. Восстановление архивной копии, полученной методом Server-less с созданием «мгновенных снимков», может быть сделано очень быстро, если выполняется без перехода в автономный режим с зеркальной копии, размещенной на диске. Разумеется, восстановление с копии на магнитной ленте занимает больше времени.
Архивация Server-less с созданием «мгновенных снимков» обеспечивает использующим ее организациям весьма широкие возможности. Помимо того, что эту технологию можно использовать для подготовки серверов «горячего» резерва, с ее помощью также удобно создавать отчеты и тестовые базы данных, практически не оказывая влияния на промышленно эксплуатируемые серверы. SQL Server ведет в MSDB хронологию архивации Server-less с созданием «мгновенных снимков», и это позволяет выполнять их восстановление до текущего состояния базы данных с помощью обычных разностных архивных копий и архивных журналов.