Сервисные функции программы рпт 76 2 Руководство пользователя 79 1Запуск программы 79

Вид материалаРуководство пользователя

Содержание


1.2 Информационные, реляционные модели баз данных
1.3 Нормализация баз данных
Подобный материал:
1   2   3   4   5   6   7   8

1.2 Информационные, реляционные модели баз данных


Типы информационных моделей

Решать любую задачу, в том числе и информационную, можно различными способами. Для оценки вариантов проектируемых баз данных разрабатывают информационные модели. Разработка ин­формационных моделей пока не имеет четких формализованных правил, поэтому эта задача, также как и процесс традиционного программирования, является «искусством» и зависит от квалифи­кации разработчиков. Тем не менее существуют основные прин­ципы создания информационных моделей для оценки оптималь­ности проектируемых баз данных.

Информационная модель данных предусматривает три уровня описания системы: концептуальный, логический, физический, а соответственно — три типа информационных моделей.

Концептуальные модели данных

Концептуальный уровень описания базы данных (концептуальная модель) представляет собой информационные объекты и их взаимосвязи без указания способов описания и хранения данных.

В данном определении информационными объектами будем называть классы объектов, сведения о которых хранятся в таблицах базы данных. Как правило, в таблице базы данных содержатся сведения об объектах одного класса.

Классом называют множество объектов, характеризующихся одинаковым набором признаков.

Данные об информационных объектах одного класса могут на­ходиться в одной или нескольких таблицах.

Данные об информационных объектах разных классов должны находиться в разных таблицах.

Конечной задачей разработки концептуальной модели является установление оптимального состава таблиц базы данных.

Изложенные в предыдущих подразделах методы формирования состава таблиц базы данных на основе принципов нормализации в конечном итоге определяют концептуальную модель базы данных.

Логические модели данных

Логический уровень описания базы данных (логическая модель) отражает логические связи между таблицами.

Физические модели данных

Физический уровень описания реляционной базы данных (фи­зические модели) характеризуют способы обработки и хранения информации. В теории и практике разработки баз данных и систем управления базами данных разделяют два подхода к построению физических моделей данных.

Первый подход не связан с конкретной СУБД и предполагает описание физических свойств данных каждой таблицы — физиче­ские модели таблиц базы данных.

Второй подход к разработке физической модели связан с раз­работкой архитектуры, организации и хранения данных в конк­ретной СУБД — физические модели хранения данных.

Разработчик базы данных может не знать архитектуру приклад­ной программной системы, с помощью которой он создает свою информационную систему, но при этом он должен проработать физические модели для каждой таблицы.

Физические модели таблиц базы данных. Физическая модель таблицы базы данных предполагает описание свойств каждого поля таблицы.

Таким образом, разработка физической модели проекта табли­цы базы данных сводится к описанию характеристик каждого поля. Приведем обязательные характеристики полей таблиц базы дан­ных.

Имя поля — некоторый минимальный набор символов, пред­назначенный для поиска данных в таблице. В каждой прикладной программной системе для разработки баз данных существуют свои грамматические правила для формирования имен полей. В общем случае не допускается начинать имя поля с символа пробела, выбрать в качестве символов знаки препинания.

Подпись поля идентифицируется с названием признака объекта, значения которого будут храниться в ячейках поля. Подпись поля будет находиться в заголовке таблицы. В современных СУБД не существует каких-либо ограничений на формирование подписи поля.

Тип данных — обозначение типа данных в соответствии с конкретной программной системой.

Количество символов — предполагаемое количество символов, которые будут храниться в ячейках поля.

Точность — число знаков после запятой в числовых полях.

Ключ — указание, что данное поле является ключевым. Данный состав свойств является минимально необходимым для описания данных, хранимых в таблице.

Физические модели хранения данных. Физические модели хра­нения данных определяют методы размещения данных в памяти компьютера или на соответствующих носителях информации, а также способы хранения и доступа к этим данным. Исторически первыми системами хранения и доступа были файловые структуры и системы управления файлами (СУФ). Фактически файловые структуры хранения информации являлись и являются основой операционных систем. В системах управления базами данных ис­пользование файловых систем хранения информации оказалось не эффективным потому, что пользователю требовалась инфор­мация в виде отдельных данных, а не содержание всего файла. Поэтому в современных СУБД перешли от файловых структур к непосредственному размещению данных на внешних носителях — устройствах внешней памяти. Однако механизмы управления, при­меняемые в файловых системах, во многом перешли и в новые системы организации данных во внешней памяти, называемые чаще страничными системами хранения информации.

1.3 Нормализация баз данных


Одни и те же данные могут группироваться в таблицы (отноше­ния) различными способами. Группировка атрибутов в отношениях должна быть рациональной, т. е. минимизирующей дублирование данных и упрощающей процедуры их обработки и обновления. Уст­ранение избыточности данных является одной из важнейших задач проектирования баз данных и обеспечивается нормализацией.

Нормализация таблиц (отношений) — это формальный аппа­рат ограничений на формирование таблиц (отношений), который позволяет устранить дублирование, обеспечивает непротиворечи­вость хранимых в базе данных, уменьшает трудозатраты на веде­ние (ввод, корректировку) базы данных. Процесс нормализации заключается в разложении (декомпозиции) исходных отношений БД на более простые отношения. Каждая ступень этого процесса приводит схему отношений в последовательные нормальные фор­мы. Для каждой ступени нормализации имеются наборы ограни­чений, которым должны удовлетворять отношения БД. Нормали­зация позволяет удалить из таблиц базы избыточную неключевую информацию.

Процесс нормализации основан на понятии функциональной зависимости атрибутов: атрибут А зависит от атрибута В (В -» А), если в любой момент времени каждому значению атрибута В соот­ветствует не более одного значения атрибута А.

Зависимость, при которой каждый неключевой атрибут зависит от всего составного ключа и не зависит от его частей, называется полной функциональной зависимостью. Если атрибут А зависит от ат­рибута В, а атрибут В зависит от атрибута С (С -> В -> А), но обрат­ная зависимость отсутствует, то зависимость С от А называется транзитивной.

Общее понятие нормализации подразделяется на несколько «нормальных форм».

Информационный объект (или сущность) находится в первой нормальной форме (1НФ), когда все его атрибуты имеют единствен­ное значение. Если в каком-либо атрибуте есть повторяющиеся зна­чения, объект (сущность) не находится в 1НФ, и упущен еще по крайней мере один информационный объект (еще одна сущность).

Информационный объект находится во второй нормальной фор­ме (2НФ), если он уже находится в первой нормальной форме, и ка­ждый не идентифицирующий (описательный) атрибут зависит от всего уникального идентификатора информационного объекта. Если некий атрибут не зависит полностью от уникального иденти­фикатора сущности, значит, он внесен ошибочно и должен быть удален. Нормализация в этом случае производится путем нахожде­ния существующего информационного объекта, к которому данный атрибут относится, или созданием нового информационного объек­та, в который атрибут должен быть помещен.

Информационный объект (или сущность) находится в третьей нормальной форме (ЗНФ), если он уже находится во второй нор­мальной форме и ни один описательный атрибут не зависит от ка­ких-либо других описательных атрибутов. Атрибуты, зависящие от других неидентифицирующих атрибутов, нормализуются путем пе­ремещения зависимого атрибута и атрибута, от которого он зависит, в новый информационный объект.