Принципы построения и проектирования базы данных

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование

ут, связь;

каждый компонент информации должен моделироваться только одним из приведенных выше конструктивных элементов для исключения избыточности и противоречивости описания.

Моделирование предметной области начинают с выбора сущностей, необходимых для ее описания. Каждая сущность должна соответствовать некоторому объекту (или группе объектов) предметной области, о котором в системе будет накапливаться информация. Существует проблема выбора конструктивного элемента для моделирования той или иной порции информации, что существенно затрудняет процесс построения модели. Так, информация о том, что некоторый студент входит в состав учебной группы, можно в модели представить:

как связь: входит в состав для сущностей студент и учебная группа;

как атрибут: имеет в составе студента сущности учебная группа;

как сущность: состав учебной группы.

В этих случаях приходится рассматривать несколько вариантов и с учетом информационных потребностей пользователей разбивать предметную область на такие фрагменты, которые, с их точки зрения, представляют самостоятельный интерес.

При моделировании предметной области следует обращать внимание на существующий в ней документооборот. Именно документы, циркулирующие в предметной области, должны являться основой для формулирования сущностей. Это связано с двумя обстоятельствами. Во-первых, эти документы, как правило, достаточно полно отражают информацию, которую необходимо хранить в БД, причем в виде конкретных данных. Во-вторых, создаваемая ИС должна предоставлять пользователям привычную для них информацию в привычном виде, что в последующем существенно облегчит ввод БД в эксплуатацию.

При описании атрибутов сущности необходимо выбрать ряд атрибутов, позволяющих однозначно идентифицировать экземпляр сущности. Совокупность идентифицирующих атрибутов называют ключом.

Помимо идентифицирующих используются и описательные атрибуты, предназначенные для более полного определения сущностей. Число атрибутов (их тип) определяется единственным образом - на основе анализа возможных запросов пользователей. Существует ряд рекомендаций по работе с атрибутами, например, по исключению повторяющихся групп атрибутов (рис. 2.5). Все они направлены на улучшение качества инфологической модели.

Рис. 2.5. Исключение повторяющейся группы атрибутов

При определении связей между сущностями следует избегать связей типа М : N, так как они приводят к существенным затратам ресурсов ЭВМ. Устранение таких связей предусматривает введение других (дополнительных) элементов - сущностей и связей. На рис. 2.6 приведен пример исключения связи многие ко многим.

Рис. 2.6. Исключение связи типа М : N

Типовая последовательность работ (действий) по построению инфологической модели:

выделение в предметной области сущностей;

введение множества атрибутов для каждой сущности и выделение из них ключевых;

исключение множества повторяющихся атрибутов (при необходимости);

формирование связей между сущностями;

исключение связей типа М: N (при необходимости);

преобразование связей в однонаправленные (по возможности).

Помимо модели П.Чена, существуют и другие инфологические модели. Все они представляют собой описательные (неформальные) модели, использующие различные конструктивные элементы и соглашения по их использованию для представления в БД информации о предметной области. Иными словами, первый этап построения БД всегда связан с моделированием предметной области.

. Концептуальные модели данных

В отличие от инфологической модели предметной области, описывающей по некоторым правилам сведения об объектах материального мира и связи между ними, которые следует иметь в БД, концептуальная модель описывает хранимые в ЭВМ данные и связи. В силу этого каждая модель данных неразрывно связана с языком описания данных конкретной СУБД.

По существу, модель данных - это совокупность трех составляющих: типов структур данных, операций над данными, ограничений целостности.

Используя в качестве классификационного признака особенности логической организации данных, можно привести следующий перечень известных моделей:

иерархическая модель данных;

сетевая модель данных;

реляционная модель данных;

бинарная модель данных;

семантическая сеть.

Рассмотрим основные особенности перечисленных моделей.

Иерархическая модель данных. Наиболее давно используемой (можно сказать классической) является модель данных, в основе которой лежит иерархическая структура типа дерева. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.

Узел - это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа.

Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в БД определяется числом корневых записей. К каждой записи БД существует только один (иерархический) путь от корневой записи. Каждому узлу структуры соответствует один сегме