Принципы построения и проектирования базы данных
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
ут, связь;
каждый компонент информации должен моделироваться только одним из приведенных выше конструктивных элементов для исключения избыточности и противоречивости описания.
Моделирование предметной области начинают с выбора сущностей, необходимых для ее описания. Каждая сущность должна соответствовать некоторому объекту (или группе объектов) предметной области, о котором в системе будет накапливаться информация. Существует проблема выбора конструктивного элемента для моделирования той или иной порции информации, что существенно затрудняет процесс построения модели. Так, информация о том, что некоторый студент входит в состав учебной группы, можно в модели представить:
как связь: входит в состав для сущностей студент и учебная группа;
как атрибут: имеет в составе студента сущности учебная группа;
как сущность: состав учебной группы.
В этих случаях приходится рассматривать несколько вариантов и с учетом информационных потребностей пользователей разбивать предметную область на такие фрагменты, которые, с их точки зрения, представляют самостоятельный интерес.
При моделировании предметной области следует обращать внимание на существующий в ней документооборот. Именно документы, циркулирующие в предметной области, должны являться основой для формулирования сущностей. Это связано с двумя обстоятельствами. Во-первых, эти документы, как правило, достаточно полно отражают информацию, которую необходимо хранить в БД, причем в виде конкретных данных. Во-вторых, создаваемая ИС должна предоставлять пользователям привычную для них информацию в привычном виде, что в последующем существенно облегчит ввод БД в эксплуатацию.
При описании атрибутов сущности необходимо выбрать ряд атрибутов, позволяющих однозначно идентифицировать экземпляр сущности. Совокупность идентифицирующих атрибутов называют ключом.
Помимо идентифицирующих используются и описательные атрибуты, предназначенные для более полного определения сущностей. Число атрибутов (их тип) определяется единственным образом - на основе анализа возможных запросов пользователей. Существует ряд рекомендаций по работе с атрибутами, например, по исключению повторяющихся групп атрибутов (рис. 2.5). Все они направлены на улучшение качества инфологической модели.
Рис. 2.5. Исключение повторяющейся группы атрибутов
При определении связей между сущностями следует избегать связей типа М : N, так как они приводят к существенным затратам ресурсов ЭВМ. Устранение таких связей предусматривает введение других (дополнительных) элементов - сущностей и связей. На рис. 2.6 приведен пример исключения связи многие ко многим.
Рис. 2.6. Исключение связи типа М : N
Типовая последовательность работ (действий) по построению инфологической модели:
выделение в предметной области сущностей;
введение множества атрибутов для каждой сущности и выделение из них ключевых;
исключение множества повторяющихся атрибутов (при необходимости);
формирование связей между сущностями;
исключение связей типа М: N (при необходимости);
преобразование связей в однонаправленные (по возможности).
Помимо модели П.Чена, существуют и другие инфологические модели. Все они представляют собой описательные (неформальные) модели, использующие различные конструктивные элементы и соглашения по их использованию для представления в БД информации о предметной области. Иными словами, первый этап построения БД всегда связан с моделированием предметной области.
. Концептуальные модели данных
В отличие от инфологической модели предметной области, описывающей по некоторым правилам сведения об объектах материального мира и связи между ними, которые следует иметь в БД, концептуальная модель описывает хранимые в ЭВМ данные и связи. В силу этого каждая модель данных неразрывно связана с языком описания данных конкретной СУБД.
По существу, модель данных - это совокупность трех составляющих: типов структур данных, операций над данными, ограничений целостности.
Используя в качестве классификационного признака особенности логической организации данных, можно привести следующий перечень известных моделей:
иерархическая модель данных;
сетевая модель данных;
реляционная модель данных;
бинарная модель данных;
семантическая сеть.
Рассмотрим основные особенности перечисленных моделей.
Иерархическая модель данных. Наиболее давно используемой (можно сказать классической) является модель данных, в основе которой лежит иерархическая структура типа дерева. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.
Узел - это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа.
Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в БД определяется числом корневых записей. К каждой записи БД существует только один (иерархический) путь от корневой записи. Каждому узлу структуры соответствует один сегме