Тема «Семантическое моделирование»

Вид материалаЛекция

Содержание


ER-моделирование, моделирование сущностей
Четыре основных этапа семантического моделирования
Четыре основных этапа семантического моделирования
Технология построения
Технология построения
Технология построения
Технология построения
Технология построения
Обычные сущности
Технология построения
Технология построения
Технология построения
Технология построения
Логическая схема
Общий подход преобразования концептуальной схемы в логическую
Подобный материал:

Курс «Базы данных» Лекция № 11

КУРС «Базы данных»


***


Тема «Семантическое моделирование»







Схема процесса поэтапного проектирования БД










Системы баз данных обычно обладают весьма ограниченными сведениями о смысле хранящихся в них данных.

Чаще всего они позволяют лишь манипулировать данными определенных простых типов и определяют некоторые простейшие ограничения целостности, наложенные на эти данные.

Любая более сложная интерпретация возлагается на пользователя.













Например, было бы замечательно, если бы система могла определять, что вес детали и поставляемое количество являются хотя и числовыми, но все же семантически разными величинами.

Это позволило бы системе поставить под сомнение или даже вовсе отвергнуть запрос, в котором соединение информации о деталях и поставках выполняется путем сравнения веса детали с поставляемым количеством.










Домены, потенциальные и внешние ключи являются примерами семантических аспектов существующей реляционной модели, что непосредственно следует из ее определения













В качестве другого способа реализации семантики были разработаны различные "расширенные" модели данных.

Понятие семантическое моделирование является названием целой области исследований, посвященных способам представления смыслового значения.










Семантическое моделирование имеет также несколько других названий, например, ER-моделирование, моделирование сущностей и объектное моделирование.

Семантическое моделирование иногда называют также концептуальным моделированием.










Четыре основных этапа семантического моделирования

1. Выявить некоторое множество семантических концепций (понятий), которые могут быть полезны при неформальном обсуждении рассматриваемой проблемы реального мира.

■ Мир построен из сущностей.

■ Сущности могут быть классифицированы по разным типам сущностей. Все сущности определенного типа будут обладать некоторыми общими свойствами.

■ Сущность обладает неким особым свойством, предназначенным для ее идентификации, идентичностью.

■ Сущность может быть связана с другими сущностями с помощью связей.













Четыре основных этапа семантического моделирования

2. Определить набор соответствующих символических (т.е. формальных) объектов, которые могут использоваться для представления описанных выше семантических концепций.

3. Определить набор формальных общих правил целостности (метаограничений)

4. Определить набор формальных операторов, предназначенных для манипулирования этими формальными объектами.


















Некоторые полезные семантические концепции













Одним из наиболее известных и получивших широкое распространение методов семантического моделирования является метод построения модели "сущность—связь" (или ER-модели).

ER-модель включает аналоги всех семантических объектов.









. Диаграмма модели "сущность—связь"





















Технология построения ER-диаграмм

Сущность (entity) это понятие, которое может быть четко идентифицировано.

Сущности подразделяются на обычные (сильные) и слабые.

Слабой называется такая сущность, существование которой зависит от другой сущности, т.е. она не может существовать, если этой другой сущности не существует.










Технология построения ER-диаграмм

Свойства

Простое или составное свойство.

Ключевое свойство

Однозначное или многозначное свойство

Отсутствующее свойство

Базовое или производное свойство










Технология построения ER-диаграмм

Связь (relationship) определяется как ассоциация, объединяющая несколько сущностей.

Сущности, включенные в связь, называются ее участниками, а количество участников связи называется ее степенью.

Если каждый экземпляр сущности Е участвует по крайней мере в одном экземпляре связи R, то участие сущности Е в связи R называется полным, в противном случае — частичным

Связи "один к одному", "один ко многим" (иначе может называться "многие к одному") или "многие ко многим".










Технология построения ER-диаграмм

ER-диаграмма является методом представления логической структуры базы данных в графическом виде для более простого и наглядного отображения основных компонентов конкретного проекта базы данных (один рисунок порой стоит тысячи слов).










Технология построения ER-диаграмм

Сущности

Каждый тип сущности на ER-диаграмме представляется в виде отдельного прямоугольника с указанным внутри именем сущности, причем прямоугольники сущностей слабых типов обозначаются двойной линией.

Обычные сущности:

■ DEPARTMENT (Отдел);

■ EMPLOYEE (Работник);

■ SUPPLIER (Поставщик);

■ PART (Деталь);

■ PROJECT (Проект).

Слабая сущность:

■ DEPENDENT (Иждивенец).










Технология построения ER-диаграмм

Свойства отображаются на ER-диаграмме в виде эллипсов, содержащих имена этих свойств. Эллипсы соединяются с соответствующей сущностью (или связью) сплошной линией. Контур эллипса изображается штриховой или пунктирной линией, если свойство производное, и двойной линией, если свойство многозначное. Если свойство составное, то составляющие его свойства показаны в виде других эллипсов, соединенных с эллипсом составного свойства с помощью дополнительных сплошных линий. Имена ключевых свойств обычно подчеркиваются, а множества значений не отображаются совсем.











Технология построения ER-диаграмм

■ Для сущности EMPLOYEE:

ЕМР# (Табельный номер работника) — ключевое свойство;

ENAME (Полное имя) — составное, состоящее из свойств FIRST (Имя), M (Отчество) и LAST (Фамилия);

SALARY (Зарплата).

■ Для сущности SUPPLIER:

S# (Номер поставщика) — ключевое свойство;

SNAME (Имя поставщика);

STATUS (Статус поставщика);

CITY (Город, в котором находится поставщик).

■ Для связи SUPP_PART_PROJ:

QTY (Количество).

■ Для связи PART_STRUCTURE:

QTY (Количество).










Технология построения ER-диаграмм

Каждый тип связи показан на ER-диаграмме в виде ромба с именем связи внутри.

Ромб рисуется двойной линией, если это связь между слабым типом сущности и типом сущности, от существования которого она зависит. Участники каждой связи соединяются с ромбом соответствующей связи сплошными линиями. Каждая такая линия содержит обозначение "1" или "М", которое указывает, относится ли связь к типу "один к одному", "один ко многим" или "многие ко многим"). Двойная линия обозначает полное участие в связи данной стороны.








Технология построения ER-диаграмм

■ DEPT_EMP (связь типа "ОДИН КО МНОГИМ" между сущностью DEPARTMENT и EMPLOYEE).

■ EMP_DEP (связь типа "один ко многим" между сущностью EMPLOYEE и сущностью слабого типа DEPENDENT).

■ PROJ_WORK и PROJ_MANAGER (обе связи установлены между сущностями EMPLOYEE и PROJECT, причем первая имеет тип "многие ко многим", а вторая — "один ко многим").

■ SUPP_PART_PROJ (связь типа "многие ко многим и ко многим" между сущностями SUPPLIER, PART И PROJECT).

■ SUPP_PART (связь типа "многие ко многим" между сущностями SUPPLIER И PART).

■ PART_STRUCTURE (связь типа "многие ко многим" между сущностями PART и PART).

Обратите внимание на то, что в последнем Случае две линии от PART К PART_STRUCTURE отличаются надписями с указанием различных выполняемых ролей (ЕХР и IMP, которые обозначают, соответственно, "разборку узла на детали" и "сборку узла из деталей"). Связь PART_STRUCTURE является типичным примером рекурсивной связи










Логическая схема получается преобразованием концептуальной схемы в ER диаграмму и далее в структуру данных, поддерживаемую выбранной СУБД.

Рассмотрим процесс построения структуры БД применительно к наиболее распространенной реляционной модели данных.

Основой для построения логической структуры данных является концептуальная схема.












Общий подход преобразования концептуальной схемы в логическую состоит в том, что каждую сущность, являющуюся представителем множества однотипных объектов, задают схемой отдельного отношения (нормализованной таблицы). При этом атрибуты сущности образуют столбцы таблицы, а реальные объекты (экземпляры сущности) будут представлены кортежами отношения.











В том случае, если число значений атрибута у разных объектов колеблется существенно или атрибут используется в качестве условия поиска данных, то, следуя требованию нормализации отношения, такой атрибут необходимо вынести в отдельную вспомогательную таблицу.

















Еще одним приемом, улучшающим структуру БД, является создание справочников и классификаторов данных. Для столбцов, значения которых принадлежат фиксированному ограниченному множеству или носят условно постоянный характер, создаются справочники и классификаторы данных в виде отдельных таблиц. Например, цвет рам в компании по установке окон и дверей выбирается из фиксированного и ограниченного множества.

После создания справочника или выбора готового классификатора вносятся изменения в структуры информационных таблиц путем замены имен и доменов полей, вошедших в справочники, их кодами.

Далее каждая таблица анализируется на принадлежность к нормальным формам и при необходимости выполняется ее нормализация.

















Для всех столбцов нормализованных таблиц, используя описание соответствующего атрибута, задается имя и подбирается формат (тип) данных из поддерживаемых СУБД. Подлежащие контролю ограничения атрибутов оформляются логическими выражениями на языке выбранной СУБД.

















. При необходимости структура связывающей таблицы может быть дополнена столбцами, содержащими атрибуты связи. Например, фрагменту концептуальной схемы вида



соответствует логическая схема, представленная следующей ER диаграммой:















Различные способы представления бинарной связи типа «один ко многим»













Диаграмма «сущность связь» или ER диаграмма также представляет собой граф, вершинами которого являются сущности ПО, взаимодействия которых задаются только бинарными связями, не имеющими имен и атрибутов. Поэтому для отображения произвольных связей объектов ПО в схему должны вводиться дополнительные сущности, представляющие связи. Бинарные связи в ER диаграмме задаются непоименованными линиями.











Для обозначения типа связи на ER диаграмме используются различные соглашения. Связь «один к одному» и «один ко многим» может обозначаться соответствующим символом на линии, связывающей сущности.













Способ представления бинарной связи «один ко многим» с обязательным участием сущности в связи





































































































































© НИЯУ МИФИ Кафедра «Информатика и процессы управления», 2010 стр.