Ы, включают методы обработки данных многих ранее су­ществовавших автоматизированных систем (АС), с другой обладают спецификой в организации и обработке данных

Вид материалаДокументы

Содержание


3 Общие принципы построения моделей данных в ГИС
3.1. Основные понятия моделей данных
Предметной областью
Подобный материал:
1   2   3   4   5   6   7   8   9   10   ...   39

3 Общие принципы построения моделей данных в ГИС


ГИС использует разнообразные данные об объектах, характеристи­ках земной поверхности, информацию о формах и связях между объек­тами, различные описательные сведения.

Для того чтобы полностью отобразить геообъекты реального мира и все их свойства, понадобилась бы бесконечно большая база данных. Поэтому, используя приемы генерализации и абстракции, необходимо свести множество данных к конечному объему, легко поддающемуся анализу и управлению. Это достигается применением моделей, сохра­няющих основные свойства объектов исследования и не содержащих второстепенных свойств. Поэтому первым этапом разработки ГИС или технологии ее применения является обоснование выбора моделей дан­ных для создания информационной основы ГИС.

В существующих ГИС используются различные способы для орга­низации реальности посредством модели данных. Каждая модель более пригодна для определенных типов данных и областей применения, по­этому при необходимости решения большого числа задач следует ис­пользовать совокупность разных моделей.

Модели геообьектов, применяемые в ГИС, многочисленны и разно­образны, что обусловливается многообразием данных и задач, решае­мых при помощи ГИС.

В процессе функционирования ГИС все многообразие входных дан­ных - информация об объектах, их характеристиках, о формах и связях между объектами, различные описательные сведения - преобразуется в единую общую модель (набор моделей), хранимую в базе данных. В со­вокупности эти данные образуют разнообразные модели объектов, ко­торые задают информационную основу базы данных и определяют ме­тоды обмена данными в процессе эксплуатации ГИС.

Интегрированная информационная основа базы данных не является просто суммой информационных моделей частей объекта. Она, как пра­вило, имеет меньший объем физической памяти при сохранении инфор­мационной емкости по сравнению с информационными моделями, ее составляющими, хотя включает данные о связях и дополнительную слу­жебную информацию.

Целостность, непротиворечивость и оптимальность этой общей мо­дели ГИС обусловливается обоснованным выбором составляющих час­тей модели.

Модели объектов ГИС, хранящихся в базах данных, состоят из бо­лее простых частей, которые принято называть моделями данных. В свою очередь, модели данных в ГИС имеют сложную многоуровневую струк­туру, в которой нижние уровни состоят из элементарных (атомарных) моделей данных. Из элементарных моделей конструируются более слож­ные. Конструирование, или проектирование сложных моделей на осно­ве более простых, зависит от выбора структуры сложной модели, от типа связей в сложной модели и от качественных характеристик элементар­ных моделей.

Проблема организации базы данных п ГИС сводится к решению ряда задач, первой из которых является организация моделей объектов. Это определяет необходимость предварительного анализа свойств элемен­тарных моделей данных, составляющих более сложные модели в БД, и выбора базовых теоретических моделей с учетом конкретной предмет­ной области задач ГИС. Такой подход позволяет оптимизировать созда­ние информационной основы и процессы обработки данных в БД.

Оптимизация информационной основы и функционирования ГИС начинается с анализа базовых моделей данных, определяющих структу­ру связей в моделях и образующих более сложные модели для описания реальных объектов.

3.1. Основные понятия моделей данных


Вопросы и терминология моделирования данными недостаточно широко освещены в технической литературе. Поэтому необходимо дать основные понятия, используемые при построении и описании моделей данных.

Как правило, реальная ГИС используется для решения заданного круга задач в конкретной области применения.

Предметной областью называется подмножество (часть реального мира), на котором определяется набор данных и методов манипулирования с ними для решения конкретных задач или исследований.

Рассмотрим информационные единицы, которые составляют осно­ву организации моделей и структур данных:

знак - элементарная единица информации, являющаяся реализа­цией свойств объекта в заранее заданной, структурно организованной знаковой системе. Примеры знаков:

1. В знаковой системе целых чисел знаками будут целые числа типа 1,2, 10, 101 и т.д. Но в этой системе знаком не будут являться дробные числа, например 0.5,0.25.

2. В знаковой системе вещественных чисел в качестве знаков будут выступать числа типа 0.5, 1, 1.3, 5.356 и т.д.

3. В системе русского алфавита знаками будут буквы а, б , Т и др.

4. В системе латинского алфавита знаками будут латинские буквы X, Y, Z и т.д., но не русские (П, Б и др.);

тип - совокупность моделей или объектов, объединенная общим набором признаков, или класс подобных знаков. В приведенном выше примере для первой знаковой системы будет тип "целый", для второй группы знаков - тип "вещественный", для третьей и четвертой групп - "символьный" или "текстовый". Понятие типа данных широко исполь­зуется в программировании при описании данных. Это понятие являет­ся частным случаем понятия "типа" в общем . В зависимости от выбора признаков может меняться организация типов данных, т.е. разбиение на типы. Для выделения типов применяют процедуры типизации;

типизация - объединение данных по набору заданных признаков или выделение из множества данных тех, которые удовлетворяют за­данным критериям (или признакам).

Знак можно рассматривать как реализацию типа, тип - как обоб­щение совокупности знаков. Следовательно, знак представляет индиви­дуальные свойства модели, а тип - ее общие свойства;

сущность - элемент модели (совокупность атрибутов и знаков), описывающая законченный объект или понятие;

атрибут - элементарное данное, описывающее свойства сущно­стей;

атрибут данных - свойство данных;

запись данных - формализованное представление сложной инфор­мационной модели без описания ее структуры. Запись может быть логи­ческой и физической;

запись логическая - информационная единица, соответствующая одному шагу обработки информации;

запись физическая - порция информации, которая является еди­ницей обмена данными между внутренней и внешней памятью ЭВМ;

даталогическая модель ГИС - модель логического уровня описа­ния геоинформационной системы, состоящая из логических записей и отображения связей между ними безотносительно к виду реализации. Описание даталогической модели называют схемой,

даталогическое проектирование - этап создания даталогичес­кой модели;

физическая модель ГИС (БД) - модель среды хранения данных физического уровня. Строится с учетом реальных СУБД и на их основе, может рассматриваться как реализация даталогической модели.

Для построения модели объекта в виде составляющих частей и оп­ределения связей между этими частями применяют методы (процеду­ры) абстракции, которые тоже образуют целый набор понятий:

абстракция - процедура структуризации (типизации) данных. Раз­личают два вида абстракции: обобщение и агрегация;

обобщение также подразделяется на две категории: собственно обобщение и классификация;

• собственно обобщение- процедура соотнесения множества типов одному типу соотносится с понятием: "есть часть...",

классификация - процедура соотнесения множества знаков одно­му типу;

экземпляция - процедура (обратная классификации) порождения реализации на основе известной классификации;

специализация - процедура (обратная обобщению) порождения типов на основе общего класса типов;

агрегация - процедура конструирования объекта из других базо­вых объектов; соотносится с понятием "есть некоторые..",

интенсионал - агрегация на уровне свойств-типов;

экстенсионал - агрегация на уровне свойств-знаков. Например, общая схема взаимосвязи данных, выраженных типами (общими понятиями), в любой базе данных представляет собой интен­сионал, а схема взаимосвязи данных, выраженных конкретным набором значений (набором знаков), - экстенсионал.

Под агрегативными данными будем понимать набор данных для формирования объекта из его частей на основе процедур агрегации.

Процедура, обратная агрегации, называется пошаговой детализа­цией. Она применяется для разбиения агрегативной модели на состав­ляющие части.












Личность

Ф.И.О.

Возраст

Адрес

Социальное положение

Стаж

Зарплата

Налоги

Специальность


Рис. 3.4. Логическая запись, построенная на основе агрегации




Личность

Социальное положение

Административная принадлежность

Занимаемая должность

Тарифный разряд


Рис. 3.5. Логическая запись, построенная на основе обобщения



На рис. 3.1 приведена схема проектирования (структурирования ) данных с применением прямых и обратных процедур абстракции.

Для пояснения различия между обобщением и арегацией приведе­ны модели одного и того же объекта "личность", но построенные на основе различных подходов (процедур): с применением метода обоб­щений (рис. 3.2) и метода агрегации (рис. 3.3). Каждая структурно определенная модель позволяет создавать логическую запись На рис. 3.4 и 3.5 соответственно приведены логические записи, построенные для моделей, спроектированных с использовани­ем агрегации (см. рис. 3.3) и обобщения (см. рис. 3.2).

Записи различаются не только по виду, но и контекстно, так как в одном случае (см. рис. 3.5) параметры (атрибуты) записи подчеркивают отношение полного объекта (записи) к другом группам объектов, а в другом (см рис. 3.4) - являются атомарными объектами, тугими словами, модель, построенная на основе обобщений, отражает свойства по отношению к другим классам моделей или объектов.

Модель, построенная на основе агрегации, может являться разло­жением сложного объекта на более простые вплоть до атомарных.