Ы, включают методы обработки данных многих ранее существовавших автоматизированных систем (АС), с другой обладают спецификой в организации и обработке данных
Вид материала | Документы |
Содержание3 Общие принципы построения моделей данных в ГИС 3.1. Основные понятия моделей данных Предметной областью |
- Методы анализа данных, 17.8kb.
- Методика определения актуальных угроз безопасности персональных данных при их обработке, 175.98kb.
- Понятия о базах данных и системах управления ими. Классификация баз данных. Основные, 222.31kb.
- Анализ и оценка дисциплин обслуживания требований (запросов) с учетом их приоритетов, 20.53kb.
- Программа дисциплины «Методы обработки экспериментальных данных», 318.77kb.
- «Прикладная информатика (по областям)», 1362.72kb.
- Методические указания к курсовому проектированию по курсу "Базы данных" Составитель:, 602.97kb.
- Концепция баз данных уже давно стала определяющим фактором при создании эффективных, 293.58kb.
- Доклад Тема: «Информационные технологии», 58.36kb.
- Рабочей программы дисциплины Структуры и алгоритмы обработки данных по направлению, 21.62kb.
3 Общие принципы построения моделей данных в ГИС
ГИС использует разнообразные данные об объектах, характеристиках земной поверхности, информацию о формах и связях между объектами, различные описательные сведения.
Для того чтобы полностью отобразить геообъекты реального мира и все их свойства, понадобилась бы бесконечно большая база данных. Поэтому, используя приемы генерализации и абстракции, необходимо свести множество данных к конечному объему, легко поддающемуся анализу и управлению. Это достигается применением моделей, сохраняющих основные свойства объектов исследования и не содержащих второстепенных свойств. Поэтому первым этапом разработки ГИС или технологии ее применения является обоснование выбора моделей данных для создания информационной основы ГИС.
В существующих ГИС используются различные способы для организации реальности посредством модели данных. Каждая модель более пригодна для определенных типов данных и областей применения, поэтому при необходимости решения большого числа задач следует использовать совокупность разных моделей.
Модели геообьектов, применяемые в ГИС, многочисленны и разнообразны, что обусловливается многообразием данных и задач, решаемых при помощи ГИС.
В процессе функционирования ГИС все многообразие входных данных - информация об объектах, их характеристиках, о формах и связях между объектами, различные описательные сведения - преобразуется в единую общую модель (набор моделей), хранимую в базе данных. В совокупности эти данные образуют разнообразные модели объектов, которые задают информационную основу базы данных и определяют методы обмена данными в процессе эксплуатации ГИС.
Интегрированная информационная основа базы данных не является просто суммой информационных моделей частей объекта. Она, как правило, имеет меньший объем физической памяти при сохранении информационной емкости по сравнению с информационными моделями, ее составляющими, хотя включает данные о связях и дополнительную служебную информацию.
Целостность, непротиворечивость и оптимальность этой общей модели ГИС обусловливается обоснованным выбором составляющих частей модели.
Модели объектов ГИС, хранящихся в базах данных, состоят из более простых частей, которые принято называть моделями данных. В свою очередь, модели данных в ГИС имеют сложную многоуровневую структуру, в которой нижние уровни состоят из элементарных (атомарных) моделей данных. Из элементарных моделей конструируются более сложные. Конструирование, или проектирование сложных моделей на основе более простых, зависит от выбора структуры сложной модели, от типа связей в сложной модели и от качественных характеристик элементарных моделей.
Проблема организации базы данных п ГИС сводится к решению ряда задач, первой из которых является организация моделей объектов. Это определяет необходимость предварительного анализа свойств элементарных моделей данных, составляющих более сложные модели в БД, и выбора базовых теоретических моделей с учетом конкретной предметной области задач ГИС. Такой подход позволяет оптимизировать создание информационной основы и процессы обработки данных в БД.
Оптимизация информационной основы и функционирования ГИС начинается с анализа базовых моделей данных, определяющих структуру связей в моделях и образующих более сложные модели для описания реальных объектов.
3.1. Основные понятия моделей данных
Вопросы и терминология моделирования данными недостаточно широко освещены в технической литературе. Поэтому необходимо дать основные понятия, используемые при построении и описании моделей данных.
Как правило, реальная ГИС используется для решения заданного круга задач в конкретной области применения.
Предметной областью называется подмножество (часть реального мира), на котором определяется набор данных и методов манипулирования с ними для решения конкретных задач или исследований.
Рассмотрим информационные единицы, которые составляют основу организации моделей и структур данных:
• знак - элементарная единица информации, являющаяся реализацией свойств объекта в заранее заданной, структурно организованной знаковой системе. Примеры знаков:
1. В знаковой системе целых чисел знаками будут целые числа типа 1,2, 10, 101 и т.д. Но в этой системе знаком не будут являться дробные числа, например 0.5,0.25.
2. В знаковой системе вещественных чисел в качестве знаков будут выступать числа типа 0.5, 1, 1.3, 5.356 и т.д.
3. В системе русского алфавита знаками будут буквы а, б , Т и др.
4. В системе латинского алфавита знаками будут латинские буквы X, Y, Z и т.д., но не русские (П, Б и др.);
• тип - совокупность моделей или объектов, объединенная общим набором признаков, или класс подобных знаков. В приведенном выше примере для первой знаковой системы будет тип "целый", для второй группы знаков - тип "вещественный", для третьей и четвертой групп - "символьный" или "текстовый". Понятие типа данных широко используется в программировании при описании данных. Это понятие является частным случаем понятия "типа" в общем . В зависимости от выбора признаков может меняться организация типов данных, т.е. разбиение на типы. Для выделения типов применяют процедуры типизации;
• типизация - объединение данных по набору заданных признаков или выделение из множества данных тех, которые удовлетворяют заданным критериям (или признакам).
Знак можно рассматривать как реализацию типа, тип - как обобщение совокупности знаков. Следовательно, знак представляет индивидуальные свойства модели, а тип - ее общие свойства;
• сущность - элемент модели (совокупность атрибутов и знаков), описывающая законченный объект или понятие;
• атрибут - элементарное данное, описывающее свойства сущностей;
• атрибут данных - свойство данных;
• запись данных - формализованное представление сложной информационной модели без описания ее структуры. Запись может быть логической и физической;
• запись логическая - информационная единица, соответствующая одному шагу обработки информации;
• запись физическая - порция информации, которая является единицей обмена данными между внутренней и внешней памятью ЭВМ;
• даталогическая модель ГИС - модель логического уровня описания геоинформационной системы, состоящая из логических записей и отображения связей между ними безотносительно к виду реализации. Описание даталогической модели называют схемой,
• даталогическое проектирование - этап создания даталогической модели;
• физическая модель ГИС (БД) - модель среды хранения данных физического уровня. Строится с учетом реальных СУБД и на их основе, может рассматриваться как реализация даталогической модели.
Для построения модели объекта в виде составляющих частей и определения связей между этими частями применяют методы (процедуры) абстракции, которые тоже образуют целый набор понятий:
• абстракция - процедура структуризации (типизации) данных. Различают два вида абстракции: обобщение и агрегация;
• обобщение также подразделяется на две категории: собственно обобщение и классификация;
• собственно обобщение- процедура соотнесения множества типов одному типу соотносится с понятием: "есть часть...",
• классификация - процедура соотнесения множества знаков одному типу;
• экземпляция - процедура (обратная классификации) порождения реализации на основе известной классификации;
• специализация - процедура (обратная обобщению) порождения типов на основе общего класса типов;
• агрегация - процедура конструирования объекта из других базовых объектов; соотносится с понятием "есть некоторые..",
• интенсионал - агрегация на уровне свойств-типов;
• экстенсионал - агрегация на уровне свойств-знаков. Например, общая схема взаимосвязи данных, выраженных типами (общими понятиями), в любой базе данных представляет собой интенсионал, а схема взаимосвязи данных, выраженных конкретным набором значений (набором знаков), - экстенсионал.
Под агрегативными данными будем понимать набор данных для формирования объекта из его частей на основе процедур агрегации.
Процедура, обратная агрегации, называется пошаговой детализацией. Она применяется для разбиения агрегативной модели на составляющие части.
Личность | Ф.И.О. | Возраст | Адрес | Социальное положение | Стаж | Зарплата | Налоги | Специальность |
Рис. 3.4. Логическая запись, построенная на основе агрегации
Личность | Социальное положение | Административная принадлежность | Занимаемая должность | Тарифный разряд |
Рис. 3.5. Логическая запись, построенная на основе обобщения
На рис. 3.1 приведена схема проектирования (структурирования ) данных с применением прямых и обратных процедур абстракции.
Для пояснения различия между обобщением и арегацией приведены модели одного и того же объекта "личность", но построенные на основе различных подходов (процедур): с применением метода обобщений (рис. 3.2) и метода агрегации (рис. 3.3). Каждая структурно определенная модель позволяет создавать логическую запись На рис. 3.4 и 3.5 соответственно приведены логические записи, построенные для моделей, спроектированных с использованием агрегации (см. рис. 3.3) и обобщения (см. рис. 3.2).
Записи различаются не только по виду, но и контекстно, так как в одном случае (см. рис. 3.5) параметры (атрибуты) записи подчеркивают отношение полного объекта (записи) к другом группам объектов, а в другом (см рис. 3.4) - являются атомарными объектами, тугими словами, модель, построенная на основе обобщений, отражает свойства по отношению к другим классам моделей или объектов.
Модель, построенная на основе агрегации, может являться разложением сложного объекта на более простые вплоть до атомарных.