Лекция №4. Модели данных > Лекция №4. Модели данных Вопросы организации данных в гис, в частности, модели структуры данных, форматы, одна из самых сложных, самых важных и определяющих тем в гис
Вид материала | Лекция |
- Лекция 1) гис как специализированная информационная система. Структура информационных, 78.1kb.
- Курс лекций "Базы данных и субд" Ульянов В. С. Лекция. Манипулирование реляционными, 276.31kb.
- Лекция №3. Организация данных в гис первым шагом к проекту гис является создание пространственной, 268.29kb.
- Возможности реляционной модели данных по отображению сложных структур данных, 155.27kb.
- Проектирование базы данных, 642.58kb.
- Программы для интерпретации гис интегрированнaя система обработки данных гис "прайм", 103.04kb.
- Программа дисциплины Системы управления базами данных Семестры, 22.73kb.
- Реляционные решения: от открытия реляционной модели данных до проблематики фундаментальных, 61.83kb.
- Гис-технологии в экологии, 1013.18kb.
- Дискретных Марковских Цепей) в анализе данных. Пример применения. (лекция, 7.29kb.
4.13.Подразделение моделей и форматов данных по их назначению.
Разумеется, можно также проводить деление моделей и форматов данных по их назначению. Для использования в ГИС, для использования в САПР, для использования в простых чертежно-рисовальных системах. ГИСовские модели и форматы обычно четко отделяются на сегодняшний день от всех прочих за счет необходимости организации и активного использования связи между информацией положения и атрибутивной информацией объекта.
4.14.Некоторые дополнительные моменты.
Здесь можно сделать несколько замечаний. Во-первых, относительно деления позиционных параметров на параметры положения и параметры, определяющие форму объекта. Только для точечных объектов это всегда полные синонимы - точка формы не имеет, или ее положение - это и есть ее форма. Для линейных же и площадных объектов ситуация иная. В дальнейшем мы еще будем подробнее рассматривать способы описания линейных и площадных объектов в различных моделях данных, а сейчас только заметим, что они могут описываться как координатами каких-то их точек, так и каким-то описанием их формы, например, заданием функций, график которой дает форму требуемого объекта или просто словесным описанием формы -"квадрат со стороной 2 метра". Нетрудно заметить, что в последнем случае (а иногда и в предпоследнем) информацию положения можно отделить от информации, описывающей форму, поместив ее просто в атрибуты объекта. Для однозначности надо только определить, в каком месте объекта расположена та его точка, положение которой задается локатором. Назовем эту точку привязочной точкой объекта. определив ее положение в собственной системе координат объекта, а точку в пространстве, которая задается для такого объекта локатором - точкой вставки объекта.
Это подход традиционно используемый в отношении внемасштабных условных знаков для точечных объектов. Но он может быть обобщен, если трактовать графическое представление условного знака как пространственный объект, и вообще использоваться в других ситуациях, если нам удастся описать форму, размер и ориентировку объекта через его атрибуты, например. Правда, многие задачи, требующие взаимодействия пространственных объектов, анализа их взаимоотношений, могут затруднены при таком представлении. Эти рассуждения показывают нам условность подразделения информации об объекте на атрибутивную и информацию о его форме, а также возможность иногда рассматривать отдельно информацию о положении, форме, размере и ориентировке (угле поворота) объекта.
4.15.Метаданные.
Помимо информации, относящейся к индивидуальным объектам, большое значение имеет так называемая метаинформация, или метаданные, как часто говорят, т.е. данные о данных. Метаданные могут быть различными и относиться к различным множествам данных, например, ко всем данным в конкретной базе данных. сведения о назначении базы данных, кто, когда и для какой цели ее организовал и собирал информацию (см. проект государственного стандарта «Метаданные электронных карт». - Прим. ред.). Это могут быть сведения о методах сбора информации (может быть, различных для разных объектов, для разного времени и разных пространственных частей базы данных). Так это могут быть:
- определения объектов (то есть принцип их выделения);
- определения атрибутов (что, например, скрывается за краткими заголовками полей таблиц или именами полей в базе данных);
- объяснение способа измерения значений атрибутов или источники этих данных и способ кодирования атрибутов;
- пояснение к цветовой легенде карты и условным знакам (легенда);
- правила, по которым проводились границы объектов;
- сведения о дате, на которую информация актуальна;
- сведения об источниках информации, методах ее получения;
- пояснения к отсутствующим значениям в атри
бутах - какой код отсутствия значений, что он означает (данный атрибут не имеет смысла для данного объекта, данное значение не было померено или результат измерения был забракован, или измерения дали нулевой результат, т.е. значение ниже предела обнаружения);
- любая информация, которая или способствует правильному использованию информации о нужных нам объектах, или даже просто необходима для этого.
Для карты практически во всех случаях необходимым элементом метаданных являются сведения об использованной системе координат и картографической проекции, а информация о методе составления (полевые работы, генерализация) и использованных материалах обязательной является не всегда или не для всех пользователей.
Кроме того, атрибуты могут быть первичными (измеренными, введенными) и вторичными, расчетными, полученными расчетом из значений других атрибутов Частный случай таких расчетных - это атрибуты (обычно пространственные), рассчитываемые исходя из позиционных параметров объектов (например, периметр).
И, конечно, сегодня, в эпоху мультимедиа, вполне естественным является расширение понятия атрибутов объекта на другую связанную с ним информацию - растровую графику: фотографию объекта или отсканированную схему каких-то документов, с ним связанную, видеофильм или компьютерную анимацию, звуковую информацию. Поэтому можно говорить о классических (алфа-витно-цифровых) атрибутах объекта, а также о его расширенных атрибутах (мультимедий-ных, в частности). В современных ГИС возможно иногда связывание с объектом некоторого действия, например, запуск какой-то программы или макро при активизации объекта указанием на него Возможно также при активизации объекта, например площадного объекта «Московская область» на карте России, перейти к другой карте -более подробной карте Московской области с районным делением или к карте Москвы - столице области. Таким образом, другую карту, организованную в рамках той же (например, вектор-но-топологической) или другой (например, растровой) модели данных, или какой-то индивидуальный объект в них можно тоже в некотором смысле рассматривать как атрибут первого объекта. При этом возможна организация такой связи различным образом, в том числе с установлением иерархических связей соподчиненности между как индивидуальными объектами, так и их множествами (картами, тематическими слоями) Все это позволяет создавать конкретные структуры баз данных, очень сложные и изощренные. Это вызывает необходимость введения понятия «обобщенные атрибуты» и ярко демонстрирует условность и относительность деления информации об объекте на атрибутивную и неатрибу1 тивную (графическую, например) в ГИС. То есть нельзя ставить знак равенства между пространственной и графической информацией в ГИС. Графическая не всегда пространственная (графические атрибуты - чертежи), а пространственная -не всегда графическая (атрибуты площади, периметра, длины объекта, а также его характеристика связи с другими объектами - топологическая информация).
4.16. Краткое резюме и практические следствия.
Модели и форматы данных в ГИС в целом гораздо сложнее устроены, чем в других типах ПО Это связано с тем, что требуется поддерживать связь между атрибутивной и пространственной информацией, и с тем, что природные объекты очень разнятся по своей природе - индивидуализированные объекты различных геометрических типов с четкими границами, объекты с нечеткими границами и непрерывные поля числовых и нечисловых признаков Сложность моделей данных также обусловливается необходимостью обеспечить выполнение многочисленных, часто сложных, функций
Рис. 6. Модель данных квадродерево
В отличие от САПР, сегодня не существует полностью трехмерных ГИС общего назначения, в ГИС могут быть возможности по трехмерной визуализации, работ с 2,5-мерным пространством (серии поверхностей в трехмерном пространстве)
Сегодня реально используются следующие модели:
- растровая - на регулярной сетке (с одним размером ячейки),
- модель типа квадродерева - на нескольких сетках с кратными размерами ячеек (рис 6), (Для оптимизации хранения и поиска )
- модель векторная нетопологическая (с элементами объектной организации или без них, построенная на «вшитом» иерархическом классификаторе или без такового),
- векторная топологическая, где в явном виде в модели данных хранятся топологические отношения между объектами,
- модели данных, предназначенные для использования топологических отношений, но не хранящие их в файлах, а рассчитанные на их построение «на лету», в процессе запроса, модели данных типа TIN (рис 7).
Рис. 7. Модель данных TIN
И наконец, внутри каждой из названных моделей могут быть варианты, отличающиеся по организации связей между пространственными и атрибутивными характеристиками и по типу взаимодействия с базами данных Понятно, что конкретных вариантов набирается очень много, а конкретных реализации в разных пакетах - еще больше Поэтому в краткой статье более подробно их рассмотреть невозможно Говорить, какая из них лучше «вообще», без анализа конкретной ситуации, нельзя.
Но если вы задумываете использовать ГИС, то еще перед выбором конкретного пакета советую подумать о модели данных - какие к ней будут предъявляться требования.
Мы познакомились с некоторыми общими принципами построения моделей данных в пространственных информационных системах, затронули кратко вопросы о разновидностях моделей данных. Были приведены некоторые отдельные соображения, показывающие сложность вопроса - как только мы выходим за рамки единственной конкретной программной системы с ее моделью данных и ее ограничениями, многое, даже определения и классификация элементов, слагающих модель данных, становятся непростой задачей, многое оказывается дискуссионным.
Мы затронули также принципиальную важность вопроса о выборе модели данных - часто это вопрос номер 1, когда мы задумываемся о работе с пространственными данными и только начинаем планировать ее. Это относится как к разработчикам оригинальных программных систем - новых инструментальных средств для геоинформатики, так и к разработчикам приложений и к пользователям, которые стоят перед проблемой выбора программного продукта для реализации проекта.
Геоинформационные технологии принесли компьютерные методы в практику многих и многих областей знания, где до этого использование компьютеров было ограниченным и вспомогательным, усадили за компьютер много специалистов, которые до знакомства с ГИС практически не имели дела с какими-либо информационными технологиями. Это порождает определенные проблемы как в обучении геоинформатике, так и в практическом освоении технологий. Может быть, сейчас стоит назвать некоторые из этих проблем, поскольку они в значительной мере связаны с предыдущим текстом.
1. Многие пользователи не знают, не могут четко сформулировать, чего они хотят. Процесс постановки задачи и выбора модели данных, программного средства и конкретной технологии связаны поэтому очень тесно. На этих этапах очень желательно тесное взаимодействие специалиста-прикладника, способного формулировать задачу на содержательном уровне и специалиста по общей геоинформатике, выступающего в роли системного аналитика. Весьма вероятно, что этот процесс должен быть итеративным - идти методом последовательных приближений.
2. Пользователи могут думать, что применение какого-то программного обеспечения само по себе решит их проблемы. Однако никакие самые совершенные средства обработки и анализа не состоянии решить никаких проблем без достаточного обеспечения качественными данными и продуманной постановки задачи.
3. Некоторые операции, возможные теоретически, на практике оказываются слишком дорогими за счет необходимости сбора дополнительной информации, за счет того, что алгоритмы их реализации требуют слишком больших вычислений даже для современных компьютерных систем. Уровень реализации некоторых методов анализа в современных программных средствах может быть недостаточен для их применения в определенных ситуациях (ограничения на число объектов...).
4.17.Определения
Векторное представление – Цифровое пространственных объектов в виде набора координатных пар (векторов), описывая только геометрию объектов (см. модель «спагетти»- нетопологическое В.п. линейных и полигональных объектов) или геометрию и их взаимные отношения (топологию) в виде векторно-топологического представления; в машинной реализации В.п. соответствует векторный формат пространственных данных.
Векторно-топологическое представление. (т.е. линейно-узловое представление) – разновидность векторного представления линейных и полигональных пространственных объектов, описывая не только их геометрию, но (см. модель «спагетти»), но и топологические отношения между ними и образующими их элементами (дугами и узлами).
Модель «спагетти» (векторно-нетопологическая) - Разновидность векторного представления линейных и полигональных пространственных объектов, описывая их геометрию, но не топологию в виде неупорядочного набора дуг или совокупности сегментов.
Квадрометрическое представление. Квадродерево – один из способов представления пространственных объектов в виде иерархической древовидной структуры, основанный на декомпозиции пространства на квадратные участки, каждый из которых делится рекурсивно на 4 вложенных квадрата до достижения некоторого уровня, обеспечивающего требуемую детальность описания объектов; обычно используется как средство повышения эффективности обработки и компактности хранимых данных по сравнению с растровыми представлениями.
Полигон Тиссена. Полигональные области, образуемые на данном множестве точек таким образом, что расстояние от любой точки области до данной точки меньше, чем для любой другой точки множества;
Представление пространственных данных. (модель пространственных данных). – способ цифрового описания пространственных объектов, тип структуры пространственных данных; наиболее универсальные и употребительные из них: векторное представление (векторно-топологическое и векторно-нетопологическое), растровое представление, регулярно ячеистое представление и квадродерево. К менее распространенным относится модель типа TIN и ее многомерные расширения (где используются полигоны Тиссена). Машинные реализации п.п.д. называются форматами пространственных данных.
1 (Кстати, заметим, что в традиционной картографии, даже на топографических картах, и, тем более, на картах более сложных по содержанию, например, геологических, уделено определенное внимание и площадным объектам с нечеткими границами - заболоченные территории на топокартах, крапы зон наложенных изменений типа ороговикования на геологических картах. Заметим также, что в современных ГИС недостаточно развиты) средства представления и работы с такими объектами, особенно если говорить и об их участии в анализе, и об их наглядной визуализации Здесь также видится одно из возможных интересных направлении развития будущей геоинформатики