Ы, включают методы обработки данных многих ранее су­ществовавших автоматизированных систем (АС), с другой обладают спецификой в организации и обработке данных

Вид материалаДокументы

Содержание


3.2. Классификационные задачи
3.3. Аспекты рассмотрения моделей данных
Сильно типизированные
Слабо типизированные—
Табличная форма
Графовая форма
Форма отображения объекта в
Подобный материал:
1   ...   4   5   6   7   8   9   10   11   ...   39

3.2. Классификационные задачи


При создании информационной основы и анализе данных используются методы классификационного анализа. Поскольку при сборе информа­ции для БД приходится иметь дело с результатами измерений, первые три типа задач классификации определим по этому показателю. Воспользуемся определением, данным Кендаллом [5]. К задачам классификации первого типа относятся те, в которых исходные измерения требуется разделить на устойчивые группы. Их называют задачами классификации без учителя, кластеризации, таксо­номии, типизации. Этот тип классификации основан преимущественно на опытных данных. Задачи классификации второго типа характеризуются тем, что исходные данные уже сгруппированы и требуется оценить их информа­тивность (значимость) относительно совокупности известных этало­нов. Такого рода задачи встречаются при распознавании образов, дешифрировании снимков и т.д. Задачи классификации третьего типа - задачи разбиения. В них исходные измерения или их функции требуется разбить на устойчивые группы в зависимости от их величины.

Задачи классификации четвертого типа назовем процедурны­ми. В них выполняются анализ и классификация процедур преобразова­ния, а не данных.

Задачи классификации пятого типа - структурно-аналитичес­кие. С их помощью производятся анализ и классификация аналитичес­ки-логических связей в системах, алгоритмах и программах. Основу такой классификации составляют методы структурного и системного анализа.

В ГИС задачи классификации первого типа возникают и решаются при разработке классификаторов, т.е. при организации информацион­ной основы, задачи второго типа - при сборе первичных данных и при использовании ГИС для экспертных решений или оценок. Задачи клас­сификации третьего типа возникают в приложениях ГИС для решения проблем в области экологии, землепользования, статистики и т.п. Зада­чи четвертого типа классификации требуют решения при организации и выборе основных технологических процессов ГИС, пятого типа - при организации информационной системы, представлении (формализации) и оптимизации ее технологических процессов. Строго говоря, класси­фикационные задачи пятого типа должны предшествовать классифика­ционным задачам четвертого и других типов.

3.3. Аспекты рассмотрения моделей данных


Модель, как правило, отражает наиболее общие свойства объекта или исследуемого процесса. Использование различных аспектов рассмот­рения и критериев оценки моделей данных позволяет на основе объек­тивного сравнительного анализа выбирать оптимальную модель для ре­шения возникающих проблем.

Семиотика. Модель как знаковая система должна содержать три основные характеристики: синтаксис, семантику и прагматику. Этот под­ход определяет содержание элементарной (атомарной) модели как эле­ментарной единицы данных, включающей в себя правила построения, имя объекта, свойства объекта, значения свойств. Разнообразие атомар­ных моделей создает условия для построения множества моделей данных. Типизация. Одно из противоречий описания моделей заключается в стремлении отразить, с одной стороны, общие свойства класса объек­тов, с другой - индивидуальные признаки более узкого подкласса и индивидуальные признаки конкретного объекта. Это обусловливает разде­ление моделей данных на два класса: сильно типизированные и слабо типизированные.

Сильно типизированные- это модели, в которых большинство данных удовлетворяет неким условиям и ограничениям и может быть отнесено к узкому подклассу (типу). Если исходные данные нельзя отнести к одному типу, то их можно с помощью искусственных приемов (введением дополнительных условий или ограничений) отне­сти к набору типов с помощью процедур типизации. Сильно типизиро­ванные модели эффективны при обработке однотипных потоков данных. Примером сильно типизированных данных в ГИС служат координат­ные (метрические) данные и все табличные данные.

Слабо типизированные— это модели, в которых данные разнородны по формату, структуре. Они, в общем, слабо связаны усло­виями относительно известных типов. Слабо типизированные модели обеспечивают интеграцию категорий данных. Предельная возможность использования таких моделей обеспечивается исчислением предикатов. Примером слабо типизированных моделей в ГИС могут быть описатель­ные характеристики (временные наборы данных).

Изменчивость. Можно выделить два класса моделей: статические и динамические.

К статическим относят модели, инвариантные относительно времени. Динамические модели не только допускают изменение параметров и структур во времени, но и служат для описания изменения процессов и моделей именно во времени. Примерами таких моделей в ГИС могут служить два вида электронных карт: электронные карты в режиме разделения времени (электронные атласы) - статическая мо­дель, электронные карты в реальном масштабе времени (навигацион­ные системы) - динамическая модель.

Следует подчеркнуть, что понятие изменчивости моделей данных в ГИС относительно, так как вся информация носит пространственно-временной характер и через какое - то время требует обновления. Поэто­му, применяя понятия статические и динамические модели, необходи­мо указывать период времени, который используется при анализе гео­информационных данных, или определять альтернативную модель при сравнении с исходной.

Любая модель данных должна в разной степени обладать двумя эти­ми свойствами. Динамика моделей определяет их возможный переход Друг в друга. Она позволяет связывать модель со множеством правил порождения и множеством операций.

Агрегация (взаимосвязь). Отдельные части модели образуют ее структуру. Одним из основных способов структуризации данных явля­ется абстракция, используемая как для образования категорий данных, так и для построения одних категорий на основе других.

Представление моделей. Выделяют табличные и графовые формы представления моделей.

Табличная форма дает представление модели или ее харак­теристик в виде одной или совокупности взаимосвязанных таблиц. При этом данные в ячейках таблицы не могут заноситься произвольно, они подчиняются определенным правилам, в частности, по столбцам распо­лагают типизированные данные. Примером табличного представления модели кроме таблицы может служить логическая запись (см. рис 3.4, 3.5), которая представляет собой верхнюю строку таблицы.

Графовая форма основана на построении модели в виде графической схемы, называемой графом. Эта схема включает элементы графа, называемые вершинами (узлами) и ребрами (дугами). В отличие от произвольно нарисованной схемы графовая модель, как и табличная, строится по определенным правилам. В частности, каждое ребро может быть ориентировано, если определен путь от одной вершины к другой, и не ориентировано, что соответствует возможному пути от одной вер­шины к другой в обоих направлениях. Простейший пример ориентиро­ванного графа - вектор в трехмерном пространстве, а неориентирован­ного графа - кривая пути из одной точки в другую. Кроме вершин и ребер существуют другие элементы, значение которых не столь суще­ственно.

Некоторые специалисты в области моделирования данных заменя­ют термины вершина и ребро терминами узел и дуга. При анализе гра­фовых форм применительно к моделям данных в ГИС эти термины сле­дует считать взаимно заменяемыми.

Форма отображения объекта в модель. Этот аспект рассмотре­ния определяет дискретную и аналоговую модели. Примерами таких моделей в ГИС могут служить обычная (аналоговая) карта и цифро­вая карта.

Аналоговые модели в свою очередь разбиваются на две группы: прямой и косвенной аналогии. Модели прямой аналогии создаются на основе физического моделирования (аналоговые карты, модели судов, самолетов, гидротехнические сооружения и т.п.), модели косвенной ана­логии - на основе математического моделирования (аналитического опи­сания), например, цифровая модель рельефа, построенная на основе ана­литического описания поверхности.

Дискретные модели строятся путем замены непрерывных функций набором дискретных значений аргументов и функций. Диск­ретность определяется шагом квантования. Для сохранения информа­тивности дискретной модели по отношению к объекту шаг квантования должен выбираться с учетом теоремы Шенона - Котельникова. Приме­ром дискретных моделей являются большинство цифровых моделей, на основе которых впоследствии осуществляется аналоговое представле­ние информации ГИС.