Ы, включают методы обработки данных многих ранее существовавших автоматизированных систем (АС), с другой обладают спецификой в организации и обработке данных
Вид материала | Документы |
Содержание3.2. Классификационные задачи 3.3. Аспекты рассмотрения моделей данных Сильно типизированные Слабо типизированные— Табличная форма Графовая форма Форма отображения объекта в |
- Методы анализа данных, 17.8kb.
- Методика определения актуальных угроз безопасности персональных данных при их обработке, 175.98kb.
- Понятия о базах данных и системах управления ими. Классификация баз данных. Основные, 222.31kb.
- Анализ и оценка дисциплин обслуживания требований (запросов) с учетом их приоритетов, 20.53kb.
- Программа дисциплины «Методы обработки экспериментальных данных», 318.77kb.
- «Прикладная информатика (по областям)», 1362.72kb.
- Методические указания к курсовому проектированию по курсу "Базы данных" Составитель:, 602.97kb.
- Концепция баз данных уже давно стала определяющим фактором при создании эффективных, 293.58kb.
- Доклад Тема: «Информационные технологии», 58.36kb.
- Рабочей программы дисциплины Структуры и алгоритмы обработки данных по направлению, 21.62kb.
3.2. Классификационные задачи
При создании информационной основы и анализе данных используются методы классификационного анализа. Поскольку при сборе информации для БД приходится иметь дело с результатами измерений, первые три типа задач классификации определим по этому показателю. Воспользуемся определением, данным Кендаллом [5]. К задачам классификации первого типа относятся те, в которых исходные измерения требуется разделить на устойчивые группы. Их называют задачами классификации без учителя, кластеризации, таксономии, типизации. Этот тип классификации основан преимущественно на опытных данных. Задачи классификации второго типа характеризуются тем, что исходные данные уже сгруппированы и требуется оценить их информативность (значимость) относительно совокупности известных эталонов. Такого рода задачи встречаются при распознавании образов, дешифрировании снимков и т.д. Задачи классификации третьего типа - задачи разбиения. В них исходные измерения или их функции требуется разбить на устойчивые группы в зависимости от их величины.
Задачи классификации четвертого типа назовем процедурными. В них выполняются анализ и классификация процедур преобразования, а не данных.
Задачи классификации пятого типа - структурно-аналитические. С их помощью производятся анализ и классификация аналитически-логических связей в системах, алгоритмах и программах. Основу такой классификации составляют методы структурного и системного анализа.
В ГИС задачи классификации первого типа возникают и решаются при разработке классификаторов, т.е. при организации информационной основы, задачи второго типа - при сборе первичных данных и при использовании ГИС для экспертных решений или оценок. Задачи классификации третьего типа возникают в приложениях ГИС для решения проблем в области экологии, землепользования, статистики и т.п. Задачи четвертого типа классификации требуют решения при организации и выборе основных технологических процессов ГИС, пятого типа - при организации информационной системы, представлении (формализации) и оптимизации ее технологических процессов. Строго говоря, классификационные задачи пятого типа должны предшествовать классификационным задачам четвертого и других типов.
3.3. Аспекты рассмотрения моделей данных
Модель, как правило, отражает наиболее общие свойства объекта или исследуемого процесса. Использование различных аспектов рассмотрения и критериев оценки моделей данных позволяет на основе объективного сравнительного анализа выбирать оптимальную модель для решения возникающих проблем.
Семиотика. Модель как знаковая система должна содержать три основные характеристики: синтаксис, семантику и прагматику. Этот подход определяет содержание элементарной (атомарной) модели как элементарной единицы данных, включающей в себя правила построения, имя объекта, свойства объекта, значения свойств. Разнообразие атомарных моделей создает условия для построения множества моделей данных. Типизация. Одно из противоречий описания моделей заключается в стремлении отразить, с одной стороны, общие свойства класса объектов, с другой - индивидуальные признаки более узкого подкласса и индивидуальные признаки конкретного объекта. Это обусловливает разделение моделей данных на два класса: сильно типизированные и слабо типизированные.
Сильно типизированные- это модели, в которых большинство данных удовлетворяет неким условиям и ограничениям и может быть отнесено к узкому подклассу (типу). Если исходные данные нельзя отнести к одному типу, то их можно с помощью искусственных приемов (введением дополнительных условий или ограничений) отнести к набору типов с помощью процедур типизации. Сильно типизированные модели эффективны при обработке однотипных потоков данных. Примером сильно типизированных данных в ГИС служат координатные (метрические) данные и все табличные данные.
Слабо типизированные— это модели, в которых данные разнородны по формату, структуре. Они, в общем, слабо связаны условиями относительно известных типов. Слабо типизированные модели обеспечивают интеграцию категорий данных. Предельная возможность использования таких моделей обеспечивается исчислением предикатов. Примером слабо типизированных моделей в ГИС могут быть описательные характеристики (временные наборы данных).
Изменчивость. Можно выделить два класса моделей: статические и динамические.
К статическим относят модели, инвариантные относительно времени. Динамические модели не только допускают изменение параметров и структур во времени, но и служат для описания изменения процессов и моделей именно во времени. Примерами таких моделей в ГИС могут служить два вида электронных карт: электронные карты в режиме разделения времени (электронные атласы) - статическая модель, электронные карты в реальном масштабе времени (навигационные системы) - динамическая модель.
Следует подчеркнуть, что понятие изменчивости моделей данных в ГИС относительно, так как вся информация носит пространственно-временной характер и через какое - то время требует обновления. Поэтому, применяя понятия статические и динамические модели, необходимо указывать период времени, который используется при анализе геоинформационных данных, или определять альтернативную модель при сравнении с исходной.
Любая модель данных должна в разной степени обладать двумя этими свойствами. Динамика моделей определяет их возможный переход Друг в друга. Она позволяет связывать модель со множеством правил порождения и множеством операций.
Агрегация (взаимосвязь). Отдельные части модели образуют ее структуру. Одним из основных способов структуризации данных является абстракция, используемая как для образования категорий данных, так и для построения одних категорий на основе других.
Представление моделей. Выделяют табличные и графовые формы представления моделей.
Табличная форма дает представление модели или ее характеристик в виде одной или совокупности взаимосвязанных таблиц. При этом данные в ячейках таблицы не могут заноситься произвольно, они подчиняются определенным правилам, в частности, по столбцам располагают типизированные данные. Примером табличного представления модели кроме таблицы может служить логическая запись (см. рис 3.4, 3.5), которая представляет собой верхнюю строку таблицы.
Графовая форма основана на построении модели в виде графической схемы, называемой графом. Эта схема включает элементы графа, называемые вершинами (узлами) и ребрами (дугами). В отличие от произвольно нарисованной схемы графовая модель, как и табличная, строится по определенным правилам. В частности, каждое ребро может быть ориентировано, если определен путь от одной вершины к другой, и не ориентировано, что соответствует возможному пути от одной вершины к другой в обоих направлениях. Простейший пример ориентированного графа - вектор в трехмерном пространстве, а неориентированного графа - кривая пути из одной точки в другую. Кроме вершин и ребер существуют другие элементы, значение которых не столь существенно.
Некоторые специалисты в области моделирования данных заменяют термины вершина и ребро терминами узел и дуга. При анализе графовых форм применительно к моделям данных в ГИС эти термины следует считать взаимно заменяемыми.
Форма отображения объекта в модель. Этот аспект рассмотрения определяет дискретную и аналоговую модели. Примерами таких моделей в ГИС могут служить обычная (аналоговая) карта и цифровая карта.
Аналоговые модели в свою очередь разбиваются на две группы: прямой и косвенной аналогии. Модели прямой аналогии создаются на основе физического моделирования (аналоговые карты, модели судов, самолетов, гидротехнические сооружения и т.п.), модели косвенной аналогии - на основе математического моделирования (аналитического описания), например, цифровая модель рельефа, построенная на основе аналитического описания поверхности.
Дискретные модели строятся путем замены непрерывных функций набором дискретных значений аргументов и функций. Дискретность определяется шагом квантования. Для сохранения информативности дискретной модели по отношению к объекту шаг квантования должен выбираться с учетом теоремы Шенона - Котельникова. Примером дискретных моделей являются большинство цифровых моделей, на основе которых впоследствии осуществляется аналоговое представление информации ГИС.