1. оценка деятельно техно природных систем

Вид материалаДокументы

Содержание


Числовые оценки вариантов планового расположения участков
4. Геоинформационно-аналитические технологии комплексного природно - хозяйственного районирования территории региона
Подобный материал:
1   2   3   4   5   6   7   8   9

Числовые оценки вариантов планового расположения участков





Участки орошения

1

2

3

Варианты размещения

1

2

3

1

2

1

2

Обобщенные оценки

0.402

0.323

0.275

0.515

0.485

0.501

0.499



Величины интервалов изменения для каждого х`k принимались равными оценкам соответствия i-го варианта размещения участка орошения эколого-хозяйственными требованиям, т.е. равными значениям х`ki. Далее с помощью метода ЛП-поиска было сгенерировано заданное число репрезентативных возможных вариантов планового расположения комплекса орошаемых участков, среди которых были выбраны наилучшие варианты эколлго-хозяйственных решений. На рис.3.3. показаны первые пять ЛП-точек в двумерном единичном кубе. Они имеют следующие координаты: (0,0); (0.5,0.5); (0.25,0.75); (0.75,0.25); (0.125,0.625). Из пяти возможных вариантов три принадлежат допустимому множеству (допустимые комбинации элементов морфологической таблицы комплекса орошаемых участков показаны линиями на рис.3.3.).


4. ГЕОИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЕ ТЕХНОЛОГИИ КОМПЛЕКСНОГО ПРИРОДНО - ХОЗЯЙСТВЕННОГО РАЙОНИРОВАНИЯ ТЕРРИТОРИИ РЕГИОНА


4.1. Геоинформационно - аналитический подход к построению эколого –хозяйственного «портрета» территории региона


Отличительной особенностью рассматриваемых задач комплексного районирования территории региона является необходимость одновременного учета при выделении классов объектов районирования (ОР) большого числа взаимосвязанных, неравноценных и измеренных в различных шкалах природно-хозяйственных показателей (ПХП). Причем, объекты, образующие один класс (район), могут не иметь смежных границ. Результаты районирования позволяют рассматривать ОР, попавшие в один класс, с единой точки зрения и проводить в их отношении одинаковую стратегию мониторинга, контроля и управления земельными ресурсами в регионе. Для решения задач комплексного районирования совместно используются неформальные процедуры типологизации (метод ведущего фактора, метод наложения и др.) и методы анализа природно-хозяйственных данных (методы распознавания образов, кластер - анализа и многомерного шкалирования), которые реализуются с помощью геоинформационно - аналитических технологий (ГИАС - технологий).

Рассмотрим методологические особенности комплексного природно-хозяйственного районирования на основе типологизации и многомерной классификации геообъектов.

Основная трудность подготовки и принятия обоснованных эколого-экономических решений по управлению территориальными ресурсами в регионе связана с ограниченными психофизиологическими возможностями человека по переработке и анализу большого объема разнородной информации. В связи с этим для систематизации и агрегирования геоданных при построении комплексных тематических карт состояния природно-антропогенных ландшафтов предлагается использовать геоинформационо-аналитический подход [Жердев В.Н., Постолов В.Д., 1994, с.2-4.; Жердев В.Н., Русинов П.С., Умывакин В.М. и др., 1999,- с.25-28; Рекс Л.М., Руссман И.Б., Умывакин В.М., 1989. - 29 с.; 90 Руссман И.Б., Умывакин В.М., 1984, - с.67-70.]. Его основные технологические этапы приведены на рис.4.1. Данный подход реализует принцип комплексности ландшафтного районирования, который "требует, чтобы при районировании территории и разделении ее на физико-географические единицы учитывалось сходство и различие всех компонентов, входящих в ландшафтный комплекс" [Мильков Ф.Н., 1960, с.101].

1. Разработка семантической модели природно-хозяйственных данных




2. Типологизация и построение многомерной классификации ОР

2.1. Сбор исходных природно-хозяйственных данных

2.1.1. Задание совокупности ОР

2.1.2. Выбор перечня ПХП, характеризующих ОР

2.1.3. Формирование матрицы исходных данных

2.2. Определение весовых коэффициентов ПХП

2.3. Выбор способа нормировки исходных геоданных

2.4. Выбор вида меры сходства/различия между ОР

2.3. Программная реализация методов анализа данных

2.2.2. Выделение классов ОР

2.2.3. Получение визуального представления совокупности ОР




3. Содержательный анализ и интерпретация результатов многомерной классификации

3.1. Уточнение состава и границ классов ОР

3.2. Описание классов на языке исходных показателей ОР

3.3. Интерпретация обобщенных показателей ОР и описание классов на их языке

3.4. Образование и формулировка названий классов ОР

3.5. Образование районов(подрайонов) и составление легенды комплексной тематической карты состояния земель в регионе




4. Построение электронной комплексной тематической карты

Рис. 4.1. Основные этапы комплексного природно-хозяйственного районирования территории региона


В дальнейшем мы будем использовать терминологию, приведенную в Перечне основных понятий и определений и ориентированную на геоинформационно-аналитический подход к комплексному природно-хозяйственному районированию территории региона [Жердев В.Н., Русинов П.С., Умывакин В.М. и др., 1999, с.25-28].

С точки зрения теории анализа данных [Айвазян С.А., Бухштабер В.М., Енюков И.С. и др., 1989. - 607 с.; Миркин Б.Г., 1974. - 256 с.], задачи комплексного районирования являются задачами многомерной классификации (задачами таксономии, кластер-анализа, распознавания образов "без учителя") [Дуда Р., Харт П., 1976. - 511 с.; Дюран Б., Оделл П., 1977. – 128 с.; Елисеева И.И., Рукавишников В.О., 1977.–144с.] и многомерного шкалирования [Терехина А.Ю., 1986. - 168 с.]). Априорный анализ содержательных представлений о типе объектов районирования актуализирует следующие задачи: выбор адекватного исходного описания геообъектов; выбор адекватных математических моделей и методов классификации; содержательный анализ и интерпретацию результатов классификации.

Одним из основных принципов классификации геообъектов является принцип соответствия используемого формализма (классификационных моделей) содержательному характеру задач комплексного районирования. В зависимости от числа исходных ПХП анализируемых геообъектов в задачах районирования различают одномерную и многомерную классификации [Тикунов В.С., 1997. - 367с.; Трофимов А.М., Заботин Я.И., Панасюк М.В., и др., 1985. - 119с.].

Рассмотрим традиционные (классические) методы природно-хозяйственного районирования территории региона. В качестве примера процедуры одномерной классификации (типологизации) может быть приведен метод ведущего фактора [Мильков Ф.Н., 1960. - 271 с., с.91] - традиционный метод районирования, "рекомендующий учитывать в первую очередь основной, ведущий фактор, определяющий в значительной мере все другие компоненты географического комплекса". Методу ведущего фактора соответствует типологическое районирование, т.е. процедура разбиения классифицируемых ОР на типы (классы более высокого таксономического ранга).

Кратко остановимся на традиционном подходе к построению многомерной классификации геообъектов, который основан на определенной последовательности одномерных классификаций-типологизаций. При этом сначала осуществляется типологическая группировка ОР отдельно по каждому ПХП (на языке геоинформационных технологий создается отдельный тематический слой), а затем формируются группы (типы) геообъектов путем последовательного наложения соответствующих одномерных классификаций (тематических слоев). Очевидно, что такая многомерная классификация (комплексное районирование) осуществляется классическими методами наложения (сопоставления контуров) частных видов районирования (геоморфологического, почвенного и др.). При этом "линии совпадения или близкого расположения границ частных видов районирования принимаются за границы географических комплексов", что "позволяет охватывать все наиболее существенные черты и особенности ландшафта территориальных единиц" и что делает методы наложения "необходимым, первоначальным этапом всякого физико-географического районирования" [Кини Р.П., Райфа Х., 1981. - с. 92].

Таким образом, традиционные приемы районирования - "наложение схем покомпонентного районирования, ведущего фактора, сопряженного анализа компонентов, генетический позволяют решать многие вопросы, связанные с изучением бесконечного разнообразия природно-территориальных объектов. Но при современном развитии науки и техники не всегда обеспечивает достижение удовлетворительных результатов, а порою даже способствуют приему субъективных решений" [Трофимов А.М. и др., 1985, с. 28].

На языке теории классификации [Айвазян С.А., Бухштабер В.М., Енюков И.С. и др., 1989. - 607 с.; Типология и классификация в социологических исследованиях.,1982. - 296 с.] традиционные методы районирования реализуются путем последовательного наложения одномерных типологических группировок по отдельным (частным) ПХП объектов районирования. При этом ОР, отнесенные в один тип (район определенного таксономического ранга), характеризуются тем, что их нечисловые показатели принимают одинаковые значения, а количественные - из определенного интервала их диапазона изменения (рис.4.2.). Данному способу многомерной классификации ОР с геоинформационной точки зрения [Кошкарев А.В., Тикунов В.С., 1993. - 213с.] соответствуют тематические карты состояния территории, полученные на основе операции оверлейного покрытия тематических карт (слоев) - картографических результатов частных видов районирования.


Рис.4.2. Морфологическая таблица природно-хозяйственных условий
и возможный тип (район)


- элементы МТ, соответствующие значениям нечисловых ПХП

- элементы МТ, соответствующие интервалам количественных ПХП


Основным ограничением широкого практического применения методов типологизации (качественных методов классификации) в задачах комплексного районирования является предположение о независимости ведущих ПХП. Традиционный способ районирования связан с многоаспектной типологизацией геообъектов, которую можно описать на языке морфологического анализа сложных систем [Одрин В.М., Картавов С.С., 1977. – 148 с.]. Данный метод описан в подразделе 3.2. Он обеспечивает развернутое наглядно-обозримое представление различных типов (районов) в результате построения морфологических таблиц природно-хозяйственных условий исследуемой территории [И.Б.Руссман, В.М.Умывакин, 1985. - 105 с.]. Морфологические таблицы (МТ) являются неформальными классификационными моделями (см. рис.4.2.). Их уровням (частным тематическим картам) соответствуют существенные нечисловые или количественные ПХП. Анализируемые ПХП не должны находиться в иерархической зависимости друг от друга.

Каждому уровню МТ (показателю) сопоставляется определенное число ее элементов – возможных значений нечисловых ПХП или интервалов диапазона изменения количественных. Элементы уровней МТ задают соответствующие частные виды типологического районирования территории или отдельные одномерные типологические группировки геообъектов. Выделение природно-хозяйственных районов (типов геообъектов) осуществляется путем последовательного объединения (комбинации, сочетания) отдельных элементов различных уровней МТ (последовательного наложения одномерных группировок или тематических слоев). Такая "цепочка" элементов (по одному с каждого уровня) МТ должна соответствовать понятию "природно-хозяйственный район" и обеспечивать его развернутое (многоаспектное) описание на языке существенных ПХП.

Второй подход к многомерной классификации геообъектов основан на построении количественного комплексного измерителя их сходства/различия по всему комплексу исходных ПХП и применении методов таксономии, кластер-анализа и распознавания образов без учителя [Дуда Р., Харт П., 1976. - 511 с.; Дюран Б., Оделл П., 1977. – 128 с.; Елисеева И.И., Рукавишников В.О., 1977.–144с.]. Эти методы анализа геоданных позволяют в полном объеме реализовать принцип комплексности природно-хозяйственного районирования. В рамках данного подхода основное внимание уделяется методам кластер-анализа и распознавания образов, которые применимы в том случае, когда отсутствует обучающая выборка, т.е. когда нет описания классов геообъектов на языке эталонов или их описания на языке вероятностных распределений ПХП.

В основе третьего подхода к многомерной классификации лежит предположение, что может быть осуществлен предварительный переход к одному или нескольким "новым", обобщенным ПХП геообъектов (например, полученных с помощью методов главных компонент [Айвазян С.А., Бухштабер В.М., Енюков И.С. и др., 1989. - 607 с.], многомерного шкалирования [Терехина А.Ю., 1986. - 168 с.], и др.) в результате агрегирования взаимосвязанных исходных ПХП. Методологическая особенность данного подхода заключается в том, что выделение и описание классов геообъектов производится на языке одного или небольшого числа синтезированных обобщенных ПХП - своего рода ведущих природно-хозяйственных факторов. Это позволяет снизить размерность исходного пространства ПХП геообъектов до визульного представления, т.е. представить анализируемые природно-хозяйственные данные в наглядно-обозримой форме и, следовательно, активно использовать ГИС – технологии. Подчеркнем, что человек гораздо легче воспринимает графическую информацию, чем аналитическую.

Все вышеизложенное позволяет сделать вывод, что комплексное природно-хозяйственное районирование (построение многомерной классификации и визуальное представление геообъектов) на основе геоинформационно-аналитического подхода необходимо осуществлять в две стадии [Жердев В.Н., Русинов П.С., Умывакин В.М. и др., 1999, - с.25-28.].

На первой стадии осуществляется выделение районов (типов геообъектов) определенного таксономического ранга с помощью традиционных методов районирования (метода ведущих факторов и метода наложения) и метода морфологического анализа природно-хозяйственных условий территории. Как отмечалось выше, данная процедура базируется на последовательности одномерных типологических группировок, задаваемых наиболее существенными ПХП (ведущими факторами) и позволяет реализовать принцип соотношения и сочетаемости. При этом выделение потенциальных районов (типов) и их содержательная характеристика осуществляется с помощью анализа морфологических таблиц природно-хозяйственных условий. На данном этапе могут активно использоваться современные ГИС-технологии для выполнения операций покрытия (наложения) соответствующих тематических слоев (карт) и построения электронной "базовой" тематической карты с выделением на ней границ районов "базового" таксономического ранга и границ объектов районирования - элементарных территориальных единиц, соответствующих самому низкому таксономическому рангу.

На второй стадии внутри каждого района (типа) выделяются классы геообъектов - подрайоны (территориальные образования, имеющие более низкий таксономический ранг по отношению к базовому) на основе определения сходства/различия ОР сразу по всему комплексу существенных количественных ПХП. Здесь применяется комплекс методов автоматизированной многомерной классификации и компьютерной визуализации (многомерного шкалирования) [Лотов А.В., Бушенков В.А., Каменев Г.К. и др., 1997. - 239 с.; Терехина А.Ю., 1986. - 168 с.], которые предназначены для выделения из неоднородной совокупности геообъектов наиболее сходных между собой ОР и для отражения существующих различий их природно-хозяйственных условий. Все это позволяет более качественно анализировать внутреннюю структуру геоданных и проводить содержательную интерпретацию результатов многомерной классификации геообъектов, что, в конечном счете, дает возможность повысить обоснованность эколого-экономических решений по рациональному использованию и охране земель в регионе.

При любом районировании на основе классификации геообъектов в явном или неявном виде используется предположение о том, что ОР одного класса более сходны, близки между собой, чем объекты различных классов. Под "близкими" ОР понимаются геообъекты с аналогичными (подобными) природно-хозяйственными условиями. Они характеризуются перечнем исходных ПХП, относительно которых должна быть получена информация, достаточная для описания выделенных классов геообъектов на языке этих признаков. Описание классов может содержать сведения о том, присущи или нет конкретному классу те или другие значения нечисловых ПХП (те или другие признаки качественного характера), а также информацию о минимальных и максимальных значениях, диапазонах изменения ("размахе"), средних значениях, стандартных (среднеквадратических) отклонениях и других описательных (дескриптивных) статистических характеристиках количественных ПХП.

Классификация геообъектов всегда является субъективной и относительной, т.к. она направлена на достижение определенной цели районирования. Данная цель не всегда может быть определена достаточно точно, что обуславливает трудность и неоднозначность формализованного представления сходства между ОР. В связи с этим формулировка конкретных задач многомерной классификации геообъектов зависит от ее цели, а их обоснованное решение можно получить лишь на основе глубокого содержательного (качественного) анализа и интерпретации всей имеющейся (априорной) информации о природно-хозяйственных условиях изучаемой территории и полученной (апостериорной) информации в результате обработки геоданных с помощью математико-географических моделей и методов классификации. Классификационные модели являются дискретными моделями, т.к. в результате их использования генерируется нечисловая информация, т.е. формируются номинальные или ранговые показатели, которые являются дискретными величинами (в отличие от непрерывных, континуальных) и которые могут принимать определенное конечное число значений - наименований классов. Таким образом, результат любого комплексного природно-хозяйственного районирования представляет собой определенный синтетический обобщенный нечисловой показатель, значениями которого для каждого ОР являются названия (наименования) соответствующих классов геообъектов. Отметим, что нечисловая информация является более устойчивой, чем количественная (чем данные, измеренные в количественных шкалах) при комплексном эколого-хозяйственном районировании территории региона.

Качество классификации, т.е. качество разбиения совокупности ОР на однородные классы существенно зависит от выбора перечня (набора) ПХП, который осуществляется, вообще говоря, экспертным путем. Методические аспекты выделения существенных (релевантных с точки зрения основной цели районирования) ПХП на основе построения и анализа иерархических структур природно-хозяйственных условий ОР рассмотрены в разделе 3.1. Однако, число исходных ПХП, характеризующих состояние ОР, может быть достаточно большим. Это затрудняет получение качественной многомерной классификации геообъектов. В такой ситуации в перечень существенных ПХП следует включать лишь те, которые являются слабо коррелированными и наиболее информативными.


4.2. Типологизация и многомерная классификация объектов районирования на основе геоинформационного анализа природно-хозяйственных данных


Предлагаемые геоинформационно-аналитические технологии (ГИАС-технология) построения комплексных тематических карт эколого-хозяйственного состояния земельных ресурсов предусматривают выполнение определенных этапов (см.рис.4.1.).


4.2.1. Семантическая модель и сбор исходных геоданных


Построение семантической модели геоданных задачи комплексного природно-хозяйственного районирования включает: 1) четкую формулировку основной цели и содержательный анализ решаемой задачи комплексного природно-хозяйственного районирования территории; 2) описание и обоснование выбора совокупности ОР с учетом определенного принципа районирования (например, ландшафтно-экологического); 3) описание и обоснование выбора перечня ПХП, характеризующих состояние ОР и соответствующих основной цели районирования.

Элементами семантической модели геоданных являются ОР и их природно-хозяйственные показатели (признаки, факторы). Им соответствуют категории и понятия, обозначаемые терминами и выражениями разработчиков комплексной тематической карты. Элементы семантической модели связаны друг с другом по смыслу (содержанию). Для выделения этих элементов и описания взаимосвязей между ними предлагается использовать иерархические понятийные структуры (иерархии). Так, для обоснованного выбора совокупности ОР рекомендуется строить иерархии с обязательным выделением уровня (таксономического ранга), которому соответствует базовое районирование (например, уровня геолого-геоморфологических районов). Это районирование проводится путем типологизации (выделения типов) геообъектов, в основание которой положены ведущие факторы - определенные качественные характеристики природно-хозяйственных условий территории (например, геоморфологический показатель "тип рельефообразующих пород"). Именно между уровнями иерархической структуры, соответствующими базовому районированию и элементарным геообъектам (ОР), будут находиться искомые синтезируемые природно-хозяйственные районы (подрайоны) определенного таксономического ранга.

Для состояния природно-антропогенных ландшафтов используется конкретный перечень ПХП. В него включаются признаки, наиболее существенные с точки зрения основной цели природно-хозяйственного районирования. Для обоснованного выбора релевантных неравноценных ПХП целесообразно предварительно разработать иерархическую понятийную структуру природно-хозяйственных условий обследуемой территории, а затем определить степень важности (числовые оценки приоритета) и информативность ПХП, находящихся на ее нижнем уровне.

При построении многомерной классификации ОР осуществляют:
1) сбор исходных природно-хозяйственных данных; 2) обработку и анализ геоданных с помощью автоматизированных технологий.

Сбор исходных геоданных включает получение статистической и экспертно-аналитической информации (в результате измерения всех ПХП для каждого ОР), необходимой для программной реализации методов автоматизированной классификации и компьютерной визуализации совокупности геообъектов.

Основным источником исходных геоданных для описания природно-хозяйственных условий территории региона являются геологические, почвенные и другие тематические карты. Каждая из этих карт отражает распределение значений того или иного ПХП в разных точках обследуемой территории. В большинстве практических ситуаций в наборе ПХП имеются как нечисловые показатели (например, для описания геоморфологических условий), так и количественные (например, для описания гидрогеологических условий территории). С помощью геоинформационных систем [4Кошкарев А.В., Тикунов В.С., 1993. - 213с.] природно-хозяйственные данные можно получать с почвенных, гидрогеологических, геоморфологических и других электронных тематических карт, на которых отражено распределение значений соответствующих ПХП по всей территории исследуемого региона.

Основная цель обработки и анализа геоданных при проведении комплексного природно-хозяйственного районирования заключается в построении многомерной классификации ОР (см.рис.4.1.).

Исходные природно-хозяйственные данные представляются в виде прямоугольной таблицы "геообъект-признак" (матрицы исходных данных) Y=||yji||, строки которой соответствуют ОР, а столбцы - характеризующим их ПХП. На пересечении i-й строки и j-го столбца матрицы данных содержится элемент yji - значение j-го ПХП i-го ОР, j=1,2,...,M; i=1,2,...,N. Предполагается, что для каждого ОР известны значения всех ПХП, т.е. матрица данных не имеет "пропусков".

Важнейшим этапом построения многомерной классификации ОР является формирование количественной меры сходства/различия между геообъектами по набору ПХП. Для комплексного районирования с помощью методов автоматизированной классификации и компьютерной визуализации требуются экспертные данные, позволяющие формализовать понятие "подобие" ОР. Для количественной оценки сходства/различия между ОР, которые характеризуются набором неравноценных и разноименных ПХП, требуется: 1) определение набора весовых коэффициентов ПХП; 2) выбор способа нормировки природно-хозяйственных данных; 3) выбор вида меры сходства между ОР.

В каждой конкретной ситуации ПХП геообъектов имеют различную относительную важность. Поэтому для сопоставления ПХП в едином комплексном измерителе сходства между ОР необходимо определить их весовые коэффициенты, которые отражают значимость единичных изменений каждого ПХП при определении меры сходства между ОР. Экспертная информация, необходимая для расчета весовых коэффициентов неравноценных ПХП, задается в виде специальных анкет - матриц парных сравнений An=||ajkn||. Элементами ajk этих матриц являются оценки важности (предпочтительности) j-го ПХП по отношению к k-му ПХП, данные n-м экспертом, j,k=1,2,..,M; n=1,2,..,L. При этом эксперт отвечает на вопрос: "Укажите, какой из двух сравниваемых ПХП важнее с точки зрения основной цели природно-хозяйственного районирования территории региона?"

Разноименные (разнородные) количественные ПХП выражаются в различных системах единиц и имеют существенно различные по порядку числовые значения, что повышает сложность анализа многомерных геоданных. Вопросы измерения признаков подробно рассмотрены в подразделе 2.1. Для сопоставления разнородных ПХП в комплексной мере сходства/различия между ОР производится нормировка геоданных. Для приведения всех ПХП к безразмерной форме, матрицу исходных данных Y=||yji|| нормируют единым способом, например, используя следующие формулы:

y'ji=(yji- yjmin)/( yjmax - yjmin), (4.1)

y'ji = (yji -yj)/j, (4.2)

где y'ji - нормированное значение j-го ПХП i-го ОР;

yjmin, yjmax,yj и j - соответственно минимальное, максимальное, среднее значения и стандартное отклонение j-го ПХП для всей совокупности ОР.

Определение количественной меры сходства ("расстояния") il между i-м и l-м ОР может иметь различный вид. Эта информация представляется в виде матриц расстояний =||il||, i,l=1,2,...,N. На практике часто используются "городская" метрика ("city-block").

il= j |y'ij - y'lj| (4.3)

и евклидова метрика (расстояние)

il=[j (y'ij - y'lj)2] 1/2, (4.4)

j0 - весовые коэффициенты ПХП.

Задание способа нормировки природно-хозяйственных данных и вида меры сходства/различия между ОР осуществляется на основе опроса экспертов и проведения вычислительных экспериментов. Различные варианты схем многомерной классификации целесообразно генерировать с помощью анализа морфологических таблиц, которые, например, могут иметь следующие уровни: "способ нормировки геоданных"; "вид меры сходства"; метод кластер-анализа" и др. Для каждой конкретной программной системы анализа многомерных геоданных можно построить свою морфологическую таблицу и использовать ее для реализации многовариантного подхода к комплексному природно-хозяйственному районированию.

При построении неудовлетворительной многомерной классификации ОР необходима корректировка экспертной информации, получаемой для уточнения перечня исходных ПХП, их перевзвешивания, выбора другого способа нормировки данных, изменения вида меры сходства между геообъектами, уточнения числа выделяемых классов и др.


4.2.2. Методы автоматизированной классификации и компьютерной визуализации объектов районирования


Для многомерной классификации ОР используются процедуры кластер-анализа, распознавания образов и визуализации геоданных (многомерного шкалирования). Совместное применение этих методов позволяет повысить качество результата комплексного природно-хозяйственного районирования территории [Смольянинов В.М., Руссман И.Б., Умывакин В.М., 1978. - С.30-43.; Смольянинов В.М., Руссман И.Б., Умывакин В.М., 1978. - 70 с.], что обеспечивается возможностью проведения более углубленного качественного анализа состава классов и их содержательной интерпретации [Жердев В.Н., Умывакин В.М., 1997, - с.65-69.; Рекс Л.М., Руссман И.Б., Умывакин В.М., 1989. - 29 с.; 84 Рекс Л.М., Русинов П.С., Умывакин В.М., 1999. - 32 с.]. В основе применения методов автоматизированной классификации и компьютерной визуализации лежат некоторые гипотезы о внутренней структуре геоданных - взаимном расположении классифицируемых ОР, которые геометрически интерпретируются как точки в M-мерном пространстве исходных ПХП.

4.2.2.1. Для построения многомерной классификации ОР рекомендуется использовать высокоэффективные методы кластер-анализа
[Дуда Р., Харт П., 1976. - 511 с.; Дюран Б., Оделл П., 1977. – 128 с.; Елисеева И.И., Рукавишников В.О., 1977.–144с.], основанные на гипотезе «связности» и использующие язык и понятия теории графов [Zahn C.T., 1971, P.68-86.]. Их применение особенно целесообразно в тех случаях, когда классы "вытянуты" (группа объектов-точек образует "цепочку") или имеют вытянутые "отростки" ("звездочки"). К таким методам кластер-анализа относятся методы восходящей (агломеративной) иерахической классификации [Айвазян С.А., Бухштабер В.М., Енюков И.С. и др., 1989. - 607 с.] и классификации по дереву кратчайших расстояний [И.Б.Руссман, В.М.Умывакин, 1985. - 105 с.; Рекс Л.М., Руссман И.Б., Умывакин В.М. и др. , 1995, - с.136-181.].

Приведем формальную постановку задачи кластер-анализа [Дуда Р., Харт П., 1976. - 511 с.]. Пусть задано конечное множество =1, 2,..., N из N объектов районирования, каждый из которых описывается фиксированным набором M количественных признаков yj, j=1,2,...,M. Предположим, что для каждой пары из i-го и l-го ОР можно вычислить некоторую числовую величину ("расстояние") il, характеризующую сходство между ними по всему комплексу ПХП, i,l=1,2,...,К. Содержательный смысл такого понимания сходства означает, что ОР тем более близки между собой в рассматриваемом аспекте, чем меньше различий между значениями одноименных ПХП. В задачах кластер-анализа требуется среди всевозможных разбиений множества  на подмножества (кластеры, классы) m выбрать такое, в котором сходство ОР внутри классов было бы как можно больше, а между классами - как можно меньше (m=1,2,...,L). Причем, каждый ОР должен принадлежать только одному какому-то классу.

Введем некоторые определения теории графов. Графом G=(Z,V) называется множество Z вершин графа (соответствующих ОР) и совокупность V ребер графа (отображающих взаимосвязи между ОР). Цепью называется последовательность ребер графа. Под связным графом понимается граф, любые две вершины которого можно соединить цепью. Циклом называется конечная цепь, у которой начальная и конечная вершины совпадают. Наконец, деревом кратчайших расстояний (ДКР) называется конечный граф без циклов с наименьшей суммой длин ребер (расстояний) между вершинами. Длины ребер ДКР характеризуют степень сходства анализируемых ОР по комплексу ПХП.

В методе классификации по ДКР используется следующие понятие класса: для произвольно выбранного ОР из некоторого класса найдется хотя бы один ОР из этого же класса, сходство с которым больше, чем с любым ОР из другого класса. Для иллюстрации принципа "ближайшего соседа", на котором основан данный метод, рассмотрим рис.4.3. Принадлежность к одному классу точек (ОР) 1 и 2, 3 и 4 объясняется тем, что из точки 1(3) возможен "непрерывный" переход по точкам этого класса в точку 2(4). Очевидно, что группы точек на рис.4.3. соответствуют вышеприведенному понятию класса.

Построение ДКР осуществляется на основе матрицы P=||il|| "расстояний" между ОР (см. рис.4.3.). Сначала берется произвольный геообъект (изолированная вершина ДКР ) и для него ищется ближайший сосед в смысле введенной меры сходства il. Изолированная вершина - это вершина, которая на данном этапе построения ДКР еще не связана с другими вершинами. "Ближайшим соседом" вершины ДКР является вершина, которая находится от этой вершины на расстоянии не большем, чем любая другая.

Далее определяется ОР, который является "ближайшим соседом" к полученной паре (фрагменту ДКР), т.е. наиболее сходным с первым или вторым и т.д. Здесь под фрагментом понимается подмножество вершин ДКР, каждая из которых связана с остальными хотя бы одним ребром.


Рис.4.3. Классификация геообъектов по дереву кратчайших расстояний в двумерном пространстве исходных признаков y1 и y2


Сформулируем два основных принципа построения ДКР: 1) всякая изолированная вершина ДКР соединяется с "ближайшим соседом";
2) всякий изолированный фрагмент соединяется с "ближайшим соседом" кратчайшим ребром. После построения ДКР выделяются классы ОР, находящихся на наибольшем расстоянии друг от друга. По определению ДКР, его последовательный разрез по (L-1) ребрам максимальной длины ведет к образованию L различных классов. Метод классификации по ДКР позволяет производить разбиение ОР как на заданное, так и на "естественное" число классов. Отметим, что при классификации геообъектов по ДКР для идентификации (отнесения в один из классов ОР с известным описанием) новых геообъектов достаточно воспользоваться принципом "ближайшего соседа".

Для оценки качества разбиения совокупности ОР на классы наиболее важными критериями являются максимальное (среднее) внутриклассовое расстояние в и минимальное (среднее) расстояние между классами к. Эти показатели позволяют учесть основные требования к качеству классификации ОР. Можно считать, что получено удовлетворительное разбиение, если в<к. В работе [ Рожков В.А., 1981, - с. 39-46.] проведена оценка качества шести известных методов кластер-анализа, которые использовались для обработки одного и того же материала, на основе критерия ККI=к-в. Наилучшие результаты при этом получены с помощью метода многомерной классификации, основанного на гипотезе "связности".

При разбиении множества ОР на однородные классы с помощью метода классификации по дереву кратчайших расстояний можно получить как "плотные", так и "редкие", удлиненные классы. Это не всегда соответствует экспертному представлению о сходстве анализируемых геообъектов. Сложность, неоднородность структуры природно-антропогенных ландшафтов проявляется в том, что геообъекты, принадлежащие к одному типу, в разной мере обладают присущими ему свойствами. Поэтому при выделении типов (классов) геообъектов следует учитывать наличие "ядра" типа и окружающих его объектов. Ядро типа представляет такую группу объектов, для которых имеет место концентрированное выражение всех специфических свойств типа, отличающих данный тип от всех других.

Современные подходы к их типологии (районированию), должны отражать ту их специфику, что классифицируемые ОР, принадлежащие одному из типов (районов), могут иметь и такие особенности, которые характерны и для других типов. Так, естественным является наличие "промежуточных" геообъектов, характеризующих "плавный" переход от одного типа объектов к другому.

Одно из перспективных направлений развития математико-географическох моделей методов автоматизированной классификации геообъектов связано с использованием теории нечетких (расплывчатых) множеств [Орловский С.А., 1981. - 206 с.; Zadeh L.A., 1965, p. 338-353.]. Как отмечает ее основатель Л.Заде, "глубинная связь между теорией расплывчатых множеств и распознаванием образов основана на том обстоятельстве, что большинство реальных классов размыты по своей природе в том смысле, что переход от принадлежности к непринадлежности для этих классов скорее постепенен, чем скачкообразен" [Заде Л.А., 1980, с.208]. Он понимает под нечеткими множествами классы "элементов" (некоторые подмножества всего множества геообъектов), "в которых нельзя указать резкую границу, отделяющую элементы, принадлежащие к данному классу, и элементы, не принадлежащие к нему" [Беллман Р., Заде Л., 1976, - с.172-173]. Например, нечетким множеством является класс эродированных земель.

Предположим, что плотность распределения ОР в пространстве исходных ПХП является мультимодальной (рис.4.4.). В этом случае она имеет несколько максимумов, которым соответствуют модальные точки (типичные геообъекты). В такой ситуации целесообразно использовать методы автоматизированной классификации (распознавания образов "без учителя"), основанные на гипотезе "модальности" [Елисеева И.И., Рукавишников В.О., 1977.–144с.]. К ним относятся методы классификации в нечетких множествах [Елисеева И.И., Рукавишников В.О., 1977.–144с.; Dunn L.R., 1974. - P.32-57; Gains B., 1978. P.154-169; Gitman I., Levine M.D., 1970. - P.583-593].