МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ КАРАЧАЕВО-ЧЕРКЕССКАЯ ГОСУДАРСТВЕННАЯ ТЕХНОЛОГИЧЕСКАЯ АКАДЕМИЯ
На правах рукописи
Темирова Лилия Гумаровна ДВУХУРОВНЕВОЕ МОДЕЛИРОВАНИЕ ДИСКРЕТНЫХ
ЭВОЛЮЦИОННЫХ ПРОЦЕССОВ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ 05.13.18. - математическое моделирование, численные методы и комплексы программ Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель доктор физ.-мат.наук, профессор В.А.Перепелица Ставрополь - 2004 2 СОДЕРЖАНИЕ стр ВВЕДЕНИЕ ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ ГЛАВА 1. СОДЕРЖАТЕЛЬНАЯ ФОРМУЛИРОВКА ИССЛЕДУЕМЫХ ЗАДАЧ ЗЕМЛЕПОЛЬЗОВАНИЯ В КОНТЕКСТЕ 2-УРОВНЕВОГО МОДЕЛИРОВАНИЯ ЕЕ 1.1. Актуальность 2-уровневого моделирования ЕЕЕЕЕЕЕЕЕ 1.1.1. Фундаментальная научная проблема ЕЕЕЕЕЕЕЕЕЕ 1.1.2. Предлагаемые методы и подходы ЕЕЕЕЕЕЕЕЕЕЕ.. 1.1.3. Современное состояние науки в данной области исследованияЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 1.2. Содержательное описание проблемы моделирования задач землепользования ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 1.3. Необходимость многокритериального подхода ЕЕЕЕЕЕЕЕ ГЛАВА 2. КЛЕТОЧНО-АВТОМАТНАЯ ПРОГНОЗНАЯ МОДЕЛЬ ДЛЯ НИЖНЕГО УРОВНЯ ЕЕЕЕЕЕ...ЕЕ 2.1. Необходимость разработки новых методов прогнозирования ЕЕ 2.2. Алгоритм R/S- анализаЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ. 2.3. Содержательная и качественная интерпретация результатов работы алгоритма R/S- анализа ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ. 2.4. Фрактальный анализ временного ряда озимой пшеницы по КБР за период с 1952 по 2002 гЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 2.5. Инструментарий фазовых портретов для выявления циклов временного ряда и уточнения прогноза ЕЕЕЕЕЕЕЕЕ.ЕЕЕ 2.6. Математический инструментарий линейных клеточных автоматовЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.. 2.7. Прогнозная модель урожайности на базе клеточных автоматов и нечетких множеств, на примере анализа и прогнозирования урожайности озимой пшеницы по КБР на 2003 год ЕЕЕЕЕЕЕ. 2.7.1. Преобразование числового временного ряда в лингвисти57 55 49 45 41 29 32 38 38 40 28 5 25 25 25 ческий временной ряд ЕЕЕЕЕЕЕЕЕЕЕЕЕЕ. 2.7.2. Частотный анализ памяти лингвистического временного ряда ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 2.7.3. Получение лингвистических прогнозных значений урожайности, верификация и валидация прогнозной моделиЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.. 2.7.4. Получение числового прогноза, и оценка его точностиЕЕ. ГЛАВА 3. ТЕОРЕТИКО-ГРАФОВЫЕ МОДЕЛИ ЗАДАЧ ЗЕМЛЕПОЛЬЗОВАНИЯ С НЕЧЕТКИМИ ДАННЫМИ ЕЕЕ 3.1. Общая постановка дискретной многокритериальной задачи в условиях неопределенностиЕЕЕЕЕЕЕЕЕЕ.ЕЕЕЕЕ.Е. 3.2. Математическая постановка векторной задачи покрытия графа 4циклами (паросочетаниями, звездами)ЕЕЕЕЕЕЕЕЕЕЕ. 3.3. Анализ арифметических операций и отношения предпочтения для задач с нечеткими даннымиЕЕЕЕЕЕЕЕ.ЕЕЕЕЕЕ 3.4. Новые определения операции суммирования и сравнения, адекватные математической модели задачи землепользования с нечеткими даннымиЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.. 3.4.1. Математическая постановка задачиЕЕЕЕЕЕЕЕЕЕ. 3.4.2. Новая операция суммирования нечетких весовЕЕЕЕ 3.4.3. Операция сравнения нечетких весовЕЕЕЕЕЕЕЕЕ.. ГЛАВА 4. ЗАДАЧИ ВЕРХНЕГО УРОВНЯ. ИССЛЕДОВАНИЕ ВЫЧИСИТЕЛЬНОЙ СЛОЖНОСТИ, РАЗРЕШИМОСТИ С ПОМОЩЬЮ АЛГОРИТМОВ ЛИНЕЙНОЙ СВЕРТКИ И АЛГОРТИМЫ ЛИНЕЙНОЙ СВЕРТКИ ДЛЯ ЗАДАЧ ПОКРЫТИЯ ГРАФА 4ЦИКЛАМИ ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.. 4.1. Формулировка интервальной экстремальной задачиЕЕЕ.ЕЕ... 4.2. Аппроксимация интервальной задачи покрытия графа 4-циклами векторной задачейЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 4.3. Исследование разрешимости с помощью алгоритмов линейной свертки критериев задачи с интервальными данными и крите 57 72 76 79 81 87 87 89 100 свертки критериев задачи с интервальными данными и критериями вида MAXSUM ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 4.4. Обоснование свойства полноты задачи покрытия графа 4циклами ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.. 4.5. Исследование вычислительной сложности ЕЕЕЕЕЕЕЕЕ... 4.6. Оценки точности приближенных алгоритмов ЕЕЕЕЕЕЕЕ.. 4.7. Приближенный алгоритм покрытия графа 4-цикламиЕЕЕЕЕ 4.8. Обоснование достаточных условий статистической эффективности алгоритма.. ЕЕЕ.ЕЕ..ЕЕЕЕЕЕЕЕЕЕЕЕЕЕ ЗАКЛЮЧЕНИЕ ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ. ЛИТЕРАТУРА ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ ПРИЛОЖЕНИЯ 129 134 136 117 119 126 127 ВВЕДЕНИЕ Актуальность проблемы. Диссертационная работа посвящена разработке методов математического моделирования дискретных слабо структурированных процессов, для которых характерны множественность критериев, стохастичность, интервальность или нечеткость значений исходных данных. Дальнейшее развитие каждого такого процесса существенным образом зависит от его состояния на предыдущих этапах эволюционирования. Как часть этой проблемы в настоящей работе рассматриваются различные постановки задачи землепользования и предлагается двухуровневый подход к их моделированию. Классический подход к моделированию таких задач оказывается недостаточным по той причине, что представление параметров этих задач четкими числовыми значениями оказывается в принципе неадекватным в силу их слабой структурированности, изменчивости во времени и неопределенности. Например, для выращиваемой в зоне рискового земледелия конкретной культуры можно отнести к неадекватному такое представление ее урожайности, как усреднение ее значения за определенный отрезок времени. Авторская концепция двухуровневого моделирования задач землепользования состоит в том, что исходные данные для многокритериальных задач верхнего уровня должны базироваться на прогнозных данных, получаемых на нижнем уровне моделирования. В свою очередь исходными данными для нижнего уровня служат временные ряды, отражающие эволюцию основных показателей рассматриваемых процессов. Однако к настоящему времени математическое моделирование на нижнем уровне исходных данных (т.е. численных значений параметров, коэффициентов и т.п.) для классических оптимизационных моделей верхнего уровня находится еще в зачаточном состоянии. Вместе с тем уже появилась ясность того, что наиболее подходящим математическим аппаратом для моделирования задач верхнего уровня является инструментарий теории графов. При этом заслуживает внимания тот факт, что к настоящему времени отсутствуют достаточно эффективные, имеющие полиномиальную трудоемкость, алгоритмы практически для всех дискретных экстремальных задач. Поэтому актуальной является разработка малотрудоемких приближенных алгоритмов, которые всегда или почти всегда гарантируют нахождение приемлемых решений.
Цель и задачи диссертационного исследования. Основной целью настоящей работы является разработка (на содержательном примере задач землепользования) двухуровневого подхода к математическому моделированию дискретных эволюционных процессов, числовые параметры которых являются слабо структурированными. Поставленная цель требует решения следующих задач:
- разработка общей структурной схемы двухуровневого моделирования и численных методов его реализации;
- разработка в качестве основной составляющей модели нижнего уровня новых методов прогнозирования эволюционных процессов на базе линейных клеточных автоматов, математического аппарата теории нечетких множеств и инструментария теории детерминированного хаоса;
- осуществление анализа известных теоретико-множественных определений операции суммирования нечетких множеств и вместе с тем представление нового обоснованного определения операций суммирования и сравнения нечетких весов для исследуемой задачи землепользования;
- исследование вычислительной сложности рассматриваемых задач на графах с нечеткими или интервально заданными весами ребер, представляющими урожайность;
- исследование разрешимости с помощью классических подходов (в частности, алгоритмов линейной свертки критериев) рассматриваемых экстремальных задач на графах с интервальными весами;
- разработка малотрудоемких алгоритмов для экстремальных задач покрытия графа типовыми подграфами (паросочетаниями, звездами, 4циклами) и обоснование достаточных условий статистической эффективности предлагаемых алгоритмов. Методы исследования. Для решения поставленных в работе научных задач использованы методы теории алгоритмов с оценками, теории графов, многокритериальной оптимизации, теории вероятностей и математической статистики, теории нечетких множеств и интервального исчисления, методы прогнозирования временных рядов. Достоверность и обоснованность полученных в диссертационной работе теоретических результатов и формулировок обеспечивается корректным применением аппарата теории графов, математического программирования и теории вычислительной сложности алгоритмов, математической статистики, математического аппарата нечеткой и интервальной математики, методов теории детерминированного хаоса. Информационную базу исследования составили аналитические и статистические материалы Госкомстата России, в частности по Ставропольскому краю и Кабардино-Балкарской республике (КБР). Эффективность предложенных методов подтверждается верификацией и валидацией результатов, полученных путем проведения численных расчетов. На защиту выносятся следующие основные положения: 1. Концепция двухуровневого моделирования эволюционных дискретных процессов в условиях многокритериальности и неопределенности данных. 2. Конкретный алгоритм реализации фрактального анализа временных рядов урожайности с целью выявления в них наличия долговременной памяти как предпосылки для построения прогнозной модели. 3. Построенная для нижнего уровня на базе инструментария клеточных автоматов и теории нечетких множеств математическая модель и метод прогнозирования урожайности основных культур, выращиваемых в зонах рискового земледелия. 4. Разработанные для верхнего уровня специальные подходы к моделированию задач землепользования с нечеткими весами, включая обоснование операций суммирования и сравнения, адекватных реальному содержанию задач землепользования. 5. Результаты анализа применимости классических подходов, в частности, алгоритмов линейной свертки критериев к конкретной задаче землепользования, сформулированной как задача покрытия графа 4циклами с интервальными весами. 6. Разработанный для верхнего уровня моделирования задачи землепользования алгоритм отыскания оптимального покрытия графа 4-циклами, включая обоснование достаточных условий его статистической эффективности. Научная новизна. Научную новизну диссертационного исследования содержат следующие положения: 1. Предложен двухуровневый подход к моделированию эволюционных задач землепользования в условиях многокритериальности и неопределенности данных.
2. На базе R/S-анализа разработан и реализован метод фрактального анализа временных рядов с целью выявления в них долговременной памяти и оценки степени применимости инструментария клеточных автоматов и нечетких множеств для построения прогнозной модели. 3. В качестве реализации модели нижнего уровня построена прогнозная модель на базе клеточных автоматов, а также разработаны алгоритмы прогнозирования, валидации и вычисления оценки погрешности результатов. 4. С учетом принципиальной нечеткости исходных данных, получаемых на нижнем уровне, оценена степень пригодности известных теоретикомножественных определений арифметических операций для нечетких множеств и предложены новые способы операций сложения и сравнения, отвечающие содержательному смыслу рассматриваемых задач землепользования. 5. В качестве математической модели для верхнего уровня сформулирована и исследована векторная задача покрытия графа 4-циклами и паросочетаниями. Первая из этих задач исследована для случая интервальных данных: осуществлено ее сведение к 2-критериальной задаче и установлена ее неразрешимость с помощью алгоритмов линейной свертки критериев (АЛСК). 6. В качестве базы для использования АЛСК разработан малотрудоемкий оптимизационный алгоритм покрытия графа 4-циклами и доказаны достаточные условия, при которых он является статистически эффективным. Практическая ценность полученных результатов и их реализация. Практическая значимость результатов исследования заключается в том, что предложенные подходы, математические модели и алгоритмы универсальны и позволяют решать широкий круг агроэкономических задач. Построенные на базе клеточных автоматов модель и метод прогнозирования временных рядов урожайности могут быть использованы всюду, где поведение рассматриваемого эволюционного процесса с памятью не подчиняется нормальному закону. Предложенные методы, методики и алгоритмы моделирования на нижнем уровне были погружены в модельные и реальные экономические процессы и оправдали себя. Их корректность подтверждается расчетами на кон кретных материалах прогнозирования;
оценки точности прогнозирования вычислены в процессе валидации по заказу Министерства сельского хозяйства Ставропольского края;
прогнозное значение урожайности озимой пшеницы за период с 1952 г. по 2002 год уклонялось от реального временного ряда в среднем не более, чем на 10%. Разработанная модель и математический аппарат их количественного анализа и прогнозирования включены в лекционные курсы следующих дисциплин: Теория рисков, Дискретное программирование с нечеткими данными, читаемых на факультете прикладной математики и информатики КЧГТА, а также использованы при выполнении курсовых и дипломных проектов. Апробация работы. Результаты исследования и основные его положения докладывались и обсуждались на заседаниях научно-методического семинара кафедры прикладной математики (КЧГТА, г. Черкесск, 2001-2003 гг.) и получили положительную оценку на следующих конференциях и симпозиумах, проводимых различными академическими учреждениями и высшими учебными заведениями России: - на IV Всероссийском симпозиуме Математическое моделирование и компьютерные технологии (Кисловодск, 2001);
- на Северо-Кавказской региональной научной конференции молодых ученых, аспирантов и студентов ПерспективаЦ2001 (Нальчик, 2001);
- на II Международной конференции Нелокальные краевые задачи и родственные проблемы математической биологии, информатики и физики (Нальчик, 2001);
- на IV научно-практической конференции аспирантов и студентов Региональная экономика управления и права (Черкесск, 2002);
- на Международной школе-семинаре по геометрии и анализу памяти Н.В. Ефимова (Абрау-Дюрсо, база отдыха Ростовского госуниверситета Лиманчик, 2002);
- на Х Международной научно-технической конференции Математические методы и информационные технологии в экономике, социологии и образовании (Пенза, Приволжский Дом знаний, 2002);
- на III Международной конференции Новые технологии в управлении, бизнесе и праве (Невинномысск, 2003г.);
- на VIII Международной конференции серии Нелинейный мир (Астрахань, 2003). Теоретические и практические результаты диссертационной работы использованы при выполнении НИР по гранту РФФИ, проект № 00-01-00652 Математическое моделирование структуры слабо формализованных систем в условиях неопределенности. Публикации. Материалы диссертации опубликованы в 4 научных статьях (из них 2 - в рецензируемых журналах) и в 11 тезисах докладов. Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения, приложений и списка литературы, содержащего 92 наименования. Во введении обосновывается актуальность темы диссертационного исследования, сформулирована цель работы, описана структура и дан краткий обзор работы, изложены основные научные результаты, выносимые на защиту, раскрыта новизна и практическая значимость полученных результатов. В главе 1 дано содержательное описание предложенного двухуровневого подхода к моделированию эволюционных агроэкономических процессов, показатели которых не подчиняются нормальному закону распределения. Математическая модель верхнего уровня - это модель теории оптимизации, на базе которой строится и обосновывается наиболее целесообразное управление рассматриваемым процессом. На нижнем уровне осуществляется моделирование исходных данных для модели верхнего уровня. На верхнем уровне формируются теоретико-графовые модели задач землепользования. В качестве таких постановок рассмотрены задачи покрытия графа 4-циклами, звездами и ребрами. Если задача формулируется на графе G = (V, E ), то ее допустимое решение представляет собой такой остовный подграф x = (V, Ex ), Ex E, в котором каждая компонента связности является соответственно 4-циклом, звездой или ребром. Эти задачи являются многокритериальными, т.е. на множестве допустимых решений (МДР) X = {x} определена векторная целевая функция (ВЦФ) F (x ) = (F1 (x ), F2 (x ),..., FN (x )), состоящая из критериев вида MAXSUM F ( x ) = eE x w (e) max, = 1, N, N1 N и критериев вида MAXMIN F ( x ) = min w (e ) max, = N 1 + 1, N, eE x где w (e ) - веса, приписанные ребрам e E данного графа. Критерии вида MAXSUM представляют собой обычно экономические показатели, а критерии вида MAXMIN - агроэкологические показатели, например, процентное содержание гумуса в почве. ВЦФ F (x ) определяет в МДР X паретовское множество (ПМ) X. Искомым решением векторной N - критериальной задачи является полное множество альтернатив (ПМА) X 0. Термин ПМА означает подмножество X 0 X, удовлетворяющее двум условиям: 10. Мощность X 0 - минимальна;
20. F (X 0 ) = F (X ), где F (X * ) = {F (x ) : x X * } X * X.
~ ~ ~ В главе 2 предлагаются инструментальные и математические методы моделирования временных рядов, которые обладают долговременной памятью и вместе с тем в характере их поведения проявляется хаотичность. Наличие такой памяти исключает независимость наблюдаемых значений элементов временных рядов, что, в свою очередь является причиной неподчинения этих рядов нормальному закону распределения. Этот факт подтверждается также такими результатами статистического анализа, как аномально большие значения коэффициентов эксцесса и асимметрии. С учетом выявленных ситуаций становится неправомерным использование классических методов прогнозирования, которые базируются на вычислении скользящей средней и авторегрессии. В главе осуществлено построение прогнозной модели для нижнего уровня на базе аппарата нечетких множеств и клеточных автоматов. Разработаны и представлены методы и алгоритмы для выявления фундаментальных качественных и системных свойств, а именно: глубина долговременной памяти и ее оценка, мера хаотичности или, наоборот, трендоустойчивости, квазицикличность, самоподобие.
Предлагаемая новая прогнозная модель для временного ряда с памятью состоит из следующих пяти этапов, т.е. отдельных алгоритмов или процедур. Этап 1. Оценка степени прогнозируемости данного семейства временных рядов осуществляется на базе фрактального анализа некоторой выборки из этого семейства. На выходе вычислительного алгоритма фрактального анализа получаются оценки следующих характеристик для рассматриваемых рядов: признаки наличия трендоустойчивости и долговременной памяти, оценка ее глубины;
цвет шума, достаточно удаленный от зоны белого шума. Этап 2. Преобразование данного (исходного) числового временного ряда (ВР) в лингвистический временной ряд (ЛВР) с целью создания базиса памяти клеточного автомата. Для выполнения этапа 2 разработан лалгоритм преобразования ВР в ЛВР. На начальном этапе этого алгоритма формируется терм-множество U = {u} характерных состояний исходного ВР, в частности трехэлементное множество U = {Н, С, В} : u = H - низкая урожайность, u = C - средняя урожайность, u = B - высокая урожайность. Алгоритм пре образования ВР в ЛВР является вполне детерминированным, за исключением процедуры принятия решения о мощности U формируемого терм-множества (экспертная оценка). Этап 3. Алгоритм формирования оперативной памяти клеточного автомата. Эта память может иметь комбинаторное или теоретико-графовое представление. В последнем случае она строится в виде множества 2дольных ориентированных графов, в каждом из которых вершины правой доли взаимнооднозначно представляют собой элементы терм-множества U, а вершины левой доли - фиксированные l - конфигурации;
значения l = 1,2,..., L, где L - глубина памяти ЛВР. Дугам этих орграфов приписаны веса, означающие собой частости переходов заданной конфигурации в соответствующие состояния из U = {u}. Этап 4. Алгоритм формирования прогноза для данного ЛВР ui, i = 1,2,.., n. Алгоритм вычисляет и представляет прогнозируемый элемент u n + в виде нечеткого множества (НМ) U n +1 ( ) = {(u j, j )}, где j - значение функции принадлежности элемента u j U, j = 1,2,..., m, m = U. Поскольку перечень элементов u j U является известным, то формирование прогноза в виде НМ сводится к вычислению значений j, j = 1, m путем суммирования и нормирования весов соответствующих дуг в последовательности орграфов, затребованных из оперативной памяти. По своему содержательному определению эти веса отражают долговременную память о поведении рассматриваемого ЛВР, а затребованная последовательность орграфов определяется завершающим отрезком длины L в рассматриваемом ЛВР. Этап 5. Алгоритм трансформации полученного прогноза в виде нечеткого терм-множества в числовой прогноз. В качестве подходящих числовых значений элементов u j, где u j U, j = 1,2,..., m, выбираются в ВР ближайшие к ним низкие, средние и высокие урожайности, которые затем усредняются. Применяя к полученному нечеткому множеству операцию дефазификации имеем прогнозное значение урожайности в обычном числовом виде. Для проведения валидации, т.е. проверки соответствия полученных на основе модели данных реальному процессу, последовательно рассматриваем лингвистические временные ряды ui, i = 1,2,..., m, m = n r, r = 1, n k, которые получаются путем последовательного удаления из ЛВР последних r его членов. Для каждого фиксированного индекса m строим прогноз терма u m+1, представляемого в виде НТМ U m +1 = {(H ;
H ), (C ;
C ), (B;
B )}. Пусть, в полученном НТМ U m+1, среди чисел H, C, B максимальным является то число , {H, C, B}, у которого индекс совпадает с термом um+1 рассматриваемого ряда. Тогда, говорим, что для рассматриваемого индекса m прогнозная нечеткая модель привела к непротиворечивому прогнозу. В противном случае, говорим о противоречивом прогнозе для терма u m+1. Валидация результатов прогнозирования осуществлена на примере временных рядов урожайности озимой пшеницы по Ставропольскому краю и КБР. Для числового прогноза отклонение от реальных значений в среднем не превысила 10%. В главе 3 сформулирована задача верхнего уровня моделирования, которая представляет собой теоретико-графовую модель задачи землепользования с нечеткими данными.
Для математической постановки задачи землепользования введены следующие обозначения. Считается заданным n -вершинный граф, в котором:
k = 1,2,..., m - индекс, которым занумерованы выращиваемые в хозяйстве культуры;
i = 1,2,..., n - индекс, которым занумерованы засеваемые этими культурами поля;
ck - стоимость единицы k -ой культуры;
si - площадь i -го поля;
d k - директивное ограничение на минимальный объем выхода культуры k ;
G = (V1,V2, E ) - двудольный граф, в котором вершины первой доли V1 = {v1,..., vk,..., vm } перенумерованы индексами культур k = 1,2,..., m, а вершины второй e = (vk, vi ) доли V2 = {v1,..., vi,..., v n } перенумерованы G, индексами полей i = 1,2,..., n ;
E = {e}- множество ребер графа которое содержит ребро тогда и только тогда, когда в прогнозируемом году разрешается за севать культуру k на пахотные угодья поля i. Каждому ребру e E, припиW k,i, представляющий собой нечеткое множество сан вес k k k k w(e ) = W k,i = WH,i ;
H, WCk,i ;
C, WBk,i ;
B {( )( )( )} и являющееся результатом моделиро k k вания на нижнем уровне. Элемент-носитель WHk,i = ck si U H,i ( WCk,i = ck si U C,i, k W Bk,i = c k s i U B,i ) содержательно означает ожидаемый объем выхода продук ции в рублях культуры k с поля i в случае низкого (среднего, высокого) проk k k гнозируемого урожая U H,i (U C,i,U B,i ). В общем случае единицей измерения каждого веса Wk,i, {H, C, B} могут быть рубли, протеиновые единицы и др. Теоретико-графовая постановка сформулированной выше задачи представляет собой задачу покрытия 2-дольного графа G = (V1,V2, E ) звездами. Допустимое решение представляет собой такой его остовный подграф x = (V1, V 2, E x ), E x E, в котором каждая компонента связности представляет k собой звезду x k = ({v k }, V 2k, E xk ), v k V1, V2 V2, E xk E x с центром в опре деленной вершине vk из первой доли V1 и множеством V2k висячих вершин из второй доли V2. На МДР графа G определена целевая функция (ЦФ) F ( x ) max следующим образом. Для каждой пары (v k, vi ), v k V1, vi V2 оп ределен объем W k,i ожидаемого урожая культуры k m на поле i. Допустимым является всякое такое решение x = (V1,V2, E x ), E x = U E xk, для которого выполk = няются неравенства k eE x w(e) d k, k = 1, m ;
X = X (G ) = {x} - множество всех до пустимых решений на графе G. Если целевой функцией (ЦФ) F ( x ) является экономический эффект, то она определяется на МДР X следующим образом: m m (1) F (x ) = c k w(e ) = с k w(e ) max.
k k =1 eE x k = k eE x Задача состоит в том, чтобы найти максимизирующее значение ЦФ (1) решение, т.е. построить и обосновать достаточно эффективный алгоритм нахождения указанного оптимума. При верификации модели возникла проблема адекватного суммирования нечетких весов. Анализ известных теоретикомножественных операций суммирования нечетких множеств показал их несоответствие содержательному смыслу суммирования НВ в ЦФ (1). Этот факт обусловил приведение нового способа суммирования л(+) нечетких весов, основанный на принципе частичной дефазификации. Суть этого суммирования состоит в следующем. Если конкретное допустимое решение x X (G ) состоит из звезд z k = (v k, E k ), vk V1, k = 1, m, то НВ w(z k ) одной k w z k = (+) w(e ) = w z k ;
: W 0, k eE x k звезды z определяется выражением:
() {( ( ) ) } (2) k где значение w (z ) элементов-носителей определяется скалярным суммиk рованием НВ ребер рассматриваемой звезды w (z ) = k eE x w (e ), W 0, k k = 1, m, а функция принадлежности вычисляется операцией дефазифика цией. Причем, терм-множество W 0 является одинаковым для всех звезд, хотя в общем случае не обязательно должно иметь вид W 0 = {H, C, B}. Для определения операции суммирования НВ, относящихся к различk ным культурам k1, k 2 рассматриваются две звезды z1 = z 1 и z 2 = z k2, для ко торых вычислены их НВ согласно принципа частичной дефазификации (2). результирующая сумма (+) нечетких весов этих двух культур представляется в виде нечеткого множества (3) w(z1 ) (+) w(z 2 ) = {((w ( z1 ) + w ( z 2 ));
(w (z1 ) + w (z 2 ))) : W 0 }, где функция принадлежности при этом определяется выражением:
(w (z1 ) (+) w (z 2 )) = L ( z1, z 2 ), N ( z1, z 2 ) (4) в котором L ( z 1, z 2 ) = w ( z1 ) ( z1 ) + w ( z 2 ) ( z 2 ), N ( z1, z 2 ) = w ( z1 ) + w ( z 2 ), W 0.
Математическая постановка рассматриваемой задачи завершается определением бинарной операции сравнения. Практически все известные методы сравнения оперируют исключительно только функциями принадлежности, без учета численных значений элементов-носителей сравниваемых НВ. Такой способ сравнения не соответствует содержательному смыслу задачи землепользования. Предлагаемый в настоящей главе метод упорядочения НВ по предпочтительности базируется на процедуре полной дефазификации. Прежде, чем приводить описание этой процедуры, отмечаются условия, при которых операция сравнения считается определенной. Рассматриваются два допустимых решения x1, x 2 X, на которых ЦФ (1) принимает значения в виде двух НВ F (x j ) = {(w (x j );
(x j ))}, {Н, С, В}, j = 1,2.
(5) Тогда, рассматривая величины w (x j ) и (x j ) в качестве максимизируемых показателей, можно утверждать, что вариант x1 предпочтительнее варианта x 2, если выполняются следующие неравенства w (x1 ) w (x 2 ), (x1 ) ( x 2 ), {Н, С, В}, (6) среди которых хотя бы одно является строгим. В случае невыполнения условия (6) предлагается применить новый способ сравнения двух НВ. Для этого сначала вычисляются величины:
L (x j ) = W w (x ) (x ), j j M (x j ) = W (x ), j N (x j ) = W w (x ), j = 1,2, j а затем и соответствующие им носители и степени принадлежности:
w(x j ) = L (x j ) M (x j ), (x j ) = L (x j ) N (x j ).
j j (7) Пару (w(x );
(x )) условимся называть сверткой нечетких весов. Для операция сравнения интервалов [ (x j ), w(x j )], j = 1,2. При этом границы этих интервалов рассматриваются в качестве максимизируемых показателей.
упорядочения вариантов x j, j = 1,2 по предпочтительности осуществляется Определение 1. Вариант x1 предпочтительнее варианта x2 (эквивалентен варианту x 2 ), или в другой терминологии, x 2 доминируется вариантом x1 (x1 f x2 ), если выполняются неравенства (x1 ) (x2 ), w(x1 ) w(x2 ), среди ко торых хотя бы одно является строгим (равенства (x1 ) = (x2 ), w(x1 ) = w(x2 ) ). Эквивалентность этих вариантов обозначаем через x1 ~ x2. если в паре интервалов [ (x j ), w (x j )], j = 1,2, один из них является строгим включением другого. В главе 4 исследуется разрешимость интервальной задачи покрытия графа 4-циклами с помощью алгоритмов линейной свертки критериев (АЛСК). Предлагается малотрудоемкий алгоритм покрытия графа 4-циклами с оценкой его эффективности. Следует отметить, что интервальные задачи являются крайним случаем неопределенности, т.к. возникают в условиях неточных данных параметров задачи. Вопрос разрешимости интервальной задачи покрытия графа 4циклами с помощью АЛСК до настоящего времени оставался открытым. В главе 4 обосновывается сведение интервальной задачи покрытия графа 4циклами к 2-критериальной и доказывается ее неразрешимость с помощью АЛСК, следовательно, и соответствующей ей интервальной задачи. Алгоритмы линейной свертки критериев являются традиционными методами нахождения парето-оптимальных решений многокритериальных задач. На сегодняшний день построение эффективных АЛСК для многокритериальных задач остается одной из основных проблем оптимизации. Утверждение 1. Для любого вектора Определение 2. Варианты x1 и x 2 являются несравнимыми ( x1 x 2 ), N = = (1, 2,..., N ) : = 1, > 0, = 1,2,...N элемент x *, мак = N симизирующий на МДР X линейную свертку критериев F (x ) = F (x ) це = N левых функций F (x ), = 1,2,..., N, является ПО. Заметим, что АЛСК не всегда гарантируют нахождение всех ПО ~ ~ ~ X. Если ПМ X индивидуальной интервальной задачи и 2-критериальной x * задачи содержит такой элемент x, на котором не достигает максимума зна чение свертки F (x ) ни при каком 2, то эти задачи неразрешимы с помощью АЛСК. Из неразрешимости хотя бы одной индивидуальной задачи вытекает неразрешимость с помощью АЛСК соответствующей массовой задачи. В качестве частного случая задачи на графах с НВ сформулируем интервальную экстремальную задачу на графах. В заданном n - вершинном графе G = (V, E ) каждое ребро e E взвешено интервалом w(e ), т.е. отрезком w(e ) = [w1 (e ), w2 (e )], где w(e1 ) w2 (e ). Подграф x = (V x, E x ), V x V, E x E представляет собой допустимое решение рассматриваемой задачи. Обозначим через X = {x} МДР рассматриваемой задачи, на котором определена интервальная целевая функция (ИЦФ) w( x ) = eE x w(e) max (8) или ИЦФ w(x ) = min w(e ) max.
eE x (9) Значение этих ИЦФ можно получить из свойств операций сложения интервалов и сравнения интервалов, представляющих значение ИЦФ w( x ) = [w1 ( x ), w2 ( x )], где wi ( x ) = eE x w (x ), i = 1,2. Под решением интервальной i задачи понимается такой элемент x X, на котором значение ИЦФ (8) или (9) достигает требуемого экстремума. В случае интервальных весов нахождение оптимума наталкивается на проблему выбора наиболее целесообразного решения из множества несравнимых альтернатив. В связи с этим необходимо ввести отношения предпочтения, эквивалентности и несравнимости. Определение 3. Из двух решений x1 и x 2, x1, x 2 X, x1 предпочтительнее решения x 2 ( x1 f x 2 ), если wi (x1 ) wi (x2 ), i = 1,2, при этом хотя бы одно неравенство является строгим. Решения x1 и x 2 несравнимы ( x1 x 2 ), когда имеет место строгое вложение интервалов ствующие им интервалы w( x1 ) = w(x 2 ). Отношения предпочтения и несравнимости порождают на МДР X паретовское множество (ПМ) (ПО).
w( x1 ) w( x2 ), либо w( x2 ) w( x1 ). Эти решения эквивалентны ( x1 ~ x 2 ), если совпадают соответ ~ X X, состоящее из паретовских оптимумов ~ Определение 4. Для задачи с ИЦФ (8) решение x X называется ПО, x если не существует x * X такого, что x f ~. В качестве искомого решения сформулированной задачи можно рас* сматривать как ПМ X, так и используемое в многокритериальной оптимизации понятие ПМА X 0. Определение 5. ПМА есть подмножество X 0 X минимальной мощности, содержащее по одному представителю на каждое значение w( x ), x X, где w(x ) есть значение ИЦФ (8). Теорема 1. Для всякого n -вершинного графа G ( n кратно 4), интервальная задача покрытия графа 4-циклами с критериями вида MAXSUM неразрешима с помощью АЛСК. В качестве базы для реализации АЛСК предлагается приближенный алгоритм покрытия графа 4-циклами и произведено обоснование его статистической эффективности. Необходимость разработки такого алгоритма обусловлена тем обстоятельством, что для решения рассматриваемых задач верхнего уровня неприменимы какие-либо известные алгоритмы, в том числе и алгоритмы линейного или целочисленного программирования. Указанная неприменимость, в свою очередь, обусловлена тем фактом, что представленное в главе 1 МДР X = {x} невозможно определить системой линейных равенств и неравенств, т.е. невозможно представить в виде многогранника в соответствующем пространстве. Разработанный алгоритм состоит из подготовительного этапа, четырех вычислительных этапов и заключительного этапа формирования результатов. Подготовительный этап заключается в разбиении в данном n - вершинном графе G = (V, E ) множества V на четыре равномощных подмножества Vs мощности Vs = m = n, s = 1,4, ~ ~ ~ в случае, когда n кратно 4 (ребрам e E припиV1,V саны веса w(e) {1,2,....,R}). Далее, для двух пар и V2,V строятся два двудоль ных графа Gst = (Vs,Vt, Est ), 1 s < t 3, где множество Est состоит из всех таких ребер e = (v, v) E, у каждого из которых один конец v Vs, а другой конец v Vt.
Второй этап состоит из двух вычислительных подэтапов.
Работа этих подэтапов заключается в том, что в каждом из двудольных графов G12 и G23 осуществляется нахождение оптимальных совершенных паросочетаний, которые обозначим соответственно через M12 и M 23. Для нахождения каждого из таких паросочетаний M st = {e} можно воспользоваться каким-либо известным алгоритмом (например, венгерским методом или алгоритмом Лоулера). Объединяя паросочетания M12 и M 23, получаем m пар пересекающихся рёбер вида e = (v1, v2 ), e = (v2, v3 ). Такие пары рёбер объединяем в 3 вершинные цепи вида c = [v1, v2, v3 ], множество этих цепей обозначим C = {c}. Третий этап состоит в построении специального двудольного графа D = (V4, B, ) с равномощными долями мощности V4 = B = m. Доля B = {b} со стоит из вершин b B, которые поставлены во взаимнооднозначное соответствие цепям с С. Если ребро 0 = (v0, b) содержится в, то оно определяется следующим образом: ребро 0 = (v0, b) включается в состав тогда и только тогда, когда в исходном графе G = (V, E ) множество E содержит пару рёбер e, следующего вида:
e = (v0, v1 ), e = (v0, v3 ), (10) (11) где v1 и v3 являются висячими вершинами цепи c = [v1, v2, v3 ], поставленной в соответствие вершине b. При этом ребру 0 приписывается вес W (0 ) = w(e) + w(e). Если же пара рёбер e, e, удовлетворяющая указанным условиям (10) и (11) отсутствует в данном графе G, то соответственно ребро 0 не включается во множество. Четвертый вычислительный этап состоит в том, что с помощью соответствующего алгоритма в двудольном графе D = (V, B, ) выделяется оптимальное паросочетание M4 = {}, затем для каждого ребра, принадлежащего выделенному паросочетанию M 4, в графе G выделяется соответствующая ему пара рёбер e и e, которая замыкает соответствующую цепь c = [v1, v 2, v3 ] в 4-вершинный цикл c = [v1, v 0, v3, v 2 ].
Работа алгоритма завершается проверкой, все ли вершины исходного графа G оказались покрытыми выделенными 4-циклами. В случае положи тельного исхода множество выделенных циклов представляется в виде допустимого решения задачи о покрытии графа 4-циклами. Пусть = (n) - сколь угодно медленно растущая функция от n, (n ) 0. (n, R ) = {G}- множество всех n - вершинных графов G = (V, E ), в каждом из которых всякому ребру G (n, R ), eE, приписан вес w(e ) {1,2,3,..., R} ;
R = R(n ). Для всякого n обозначим через (n, R ) подмножество таких графов для каждого из которых определенный алгоритм находит оп (n, R ) (n, R ) тимальное покрытие 4-циклами. Если отношение мощностей при n, то алгоритм называется статистически эффективным. Достаточное условие статистической эффективности предложенного выше алгоритма представляет Теорема 3. При выполнении неравенства ется статистически эффективным. В процессе своей работы алгоритм R2 n 4 ln n + алгоритм явля рассматривает каждое ребро данного графа G = (V, R ) не более нескольких раз, откуда вычислительная сложность его первых трех этапов составляет O ( E ) O (n 2 ). Отсюда вычислительную сложность алгоритма можно оценить через вычислительную сложность четвертого этапа (нахождения совершенного паросочетания):
( ) O(n 2 ) + O(n 3 ) = O(n 3 ).
Основные результаты, полученные в ходе исследований можно представить в виде следующего перечня: 1. Сформулирована авторская концепция двухуровневого моделирования задач землепользования: математическая модель верхнего уровня - это модель теории оптимизации, на базе которой строится и обосновывается наиболее целесообразное управление рассматриваемым процессом;
на нижнем уровне осуществляется моделирование исходных данных для модели верхнего уровня;
исходными данными для нижнего уровня служат временные ряды, отражающие эволюцию основных показателей рассматриваемых эволюционных процессов;
изложена необходимость многокритериального подхода и суть его реализации. 2. На базе инструментария фрактального анализа выявлены такие свойства временных рядов, как долговременная память с оценкой ее глубины, трендоустойчивость, квазицикличность;
для выявления этих свойств разработан метод фазового анализа временных рядов;
на базе инструментария линейных клеточных автоматов и нечетких множеств разработана новая прогнозная модель, включая алгоритмы ее валидации и вычисления оценок точности прогнозирования. 3. В качестве конкретной реализации двухуровневого моделирования представлена математическая постановка экстремальных задач покрытия графа 4-циклами (паросочетаниями, звездами);
показана неприменимость известных в научной литературе определений операций сложения и сравнения нечетких весов;
представлено новое определение операций суммирования и сравнения нечетких весов, которые адекватны рассматриваемым задачам землепользования. 4. Исследована на разрешимость с помощью алгоритмов линейной свертки критериев векторная задача покрытия графа 4-циклами с интервальными весами;
осуществлено ее сведение к 2-критериальной задаче и установлена ее неразрешимость. 5. В качестве базы для использования алгоритма линейной свертки разработан малотрудоемкий алгоритм покрытия графа 4-циклами и доказаны достаточные условия, при которых он является статистически эффективным. Пользуясь возможностью, автор выражает глубокую благодарность своему научному руководителю заведующему кафедрой прикладной математики Карачаево-Черкесской государственной технологической академии, д.ф.-м.н., профессору Виталию Афанасьевичу Перепелице, а также к.ф.-м.н., доценту этой кафедры Тебуевой Фаризе Биляловне за внимание и поддержку в процессе исследований, посвященных данной тематике.
Глава 1. СОДЕРЖАТЕЛЬНАЯ ФОРМУЛИРОВКА ИССЛЕДУЕМЫХ ЗАДАЧ ЗЕМЛЕПОЛЬЗОВАНИЯ В КОНТЕКСТЕ 2-УРОВНЕВОГО МОДЕЛИРОВАНИЯ 1.1. Актуальность 2-уровневого моделирования 1.1.1. Фундаментальная научная проблема Данная научная работа направлена на решение фундаментальной проблемы разработки методов математического моделирования эволюционных дискретных слабо структурированных процессов и систем, для которых характерны множественность критериев, стохастичность, интервальность или нечеткость значений исходных данных и хаотичность структуры связей. Как часть этой проблемы в настоящей диссертационной работе рассматриваются различные постановки задачи землепользования и предлагается двухуровневый подход [18] к их моделированию. Классический подход к моделированию таких задач оказывается недостаточным по той причине, что представление параметров этих задач четкими числовыми значениями оказывается в принципе неадекватным в силу их слабой структурированности, изменчивости во времени и неопределенности. Например, для выращиваемой в зоне рискового земледелия конкретной культуры можно отнести к неадекватному такое представление ее урожайности, как усреднение ее значения за определенный отрезок времени. Математическая модель верхнего уровня - это модель теории оптимизации, на базе которой строится и обосновывается наиболее целесообразное управление рассматриваемой системой или процессом. На нижнем уровне осуществляется моделирование исходных данных для модели верхнего уровня. В свою очередь исходными данными для нижнего уровня служат временные ряды, отражающие эволюцию основных показателей рассматриваемых эволюционных процессов и систем. Учитывая объективно обусловленную слабую структурированность этой эволюции, неподчинение ее нормальному или другим известным законам распределения, автором предусматривается построение для нижнего уровня прогнозной модели на базе аппарата нечетких множеств и клеточных автоматов. Для выявления фундаментальных ка чественных и системных свойств, учитываемых в прогнозной модели, а также для оценки надежности результатов прогнозирования предполагается разработка методов, алгоритмов и программ для оценки глубины долговременной памяти и меры хаотичности или, наоборот, трендоустойчивости, для выявления и обоснования квазициклов, самоподобия и других фрактальных свойств. Предлагаемый автором подход предусматривает системный мониторинг моделируемых процессов и систем с целью формирования временных рядов, отражающих возможно более длительные периоды в области землепользования, точнее, в отрасли растениеводства для проведения верификации и валидации построенных моделей. 1.1.2. Предлагаемые методы и подходы Теоретическое моделирование конкретных эволюционных дискретных процессов и систем с хаотическим поведением, включая прогнозные модели для соответствующих временных рядов, осуществлено с учетом современной методологии исследования слабоформализованных систем в условиях неопределенности. Построение прогнозных моделей осуществлено на базе теории нечетких множеств [2,44] и клеточных автоматов [34,42], а применение методов детерминированного хаоса [72] и фрактального анализа [64] к моделированию дискретных процессов и систем в условиях многокритериальности и нечеткости или интервальности данных [44,1] оправданы тем, что они способствуют выявлению и более глубокому пониманию сложных хаотичных и противоречивых свойств моделируемых объектов. Для задач землепользования [51], выбранных для настоящего исследования, требуются: 1) разработка методологии и конкретных методов использования фрактального анализа с целью выявления наличия системных и фрактальных свойств в структуре или траектории эволюционных объектов (наличие долговременной памяти и оценка ее глубины, наличие трендо устойчивости или, наоборот, признаков хаотичности в характере поведения, наличие квазициклов и др.) [64];
2) разработка методологии и конкретных методов анализа фазовых траекторий [72,79] для выявления цикличности в поведении рассматриваемых временных рядов;
3) разработка конкретных методов построения прогнозных моделей на базе инструментария клеточных автоматов и теории нечетких множеств;
4) разработка методологии и конкретного подхода к созданию 2уровневых математических моделей вида прогнозная модель для формирования исходных данных - математическая модель для оптимального управления эволюционным процессом. Разработка общей концепции иерархического подхода к 2-уровневому моделированию эволюционных процессов и систем, показатели которых представляются временными рядами: нижний уровень - прогнозирование исходных данных для верхнего уровня, верхний уровень - нахождение множества альтернатив, выбор и принятие решения в условиях многокритериальности [35]. В процессе выполнения диссертационной работы осуществлены на базе реальной статистики по отрасли растениеводства Ставропольского края и Кабардино-Балкарской республики (КБР) следующие научно-практические исследования и численные расчеты:
- применение метода фазовых портретов и R/S- анализа для исследования статистических и фрактальных характеристик конкретных временных рядов (ВР), в частности, ВР урожайностей основных (для Ставропольского края и КБР) сельскохозяйственных культур с целью выявления наличия или отсутствия долговременной памяти, трендоустойчивости, циклов или квазициклов, а также для выявления тенденций в поведении эволюционного процесса и оценки применимости предлагаемого математического инструментария для построения прогнозной модели;
- разработка на базе теории нечетких множеств и аппарата клеточных автоматов модели для реального прогнозирования дальнейшего поведения рассматриваемых временных рядов;
- верификация и валидация [36] конкретных прогнозных моделей на базе рассмотренных ВР, в первую очередь ВР урожайностей основных сельскохозяйственных культур для Ставропольского края и КБР. Разработанная математическая модель верхнего уровня базируется на соотношениях задачи о назначениях [70] и моделях управления риском на базе многокритериального подхода [50] в условиях нечетких прогнозных данных. В математический и методологический арсенал предлагаемых методов и подходов включены:
- новые, адекватные рассматриваемым процессам и системам, определения операций суммирования и сравнения нечетких весов;
- аппроксимация моделей с нечеткими данными 2-критериальными моделями на базе операции дефазификации;
- аппроксимация моделей с нечеткими данными моделями с интервальными данными;
исследование разрешимости с помощью алгоритмов линейной свертки интервальных задач;
- обоснование оценок вычислительной сложности линейных задач 2уровневой модели с прогнозными нечеткими данными и с аппроксимирующими интервальными данными. 1.1.3. Современное состояние науки в данной области исследования Огромный опыт математического моделирования динамических (эволюционных процессов, накопленный в мире за последние десятилетия, неизмеримо расширил и во многом изменил установившиеся представления об адекватности существующих математических моделей сути этих процессов. Стало ясно, что классического арсенала математического моделирования, базирующегося на так называемой линейной парадигме (малые возмущения входных данных системы в малой степени меняют ее траекторию), во многих случаях явно недостаточно для построения адекватных математических моделей [64]. Это обстоятельство обусловило фундаментальный пересмотр прежней линейной концепции и переход на так называемую нелинейную парадигму (nonlinear science) [34,64] в математическом моделировании (малые возмущения входных данных или значений переменных динамической системы могут в катастрофически большой степени изменить ее траекторию (в силу сложности самой системы и хаотичности ее поведения)). Практическая ценность указанной парадигмы обусловлена тем, что на ее базе удается более адекватно отражать специфические характеристики иерархичности [18], конкретной динамики [34] и высокую степень неопределенности [2,83], присущие реальным социальным, экономическим, финансовым, физическим и т.п. процессам и системам. Переход на новую концепцию вызвал необходимость создания принципиально новых инструментальных средств математического моделирования, в частности таких, как фрактальная геометрия [80,82], фрактальный анализ [64], методы детерминированного хаоса [34] и др. В разрезе мировой науки математического моделирования этот переход датируется последними двумя десятилетиями. Массовое внимание отечественных исследователей проявилось несколько позже и, соответственно, количество публикаций, посвященных nonlinear science в англоязычных научных изданиях, в десятки, если не в сотни раз превосходят количество публикаций в этом направлении в русскоязычных научных изданиях. Говоря о мировом уровне знаний в этой области, к числу первостепенных можно отнести вопрос создания математических и компьютерных методов получения качественных (асимптотических) свойств из количественных характеристик конечной исходной модели. Причем, речь идет о таких качественных показателях, которые невыводимы прямо из свойств элементов системы или из локальных взаимодействий этих элементов. Тема настоящего диссертационного исследования выбрана в контексте выше названной проблемы.
1.2. Содержательное описание проблемы моделирования задач землепользования Диссертационная работа посвящена математическому моделированию дискретных систем и процессов, дальнейшее развитие которых существенным образом зависит от состояния системы или процесса на предыдущем этапе эволюционирования. Возможно, наиболее актуальные проблемы такого рода возникают в процессе моделирования агро-эколого-экономических систем, когда принятие решений на очередном этапе землепользования кардинальным образом отражается на последующих состояниях моделируемой системы. Можно считать общепризнанным тот факт, что экологический кризис конца двадцатого века сделал, как никогда, актуальными вопросы взаимоотношения человека с окружающей средой. Динамическое ухудшение экологической обстановки, истощение природных ресурсов оказывают самое негативное влияние на организацию сельского хозяйства. На пахотных почвах большинства регионов России происходит устойчивая убыль гумуса, а также катастрофически растет площадь земель, подверженных эрозии [13]. Одной из причин этого состояния является лисчерпанность развития сложившихся современных систем земледелия. Характерными особенностями последних являются:
- распространение однообразия экологических систем;
- нарастание специализации, т.е. стремление к монокультуре;
- упрощение севооборотов, отчуждение с урожаем одних и тех же микроэлементов, т.е. истощение почвы в одностороннем порядке;
- увеличение засоренности посевов по причине узкой специализации;
- нарастание токсикологической нагрузки агросистемы. В свете этих обстоятельств возник социальный заказ на разработку математических моделей агро-эколого-экономических задач землепользования, которые базируются на адекватном отражении взаимоувязанного эффекта, получаемого от агрохимических мероприятий с одной стороны и от ротации (плодосмена) культур на полях с другой стороны. Однако к настоящему времени математическое моделирование такого рода систем находится еще в зачаточном состоянии, хотя уже появилась ясность того, что наиболее подходящим математическим аппаратом для этой цели является инструментарий теории графов [21,43]. Вместе с тем к настоящему времени отсутствуют достаточно эффективные (т.е. имеющие полиномиальную трудоемкость) алгоритмы, практически для всех задач на графах. Поэтому актуальным является разработка малотрудоемких приближенных алгоритмов, которые всегда или почти всегда гарантируют нахождение приемлемых решений. Среди таких приближенных методов особый интерес представляют так называемые статистически эффективные и асимптотически точные алгоритмы. К первым относятся алгоритмы, которые при определенных условиях почти всегда находят асимптотически оптимальные решения. Авторская концепция 2- уровневого моделирования задач землепользования состоит в том, что возникающие экономико-математические задачи должны базироваться на прогнозных данных [73,43], получаемых на нижнем уровне моделирования. При этом целью работы является не только получение возможно более точного прогноза ожидаемой урожайности, но и обеспечение возможно более адекватного отражения хаотической природы моделируемого процесса [64]. Предлагаемая автором прогнозная модель ориентирована на задачу назначения выращиваемых в конкретном хозяйстве культур на конкретные поля. При определении такого назначения преследуется цель - снижение агроэкономического риска за счет возможно более точного прогноза урожайностей следующего года [83]. Основную суть комплекса мероприятий по снижению агро-экономического риска [50], обусловленного погодноклиматическими колебаниями представляют мероприятия определяющие собой следующие задачи верхнего уровня:
- варьирование различных культур и их сортов с учетом ожидаемых в следующем году климатических условий, имея в виду использование в неблагоприятном году наиболее устойчивых, неприхотливых сортов;
- использование так называемой асинхронности урожаев различных культур, имея в виду возможность расширять посевы культуры, для которой прогноз благоприятный, за счет уменьшения площади посева культуры с неблагоприятным прогнозом урожая;
- планирование форвардных и фьючерсных операций межрегионального сотрудничества, заключение торговых соглашений с учетом прогноза урожайности и ожидаемой конъюнктуры рынка. Перечень этих мероприятий по существу определяет собой ситуационный базис для управления агро-экономическим риском. Вместе с тем очевидным является то, что это управление базируется в первую очередь на результатах прогнозной модели. Создание такой модели является актуальной задачей, так как все известные классические методы прогнозирования [73,85] оказываются несостоятельными применительно к прогнозированию сельскохозяйственных культур в зоне рискового земледелия [83]. Построение адекватной прогнозной модели является основной задачей, которая рассматривается в настоящей диссертации при моделировании на нижнем уровне. 1.3. Необходимость многокритериального подхода На современном этапе развития информационных технологий элементы классической теории выбора и принятия решений в той или иной степени реализованы в так называемых корпоративных информационных системах предприятий. Функции и назначения этих систем реализуют процесс принятия решений в самом широком смысле, включая такие операции, как планирование, регулирование, координацию, прогнозирование, корректирование, выработка целей и принятие управленческих решений статистика, анализ и учет. Меньше всего в этих системах представлено собственно математическое моделирование и выбор наиболее целесообразного решения в условиях многокритериальности [65]. В настоящем параграфе предпринята попытка, в основном, изложить концепцию многокритериального подхода. В качестве иллюстративного примера из области землепользования можно говорить о таких трех макро-характеристиках землепользования пахотными угодьями, как состояние плодородие почвы, экологическая оценка почвы и продукции, и экономическая эффективность различных вариантов землепользования. Нетрудно видеть, что каждую из этих макрохарактеристик невозможно адекватно оценить каким-либо одним показателем или критерием качества. Например, плодородие почвы характеризуется такими показателями, как процентное содержание гумуса, удельное количество азота, фосфора, калия и других химических элементов, влажность, комковатость, кислотность и еще ряд других. Из сказанного следует однозначный вывод о том, что сколько-нибудь адекватное агро-эколого-экономикоматематическая модель должна строиться на базе многокритериального подхода. Примечание 1.1. Проблема принятия решений не возникает, например, для задач математического программирования, когда на множестве допустимых решений X = {x} определена единственная целевая функция, т.е. критерий эффективности и все параметры или исходные данные задачи однозначно определены. В этом случае всякий оптимум и представляет собой искомое решение лица, принимающего решение (ЛПР). Заметим, что в процессе оценивания конкурирующих альтернатив исследователь (аналитик, ЛПР) оказывается в ситуации конфликта (столкновения) социальных интересов, житейских обстоятельств, эмоций и т.д., то есть в этот процесс привносятся социально-психологические факторы. От этих факторов, однако, излагаемые ниже математические методы абстрагируются, хотя конечный смысл принятия рационального решения и состоит в замене конфликта компромиссом. Смысл еще одного замечания состоит в том, что универсальных методов принятия решения просто не существует. В рамках теории принятия ре шений [35] развиваются различные подходы или методы человекомашинные, аксиоматические, компенсации и др. Мы рассматриваем наиболее приспособленные для практического использования прямые методы. Суть их в том, что общая (абсолютная или относительная) полезность альтернативы оценивается посредством нескольких функций от численных значений показателей, т.е. критериев, составляющих векторную целевую функцию. Здесь термин функция может означать формулы, таблицы, инструкции или систему правил, с помощью которых альтернативы ранжируются в порядке убывания их полезности. Такие задачи называются многокритериальными или задачами векторной оптимизации. Представим их математическое определение. Через X = {x} обозначим множество допустимых решений (МДР), например, множество всевозможных назначений культур на поля. На МДР X определена векторная целевая функция (ВЦФ). Для определенности считаем, что ВЦФ F ( x ) = ( F1 ( x ), F2 ( x ),..., FN ( x ) ), состоит из минимизируемых или максимизируемых критериев (1.1) F ( x ) extr, = 1, N, extr {min,max}. поводу которых принимается решение. Критерии должны быть:
(1.2) Критерии (1.2) отражают оценки различных качеств объекта или процесса, по 1. Однородными по виду экстремума (либо все критерии минимизируются, либо максимизируются);
2. Соизмеримыми - иметь одну и ту же единицу измерения. Если критерии не удовлетворяют условиям 1 и 2, то осуществляется их нормирование. В результате нормирования получим лоднонаправленность критериев (выполнения условия 1) и соизмеримость, т.е. все критерии приводятся к безразмерному виду, каковы бы ни были единицы измерения значений F (в рублях, процентах, в тысячах штук, в килограммах), что и является выполнением условия 2.
Процесс решения классически сформулированной многокритериальной задачи можно представить в виде двух этапов. На первом этапе осуществляется построение множества Парето. При определении множества Парето для задачи с ВЦФ (1.1)-(1.2) рассмотрим два определения:
Определение 1.1. Пусть ВЦФ в (1.1) состоит только из минимзируе мых критериев F (x ) min, = 1, N. Элемент ~ X называется паретовским x оптимумом (эффективной точкой), если не существует такого элемента x* X, для которого выполняются неравенства F x* F (~ ), = 1,2,..., N, x () (1.3) среди которых хотя бы одно является строгим.
Определение 1.2. Совокупность всех паретовских оптимумов (эффек тивных точек) ~ X называют паретовским множеством (ПМ) и обозначают x через X. Следовательно, можно сказать, что ПМ - это множество эффективных (недоминируемых) точек. Нахождение таких точек, для которых нет доминирующих альтернатив, является первым этапом решения многокритериальной задачи (1)-(2). Второй этап решения многокритериальной задачи заключается в выборе наиболее приемлемой для поставленной цели эффективной точки [18] из полученного ПМ X. Как правило, это осуществляется лицом, принимающим решение.
Примечание 1.2. Если векторная целевая функция (1.1)-(1.2) состоит ~ ~ из максимизирующих критериев F (x ) max, = 1, N, то определение 1.1. полностью остается в силе, за исключением одного: знак в неравенствах (1.3) меняется на противоположный знак в каждом из неравенств.
Примечание 1.3. Практически все известные теории принятия реше ний явно или неявно используют две аксиомы: 1) как аксиому используем принцип Парето, означающий, что при решении всякой конкретной задачи достаточно ограничиться выбором из ПМ X ;
иными словами, никакой элемент x (X \ X ) не может претендовать на роль наилучшего выбора;
2) если ~ ~ пара элементов ~ x, x X эквивалентна по значению ВЦФ (1.1), т.е.
~ F ( x) = F ( x), то полезность x и x также одинакова. Последнее означает, что полезность наилучшего выбора из ПМ X равна полезности наилучшего выбора из множеств X \ {x} или X \ {x}. Из примечания 1.3. вытекает, что для исчерпывающего решения конкретной задачи достаточно получить и рассмотреть ее полное множество альтернатив (ПМА), которое обычно обозначается X 0, X 0 X. Построение ПМА сводится к следующему. Сначала ПМ X разбивается на подмножества элементов, эквивалентных по значению ВЦФ (1.1). Затем из каждого такого подмножества выберем по одному представителю, объединяя которых и образует ПМА. Определяется ПМА неоднозначно, если ПМ содержит хотя бы одну пару эквивалентных элементов. Фактически процесс решения конкретной многокритериальной задачи подразумевает реализацию двух этапов. На первом этапе, используя подходящие алгоритмы математического программирования, исследователь находит ПМА X 0 или, в худшем случае, выделяет из МДР X множество альтернатив (МА) X * X, состоящее из векторно несравнимых, т.е. взаимнонедоминируемых допустимых решений. На втором этапе ЛПР определяет в представленном МА наиболее целесообразное значение. В этом случае принято говорить, что ЛПР решает проблему выбора и принятия решений. Для решения этой проблемы разработан целый ряд подходов [35], среди которых заслуживает внимания так называемое обобщенное решающее правило, представленное в [50].
Примечание 1.4. Многокритериальный подход представляет принци~ ~ ~ ~ пиальную возможность разработки конструктивных методов решения экстремальных задач в условиях неопределенности, когда числовые данные задачи, например веса ребер рассматриваемого графа, являются интервальными [1,27,14] или нечеткими [44,2,24].
Выводы В области дискретных математических моделей и методов выделен класс задач, отражающих специфику слабоформализованных процессов и систем, эволюционирование которых представляется такими временными рядами, которым присуща долговременная память и признаки хаотического поведения. Для обеспечения адекватного моделирования таких задач, автором предлагается 2-уровневый подход к построению соответствующих математических моделей. Математическая модель верхнего уровня - это модель теории оптимизации, на базе которой строится и обосновывается наиболее целесообразное управление рассматриваемой системой или процессом. На нижнем уровне осуществляется моделирование исходных данных для модели верхнего уровня. В свою очередь исходными данными для нижнего уровня служат временные ряды, отражающие эволюцию основных показателей рассматриваемых эволюционных процессов и систем. В качестве конкретного объекта исследования, автором выбрана проблематика землепользования в рамках отрасли растениеводства. С учетом специфики этого объекта автором обосновывается принципиальная необходимость многокритериального подхода при построении соответствующих математических подходов.
Глава 2. КЛЕТОЧНО-АВТОМАТНАЯ ПРОГНОЗНАЯ МОДЕЛЬ ДЛЯ НИЖНЕГО УРОВНЯ 2.1. Необходимость разработки новых методов прогнозирования Можно считать общепризнанным тот факт, что на рубеже 20-го и 21го столетий в мировой науке линейная парадигма сменилась на нелинейную. Краеугольным камнем первой из них являлось допущение о том, что в большей своей части показатели эволюционных экономических процессов и систем подчиняются нормальному закону. Проведенные учеными различных стран в нарастающем количестве экономико-математические исследования с очевидностью говорят о том, что показатели большинства природных и экономических систем не подчиняются нормальному закону или другим известным законам распределениям. Но если экономические показатели не являются нормально распределенными, то тогда множество методов статистического анализа, в частности, такие способы диагностики, как коэффициенты корреляции, t-статистики и др., серьезно подрывают к себе доверие, поскольку могут давать ошибочные результаты. Иными словами, концепция подчинения нормальному закону не отражает действительности, что явилось причиной смены парадигм [64]. Переход на нелинейную парадигму потребовал новых инструментальных и математических методов, в частности, методов детерминированного хаоса [82,88,69,34,66,38]. Одним из эффективных инструментов теории детерминированного хаоса является фрактальный анализ. Фрактальные временные ряды имеют статистическое самоподобие во времени и характеризуются тем, что их вероятностные распределения не подчиняются нормальному закону. Фрактальный временной ряд имеет дробную фрактальную размерность [64]. Метод фрактального анализа базируется на алгоритме R/S - анализа временных рядов. История создания методологии R/S - анализа восходит к середине XX - века, когда гидролог Херст, проработав почти 40 лет над проектом Ниль ской плотины, завершал обработку временных рядов объемов стока рек. Когда Херст решил проверить предположение о том, что эти ряды подчиняются нормальному закону, он в результате дал нам новую статистику - показатель Херста (H). Как оказалось, этот показатель имеет широкое применение в анализе временных рядов благодаря своей замечательной устойчивости. Херст обнаружил, что большинство природных систем не следуют случайному блужданию - гауссовскому, т.е. поведение временных рядов, показателей этих систем, не подчиняется нормальному закону. Этот факт означает непригодность инструментария эконометрики для статистического анализа природных временных рядов. При этом заметим, что достаточно часто параметры и коэффициенты математических моделей реальных задач получаются с помощью инструментария эконометрики. Обзор и краткий анализ существующих к настоящему времени подходов и методов прогнозирования можно найти в учебных пособиях [7,73,85]. Важно отметить, что известные методы прогнозирования базируются либо на корреляционно-регрессионных моделях, либо на трендах, для представления которых выбирается наиболее подходящие экстраполяционные зависимости. Принципиальная особенность классических методов прогнозирования состоит в том, что они требуют подчинения нормальному закону поведения рассматриваемых временных рядов. В реальности ВР многих эволюционных процессов, в особенности тех, которые обладают долговременной памятью, весьма далеки от нормального распределения, т.к. им присущи цикличность, частая смена трендов, сопровождаемая потерей персистентности. Условие подчинения нормальному закону востребовано классическими методами прогнозирования для того, чтобы обеспечить точность прогноза при использовании ими операции скользящего усреднения элементов ВР. Но такого рода усреднение неизбежно приводит к (полной или частичной) потере памяти [64,73] рассматриваемого ВР и, следовательно, к ухудшению надежности прогнозирования ВР с долговременной памятью.
2.2. Алгоритм R/S - анализа Приведем описание алгоритма R/S - анализа в том виде, как он реализуется в современных методах фрактального анализа [64]. Обозначим через Z данный временной ряд (ВР) Z:
z i, i = 1,2,..., n, (2.1) в котором последовательно выделяем его начальные отрезки Z = z1, z 2,..., z, = 3,4,..., n, для каждого из которых вычисляем текущее среднее z = z i = i.
Далее, для каждого = 3,4,..., n вычисляем накопленное отклонение для отрезка ВР длины t : X,t = (z i z ), t = 1,. После чего вычисляем разность t i = между максимальным 1t 1t и минимальным накопленными отклонениями R = R( ) = max ( X,t ) min ( X,t ), которую принято называть термином размах R. Этот размах нормируется, т.е. представляется в виде дроби R S, где S = S ( ) - стандартное отклонение для отрезка ВР Z, 3 n. Показатель Херста H = H ( ), характеризующий фрактальную размерность рассматриваемого ВР, и соответствующий ему цвет шума, получаем из соотношения R S = (a ), H = H ( ) [64]. Логарифмируя обе части этого раH венства и полагая a = 1 2 [5,4], получаем значения ординат H - траектории:
H = H ( ) = log(R( ) S ( )), log( 2) = 3,4,..., n (2.2) Требуемая для фрактального анализа ряда (2.1) R S - траектория представляется в декартовых логарифмических координатах последовательностью точек, абсциссы которых x = log ( 2 ), а ординаты y = log (R ( ) S ( )). Соединяя отрезком соседние точки ( x, y ) и ( x +1, y +1 ), = 3,4,..., n 1, получаем графическое представление R S - траектории в логарифмических координатах.
На рисунке 2.1. представлены R/S- траектория и Н- траектория, полученные в результате применения алгоритма R/S- анализа к временному ряду урожайности озимой пшеницы по Кабардино-Балкарской республике.
1,4 1,2 1 0,8 0,6 0,4 0,2 0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 R/S- траектория Н-траектория Тренд Смена тренда Рисунок 2.1. R/S- и Н- траектории временного ряда озимой пшеницы по КБР 2.3. Содержательная и качественная интерпретация результатов работы алгоритма R/S- анализа Основными фундаментальными свойствами ВР, выявляемых с помощью алгоритма R/S- анализа, являются: 1) значение показателя Херста и соответствующий ему цвет шума;
2) оценка меры устойчивости ВР лингвистическими термами: персистентность, хаотичность, антиперсистентность;
3) наличие долговременной памяти и оценка ее глубины, наличие квазициклов, являющихся обобщением понятия лцикл [64]. Одной из таких фрактальных характеристик ВР является цвет шума, который соответствует ряду на том или другом его отрезке.
42 Н- показатель Херста 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0, Черный шум Белый шум Розовый шум Коричневый шум Количество наблюдений Рисунок 2.2. Соответствие значений Н (показателя Херста) цвету шума Вкратце охарактеризуем методологию выявления лцвета шума применительно к временным рядам урожайностей с учетом того, что показатель Херста имеет следующую известную содержательную и качественную трактовку [64,82,88]. Значения H 2 3 определяют собой черный цвет шума. Чем больше значение H [2 3,1], тем большая трендоустойчивость присуща соответствующему отрезку ВР. Значения H в окрестности ~ 0,5 0,1 определяют собой в смысле нечеткого множества [44] область белого шума, который соответствует максимальной хаотичности и, следовательно, наименьшей прогнозируемости. Значения H в окрестности ~ 0,3 0,1 определяют собой область розового шума. Розовый шум говорит о присущей рассматриваемому отрезку ВР свойства антиперсистентности [64], которое означает, что ВР реверсирует чаще, чем ряд случайный (частый возврат к среднему [64]). Значения H в окрестности меньше 0,1 определяют собой область коричневого шума, который соответствует максимальной фрактальной размерности ВР и полной неопределенности в отношении прогнозируемости. Рассматриваемым в настоящей работе рядам, за редким исключением, присущи черный и белый шумы, а также, нестрого говоря, серый шум, соответствующий области нечеткого разграничения между областями черного и белого шумов.
Для оценки меры устойчивости ВР используются такие понятия, как персистентность, хаотичность и антиперсистентность. Как было установлено Херстом [64], большинство природных систем не следует случайному блужданию, т.е. временной ряд такой системы не представляет собой в чистом виде случайную величину, вероятность распределения которой подчиняется нормальному, равномерному или еще какому-либо известному закону. Такие ряды обладают такой характеристикой, как долговременная память [64,73]. Влияние настоящего на будущее в таких системах может быть выражено корреляционным соотношением:
C = 22 H 1 1, (2.3) где C - мера корреляции между ранними событиями (наблюдениями) и следующими за ними событиями, H - показатель Херста. Имеются три различные области значений для показателя Херста, соответствующие основным цветам шума: H = 1 / 2, 1 / 2 < H < 1, 0 < H < 1 / 2. По всей видимости трактовку этих областей целесообразно излагать с привлечением понятий теории нечетких множеств [2,44,64]. 1. Если в выражении (2.3) значение H = 1 / 2, это означает, что анализируемый ВР отражает случайное блуждание и является хаотичным, т.е. мы имеем дело с известным понятием белый шум. 2. Если показатель Херста возрастает в интервале 1 / 2 < H < 1, то анализируемый ВР приобретает (в смысле возрастания значений функции принадлежности [2,44]) свойство персистентности (трендоустойчивости) по мере лухода Н- траектории в область черного шума. 3. Если же показатель Херста в (2.3) убывает в интервале 0 < H < 1 / 2, то исследуемый временной ряд приобретает по нарастающей свойство антиперсистентности. Последнее означает, что такой ряд волатилен, т.е. более изменчив, чем ряд случайный. Здесь речь идет об уходе Н- траектории в область розового шума. Таким образом, познавательная сила фрактального анализа состоит в том, что с его помощью в процессе моделирования на нижнем уровне (см.
главу 1) можно упорядочивать и классифицировать исследуемые процессы по свойствам трендоустойчивости, хаотичности и волатильности. Далее перейдем к следующей фрактальной характеристике ВР - наличие долговременной памяти. Наличие такой памяти в рядах означает, что в них заключена информация об определенных закономерностях, влияющих на дальнейшее поведение ВР. О наличии долговременной памяти в рассматриваемом ВР (2.1) не представляется возможным дать положительное или отрицательное заключение, если его Н-траектория не находится сколь-нибудь продолжительное время в области черного шума, а поведение R/S- траектории носит хаотический характер, начиная с ее начальных точек. Основанием для утверждения о том, что ВР (2.1) обладает долговременной памятью, является выполнение следующих условий [64]:
- его Н-траектория через несколько своих начальных точек оказывается в области черного шума, а для R/S-траектории указанные точки вхождения в черный шум демонстрируют собой наличие тренда;
- глубину этой памяти определяет такой номер = l, для которого выполняется следующее условие: в точке l Н - траектория получает отрицательное приращение, а R/S-траектория в этой точке демонстрирует так называемый срыв с тренда, т.е. резкое изменение тренда.
Примечание 2.1. Факт наличия долговременной памяти в рассматри ваемом ВР (2.1) можно обосновать также с помощью процедуры перемешивания [64] элементов этого ВР. Если в данном ВР случайным образом перетасовать его элементы и полученный ряд представить на вход алгоритма R/Sанализа, то на выходе этого алгоритма максимальное значение показателя Херста и Н - траектории окажется явно меньше по сравнению со значениями Н для исходного ВР в случае, если этот ВР обладает долговременной памятью.
2.4. Фрактальный анализ временного ряда урожайности озимой пшеницы по Кабардино-Балкарской республике за период с 1952 по 2002 гг.
В настоящей работе осуществлен массовый фрактальный анализ, т.е. построены H- и R/S- траектории для многочисленных временных рядов урожайностей сельскохозяйственных культур: озимая пшеница, зерновых всего, подсолнечник, кукуруза на зерно, картофель и овощи по КабардиноБалкарской республике (Приложение 1). На основании полученных результатов можно утверждать, что рассматриваемые ВР состоят из квазициклов (в переводе с греческого квази- это как бы). При этом указанные выше (см. п.п. 2.2, 2.3) точки смены тренда чаще всего представляют собой окончание этих квазициклов. В качестве иллюстративного примера использования инструментария фрактального анализа ВР рассмотрим на рисунке 2.1 R S - траекторию и Н траекторию для отрезка U 7 ВР (2.1), представляющего собой ВР урожайности озимой пшеницы по КБР. На основании визуализации представленных на рисунке 2.1 траекторий можно сформулировать следующее заключение:
- для первых 7 точек ( = 1,7 ) Н-траектория отрезка z10 находится в зоне белого шума, из которого она уходит в область черного шума (значение H ( ) = 0,8 для = 10 ), что говорит о наличии долговременной памяти в отрезке U10 рассматриваемого ВР;
- смена тренда R/S-траектории в точке = 10, сопровождаемая уходом Нтраектории в зону белого шума, позволяет оценить глубину долговременной памяти числом 10. Важнейший вывод, вытекающий из установленного факта наличия долговременной памяти во временных рядах урожайностей, состоит в том, что появляются основания для разработки системы кратко- и среднесрочно го прогноза этих урожайностей. Предложенные в настоящей работе инструментальные методы для этой системы базируются на математическом аппарате теории клеточных автоматов и теории нечетких множеств. Объем памяти используемого клеточного автомата и, в конечном счете, трудоемкость вычислительной схемы прогнозирования существенным образом зависят от глубины памяти прогнозируемых ВР. Поэтому в настоящей работе с достаточной полнотой реализованы численные расчеты с целью обосновать верхнюю оценку глубины памяти рассматриваемых ВР. В настоящем исследовании разработан алгоритм 1, который определяет наличие такой памяти и оценивает ее глубину численно, представляя в виде нечеткого множества. Алгоритм состоит из 3-х этапов. Приведем его описание по этапам. Этап 1. Формирование на базе временного ряда (2.1) семейства S (Z ) = z ir, i = 1,2,..., n r ;
r = 1,2,..., m, состоящего из m временных рядов, где ин { } дексом i занумерованы элементы r -го ряда, получаемого из (r 1) -го ВР путем удаления первого его элемента z1r 1. Здесь m определяется как наибольшее значение индекса r такое, что ряд zim, i = 1,2,..., nm еще имеет точку смены тренда в его R / S - траектории. Исходный ВР (2.1) также принадлежит семейству S (Z ), в котором ему присвоено значение индекса r = 1. Этап 2 осуществляет R / S - анализ временных рядов из семейства S (Z ) и формирует нечеткое множество значений глубины памяти для начального ряда (2.1). Пусть для каждого из временных рядов z ir, i = 1, nr из S (Z ) в результате его R / S - анализа построены R / S - траектория и H - траектория, определяющие собой номер в R / S - траектории l r - той точки, в которой произошла смена тренда, т.е. l r - это номер первой по порядку точки, в которой Н- траектория получила отрицательное приращение, а R / S - траектория сменила тренд.
Введем следующие обозначения:
N (l ) - количество всех рядов z ir, i = 1, n r из семейства S (Z ), у каждого из которых номер точки смены трен да l r равен числу l, l = min l r L = max l r ;
m = N (l ) - число рядов семейства 1 r m 0 0 1 r m l = L S (Z ) ;
d (l ) = N (l ) - доля таких рядов в S (Z ), у каждого из которых потеря паm мяти произошла на глубине l ;
L( Z ) = {l} - множество значений номеров элементов смены тренда в рядах из семейства S ( Z );
M ( Z ) = { (l, (l )) } - нечеткое множество (НМ) глубины памяти для начального ВР (2.1) Таблица 2.1 Глубина l Количество N (l ) Доля d (l ) Значения функции принадлежности (l ) 4 13 0,28 0,90 5 11 0,24 0,77 6 6 0,13 0,42 7 6 0,13 0,42 8 3 0,07 0,22 9 4 0,09 0,29 10 1 0,02 0,06 11 2 0,04 0, Значения l функции принадлежности нечеткому множеству M (Z ) пропорциональны числам d (l ), l L(Z ) и получаются путем нормирования значений долей d (l ) так, что (l ) < 1 для всякого l L(S ). Результат работы этапа 2 для ВР (2.1) урожайности озимой пшеницы по Кабардино-Балкарской республике представлен в таб.2.1. Значения элементов (l ) последней строки в таблице 2.1. вычисляются следующим образом. Сначала находим максимальную долю d * = max d (l ) ( в таблице 2.1 значение d * = 0,28 ) и соответстlL ( Z ) вующую ей глубину l * ( d * (l ) = l *, в таблице 2.1 значение l * = 4 ). Далее для этой глубины l * экспертным путем устанавливается значение функции принадлежности * = (l * ) ( в таблице 2.1 значение * = (4) = 0,90 ). После чего для остальных элементов l L(Z ) соответствующие им значения функции принадлежности (l ) вычисляются по формуле (l ) = * d* d (l ). Формирование НМ M (Z ) осуществляется путем попарного объединения элементов первой и последней строк таблицы 2.1, а именно получаем НМ M (Z ) = {(4;
0,90 ), (5;
0,77 ), (6;
0,42 ), (7;
0,42 ), (8;
0,22 ), (9;
0,29 ), (10;
0,06 ), (11;
0,13)}.
Выводы, вытекающие из результатов выполненных расчетов, состоят в следующем. 1. Глубина памяти конкретного ВР не является фиксированным числом;
ее величина меняется вдоль рассматриваемого ВР, т.е. для различных его отрезков она является различной, например, как видно из таблицы 2.1, для ВР урожайности озимой пшеницы (КБР) численное значение глубины памяти колеблется в отрезке натурального ряда 4,5,...,11. 2. Для численного представления глубины памяти рассматриваемого ВР Z наиболее целесообразным является математический аппарат теории нечетких множеств, т.е. оцениваемая глубина представляет собой нечеткое множество M (Z ) = {(l, (l ))}, l {l 0, l 0 + 1,..., L0 }, где l - численное значение встречающейся глубины памяти, (l ) - значение функции принадлежности для этой глубины. Представленный в диссертации метод вычисления глубины долговременной памяти временных рядов применен к ВР урожайности основных культур по Кабардино-Балкарской республике. Полученная для ВР Z озимой пшеницы оценка глубины его памяти представляется в виде следующего нечеткого множества M (Z ) = {(4;
0,90), (5;
0,77), (6;
0,42), (7;
0,42), (8;
0,22), (9;
0,29), (10;
0,06), (11;
0,13)}.
(2.4) Обнаружение долговременной памяти в рядах урожайности является не самоцелью, а должно послужить объективным обоснованием принципиальной возможности построения прогнозной модели, в процессе работы которой учитываются все существенные факторы, которыми обусловлено наличие этой памяти. В контексте проблемы прогнозирования уместно отметить уже сложившееся, т.е. ставшее классическим основное положение декомпозиционного анализа [85] временных рядов. Согласно этому положению в общем случае ВР может быть поделен на 4 составляющие части: а) тренд, б) циклическая компонента, в) сезонное колебание, г) нерегулярная или остаточная компонента. При этом циклическая компонента, если она существует, может нести весьма существенную информацию для составления прогноза. В арсенале современных методов прогнозирования ВР возрастающее значение приобретает такой подход, как визуализация их фазовых портретов, получаемых в интерактивном режиме использования ПЭВМ.
2.5. Инструментарий фазовых портретов для выявления циклов временного ряда и подтверждения прогноза При исследовании ВР урожайности достаточно информативным и целесообразным является построение фазовых портретов ВР (2.1) в фазовом пространстве F (Z ) [64, 12] размерности 2: F ( Z ) = {(z i, z i +1 )}, i = 1,2...n 1. Такого вида фазовая траектория ВР урожайности озимой пшеницы по КБР (см. таблица 2.2) представлена на рис.2.3.
Исходные данные для точек абсциссы и ординаты на базе статистических данных урожайности озимой пшеницы по КБР с 1952 по 2002 гг. Таблица 2.2. Годы zi 1952 13,1 1953 7,5 1954 8,3 1955 7 1956 13 1957 13,9 1958 15,7 1959 14,1 1960 18,8 1961 12,7 1962 22 1963 18,1 1964 13,9 1965 15,4 1966 18,6 1967 24,4 1968 25, zi+1 7,5 8,3 7 13 13,9 15,7 14,1 18,8 12,7 22 18,1 13,9 15,4 18,6 24,4 25,1 20, Годы 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 zi 20,5 27,1 29,1 21,9 29,3 18,3 21,9 30,9 26,7 26,9 30,1 29,1 27,5 22,5 27,1 24,2 21, zi+1 27,1 29,1 21,9 29,3 18,3 21,9 30,9 26,7 26,9 30,1 29,1 27,5 22,5 27,1 24,2 21,1 33, Годы 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 zi 33,9 26,8 32,8 36,2 44,3 36,4 28,7 26,4 30,3 33,4 28,1 25,5 18,9 28,4 25,5 31,2 32, zi+1 26,8 32,8 36,2 44,3 36,4 28,7 26,4 30,3 33,4 28,1 25,5 18,9 28,4 25,5 31,2 32, Фазовый портрет этого временного ряда в двумерном фазовом пространстве представлен на рис.2.3.
50 45 40 35 30 25 20 15 10 5 0 0 5 10 15 20 25 30 35 40 45 z i + zi Рисунок 2.3. Фазовый портрет временного ряда урожайности озимой пшеницы по Кабардино-Балкарии за период с 1952 по 2002 гг.
Примечание 2.2. Следуя Петерсу [64], Пакарду [89] и многим другим исследователям (см. литературные источники в [64]) для ВР Z (2.1) в качестве его фазового пространства используем простейший вариант вида Ф (Z ) = {z i, z i +1,..., z i + 1 }, i = 1,2,..., n + 1.
(2.5) Как известно, при построении фазового пространства (2.5) для конкретного временного ряда принципиально важным вопросом является вопрос о его размерности. Эта размерность должна быть не меньше, чем размерность аттрактора наблюдаемого ряда. В свою очередь, как известно, в качестве размерности аттрактора с достаточно приемлемой точностью можно использовать фрактальную размерность С его ряда. Значение этой размерности, как отмечено в [64], вычисляется по формуле С = 2 2Н (2.6) Поскольку для анализируемых в настоящей работе значения Н (0, 1), то из (2.5) получаем оценку С < 2. Таким образом, для целей нашего исследования достаточно использовать фазовое пространство (2.5) размерности = 2.
Рассмотрим этот фазовый портрет в виде траектории, т.е. последовательности точек, в которой каждая соседняя пара соединена звеном, т.е. отрезком или кривой. В этой траектории выделяем также ее отрезки, которые называются термином квазициклы. Определение квазицикла в определенном смысле близко к определению цикла. Различие между этими двумя понятиями состоит в том, что начальная и конечная точки квазицикла не обязательно должны совпадать. Конечная точка квазицикла определяется ее вхождением в окрестность начальной точки. При этом допускается самопересечение начального и конечного звеньев квазицикла, если это приведет к максимальному сближению начальной и конечной точек. В реальности существуют такие временные ряды эволюционных процессов, у которых фазовые портреты содержат такие пары несоседних по времени точек (наблюдений), у которых координаты в фазовом пространстве фактически совпадают. Наличие таких пар точек фактически разрушает циклическую структуру фазовых траекторий. Примечательная и весьма важная особенность прогнозирования рассматриваемых автором ВР озимой пшеницы состоит в том, что ее фазовый портрет состоит из последовательности непересекающихся квазициклов. В целом траектория фазового портрета (рис.2.3) временного ряда урожайности озимой пшеницы состоит из 10-ти непересекающихся квазициклов C r, r = 1,2...10. На рис. 2.4-2.13 представлены все 10 квазициклов ВР Z.
15 13 11 9 7 5 3 № 1,6 1,2 0, 5 2 0,4 R/S Смена тренда 13 17 21 25 29 33 37 41 45 H Рисунок 2.4. Первый квазицикл исходного ВР z1 и его R / S и H -траектории 25 № 1, 1,2 0, 10 10 Смена тренда R/S H 8 10 10 0, 20 0 1 5 R/S H Рисунок 2.5. Второй квазицикл исходного ВР z10 и его R / S и H -траектории 30 25 20 15 10 10 15 № 15 14 13 16 17 1,2 17 0,8 0,4 13 Смена тренда Рисунок 2.6. Третий квазицикл исходного ВР z17 и его R / S и H -траектории 30 № 1,2 1 0,8 0,6 0, 21 Смена тренда R/S H 0,2 0 1 Рисунок 2.7. Четвертый квазицикл исходного ВР z 21 и его R / S и H -траектории 35 30 25 20 15 15 20 25 30 35 № Смена тренда 24 0,8 0,6 0,4 25 R/S H 1 4 7 10 13 16 19 22 0,2 Рисунок 2.8. Пятый квазицикл исходного ВР z 25 и его R / S и H -траектории 35 30 25 20 20 25 30 35 № 27 26 0, 0,6 0,4 0,2 0 11 13 15 17 19 21 H R/S H Смена тренда Рисунок 2.9. Шестой квазицикл исходного ВР z 30 и его R / S и H -траектории 40 35 30 25 20 15 10 10 15 20 25 30 35 40 № 34 31 1 0, R/S 0,6 0,4 0,2 0 10 13 16 Смена тренда Рисунок 2.10. Седьмой квазицикл исходного ВР z 34 и его R / S и H -траектории 50 45 40 35 30 25 20 15 10 10 №8 38 37 36 35 40 R/S H 0,8 0,6 0,4 0,2 Рисунок 2.11 Восьмой квазицикл исходного ВР z 40 и его R / S и H -траектории 35 № 43 42 41 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 R/S H 45 Смена тренда 20 20 25 30 Рисунок 2.12. Девятый квазицикл исходного ВР z 45 и его R / S и H -траектории 35 30 25 20 15 10 10 15 20 25 30 35 № 0, 49 47 48 49 R/S H 0,6 0,4 0,2 0 Смена тренда Рисунок 2.13. Десятый квазицикл исходного ВР z 49 и его R / S и H -траектории Размерности Lk этих квазициклов представлены в таблице 2. Квазициклы и их размерности результат фазового портрета для временного ряда урожайности озимой пшеницы по КБР Таблица 2.3 Ck Lk C1 C C C C C C C C C Обозначим через Z k такой отрезок ВР Z, который получается путем удаления из Z всех точек наблюдения, относящихся к квазициклам C1, C 2,..., C r 1 ;
согласно этому определению Z 1 = Z.
На рис.2.4-2.13 представлены также R / S и H -траектории [64] этих временных рядов Z k, k = 1,10. Здесь, начальные точки ВР Z k соответствуют точкам квазицикла C r. Из визуализации рисунков 2.4-2.13 вытекает принципиально важный факт: длина квазициклов практически совпадает с глубиной памяти соответствующих им отрезков ВР. Этот факт, за редким исключением, имеет место и для остальных квазициклов, составляющих фазовую траекторию ВР Z. Заметим, что указанный факт констатирует собой научную новизну результатов моделирования данных на нижнем уровне. Сравним глубину памяти рассматриваемого ВР, представленную нечетким множеством (2.4), с размерностями квазициклов, представленными во второй строке таб.2.3. Из этого сравнения вытекает, что наличие долговременной памяти в рассматриваемом ВР наряду с другими факторами обусловлено также циклической компонентой этого ВР.
Примечание 2.3. Наряду с представленным выше (на рис.2.3) сущест вуют другие подходы к построению фазовых портретов временных рядов. Многие исследователи строят фазовые портреты вида луровень показателя ВР - его первая производная, т.е. эти портреты строятся в фазовом пространстве F ( z ) = {(z i, z i )}, где z i - приращение i -го элемента ВР (2.1). Такого вида фазовая траектория ВР урожайности озимой пшеницы по КБР, представлена в Приложении 2 на рис. П2.1. Эта траектория состоит из 10 квазициклов C r, r = 1,2,...10, представленных на рис.П2.2. В таблице П2.1. представлены исходные данные для построения фазового портрета приращения временного ряда урожайности озимой пшеницы по КБР. Размерности Lk этих квазициклов представлены в таб. П2.2. Нетрудно видеть, что фазовые портреты на рис.П2.1 и рис.П2.2 так же подтверждают наличие циклической компоненты в рассматриваемом ВР и обусловленную этим долговременную память в рассматриваемом ЛВР.
2.6. Математический инструментарий линейных клеточных автоматов Еще более полувека назад американский математик Дж.Нейман полагал, что многие сложные явления, такие как самовоспроизведение, рост и развитие, морфогенез, которые трудно моделировать с помощью дифференциальных уравнений, удастся описать с помощью клеточных автоматов [42]. К настоящему времени уже осознано, что теория клеточных автоматов по существу связывает два междисциплинарных подхода - синергетику и кибернетику. По своей сути клеточные автоматы реализуют собой алгоритмический подход к математическому моделированию процессов и систем, имеющих дискретный характер.
Для исследования системы методами клеточных автоматов к настоящему времени можно выделить два подхода: статистический и конструктивный [34]. Реализация первого из них начинается с составления перечня всех возможных конфигураций, которые могут встречаться при неограниченном продолжении рассматриваемого временного ряда. На базе той информации можно вводить определения известных понятий теории детерминированного хаоса, аналоги ляпуновских показателей, фрактальных размерностей и т.д. Реализация второго подхода начинается с конструирования и анализа различных типов структур, возникающих в изучаемой системе или процессе, и выявления типа взаимодействия между структурами. В настоящей главе предлагается математическая модель и метод для прогнозирования ожидаемой в наступающем году урожайности сельскохозяйственных культур, рассматриваемой в процессе решения задач землепользования [53]. Предлагаемая модель базируется на инструментарии линейных клеточных автоматов [34,42]. Исходными данными для этой модели служат элементы временного ряда урожайностей. Результатом применения предлагаемого метода к указанному ряду является значение ожидаемой в наступающем году урожайности, представленной в виде нечеткого множества [2,44]. Целью моделирования на нижнем уровне является не только получение возможно более точного прогноза ожидаемой урожайности, но и обеспечение возможно более адекватного отражения хаотической природы моделируемого процесса. Достижение этих целей становится исключительно актуальным в случае практического решения задач землепользования, относящихся к зоне рискового земледелия [11] Важно отметить, что существующие к настоящему времени подходы и методы прогнозирования базируются либо на корреляционно-регрессионных моделях, либо на трендах, для представления которых выбирается наиболее подходящие экстраполяционные зависимости. Глубокий анализ временных рядов урожайности сельскохозяйственных культур показывает слабую адек ватность этих моделей указанным рядам. Причиной тому является скрытая квазипериодичность, наличие долговременной памяти и дробной фрактальной размерности [64], присущей временным рядам урожайностей базовых культур, выращиваемых в зоне рискового земледелия [83]. Знание этих характеристик является весьма полезным при анализе развития региона, как социально-экономической системы. В силу этого обстоятельства в настоящей главе для построения прогнозной модели урожайности предлагается новый подход, который базируется на использовании клеточных автоматов и математического аппарата нечетких множеств. При этом оговоримся заранее, что предлагаемая математическая модель относится только к пассивным прогнозам [36], которые опираются лишь на возможное продолжение развития внутренних, собственных тенденций рассматриваемой системы.
2.7. Прогнозная модель урожайности на базе клеточных автоматов и нечетких множеств (на примере анализа и прогнозирования урожайности озимой пшеницы по КБР на 2003 год) 2.7.1. Преобразование числового временного ряда в лингвистический временной ряд В настоящей работе для целей иллюстрации, валидации и верификации предлагаемой модели рассматриваем временной ряд Y : y i, i = 1, n (2.7) урожайности озимой пшеницы для Кабардино-Балкарской республики (КБР) за период с 1952 по 2002 годы, которые перенумерованы индексом где n = 2002 1952 + 1 = 51 ;
yi - i = 1,2,..., n, средняя урожайность (ц/га) озимой пшеницы в i - ом году. С целью визуализации этого ряда на рисунке 2.4 дано графическое представление этого ряда в виде гистограммы.
50 40 30 20 10 0 1952 1954 1956 1958 1960 1962 1964 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 ц/га Годы Рисунок 2.14. Гистограмма временного ряда (2.7) урожайности озимой пшеницы по Кабардино-Балкарии с 1952 по 2002 гг.
Для максимального учета долговременной памяти, присущей рассматриваемому временному ряду, предлагается использовать интервальные значения прогнозируемого показателя, для чего весь спектр наблюдаемых урожайностей разделен на три альтернативы: оптимистическую (высокий уровень), пессимистическую (низкий уровень) и среднюю [36]. Если каждому числовому значению элементов данного временного ряда поставить в соответствие одну из этих альтернатив, то получим интервальный временной ряд или в другой терминологии, лингвистический временной ряд (ЛВР). Преобразование временного ряда (2.7) в ЛВР означает замену числовых элементов yi, i = 1, n лингвистическими переменными, называемыми термами;
совокупность этих термов принято называть терм-множеством [2,24], которое в настоящей главе обозначаем через U = {u}. При этом принимаем, что множество U состоит из трех элементов: элементы u=H - низкая урожай ность, u = C - средняя урожайность, u = B - высокая урожайность. Заменяя yi ряда (2.7) соответствующими термами из U, получаем ЛВР U : u i, i = 1,2,..., n.
(2.8) В работе [83] предлагается строить ЛВР вида (2.8), опираясь на скользящую среднюю. Однако, скользящие средние обладают тем принципиальным недостатком, что при их построении практически всегда остается открытым вопрос определения наилучшего порядка скользящей средней. Чаще всего на практике порядок средней определяется эвристически, т.е. интуитивно. В связи с этим в настоящей диссертационной работе предлагается алгоритм преобразования ряда (2.7) в ряд (2.8) на базе интервального подхода. Этот алгоритм состоит из трех этапов. Первый этап начинается с визуализации гистограммы, представляющей ряд (2.7). На этой гистограмме выделяем жирными точками столбики, представляющие явно высокую урожайность, и столбики, представляющие явно низкую урожайность (см. рисунок 2.14). Далее, соединяя соседние жирные точки пунктирными отрезками, получаем, как показано на рисунке 2.15, верхнюю огибающую ломанную (ВОЛ) и нижнюю огибающую ломанную (НОЛ). На втором этапе последовательно для каждого столбика гистограммы рассматриваем отрезок, соединяющий точку его пересечения с НОЛ точкой его пересечения с ВОЛ. Этот отрезок делим на три равновеликих интервала: нижний, средний и верхний. Отмечаем на каждом из таких отрезков концы среднего интервала, после чего каждую пару соседних верхних (нижних) концов средних интервалов соединяем пунктирным отрезком, в результате чего получаем границы срединной области гистограммы (СОГ). На рисунке 2.15 представлены результаты работы 1-го и 2-го этапов.
ц/га Годы 0 1952 1954 1956 1958 1960 1962 1964 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 Рисунок 2.15. Гистограмма временного ряда (2.7) урожайности озимой пшеницы по Кабардино-Балкарии с 1952 по 2002 гг. после 1-го и 2-го этапов алгоритма На третьем этапе временной ряд вида (2.7) преобразуем в ЛВР вида (2.8), осуществляя окрашивание каждого столбика гистограммы, как показано на рис.2.16. Рассматривая iй столбик этой гистограммы, элемент yi за меняем термом H, если верх столбика находится ниже СОГ, иначе заменяем yi термом С, если его верх принадлежит СОГ и, наконец, заменяем термом В, если верх этого столбика находится выше СОГ. Работа третьего этапа, а вместе с ним и работа алгоритма заканчивается тогда, когда элемент yn ряда (2.7) заменяется соответствующим термом. Тем самым ЛВР (2.8) считается построенным.
50 40 30 20 10 0 1952 1954 1956 1958 1960 1962 1964 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 Годы ц/га низкий средний высокий Рисунок 2.16. Гистограмма ЛВР (2) урожайности озимой пшеницы по Кабардино-Балкарской республике с 1952 по 2002 гг.
Примечание 2.4. Теоретически возможен случай, когда верх рассмат риваемого i того столбика находится на верхней или на нижней границе yi СОГ. Тогда элемент заменяем термом Н, если верх его столбика находится на нижней границе СОГ, и заменяем на С в противном случае. Для временного ряда (2.7) в результате применения к нему алгоритма, получен конкретный ЛВР, который представлен таблицей 2.4 и отражает урожайность озимой пшеницы по КБР.
Лингвистический временной ряд урожайности озимой пшеницы по КБР за период с 1952 по 2002 гг Таблица 2. i ui ti i ui ti 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 СНННСССНВНВСННСВВСВВСВНСВС 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 2002 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 СВССНСННВССВВВСССВССНССВВ 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2.7.2.Частотный анализ памяти лингвистического временного ряда Как отмечается в [50,83], временные ряды вида (2.7) и ЛВР вида (2.8) обладают долговременной памятью [64]. Последнее означает, что такие ряды аккумулируют информацию о колебаниях погодных условий и их влияние на урожайность сельскохозяйственных культур. Иными словами, в этих рядах заключена информация об определенных закономерностях, которые в научной литературе принято относить к так называемой долговременной памяти. Наличие долговременной памяти у временного ряда (2.7) урожайности озимой пшеницы по КБР подтверждается результатами его фрактального анализа [64] или, в более узком смысле, R/S - анализа [64], примененного к (2.7). Основная числовая характеристика этого результата заключается в том, что полученные значения показателя Херста H колеблются для ряда (2.7) в пределах от 0,7 до 0,9. Многолетний опыт, накопленный для рядов с таким значением H свидетельствует, что в них имеют место долговременные корреляции между текущими событиями и будущими событиями [64]. Особо отметим при этом, что такое поведение урожайности озимой пшеницы в зоне рискового земледелия (в том числе и в КБР) представляет собой типичное явление среди подавляющего большинства природных процессов и явлений [83]. В [61] сформулировано предложение представлять наличие в ЛВР долговременной памяти в терминах и понятиях клеточного автомата, в частности, линейного клеточного автомата. Теория клеточных автоматов утверждает, что лесли клетки располагаются линейно вдоль прямой, и каждая клетка находится в определенном состоянии, то состояние соседей слева от рассматриваемой клетки влияют на состояние этой клетки на следующем временном шаге [8]. В терминах клеточного автомата значение лингвистической переменной ui+k в ЛВР (2.8) (см.таб.2.4) определяется l конфигурациями u i + k l, u i + k l +1,..., u i + k, l = 1, k, т.е. конфигурациями длины l в отрезке этого ряда u i +1, u i + 2,..., u i + k, i = 1, n k + 1, где через k (2.9) (2.10) обозначаем глубину памяти рассматриваемого ряда. Из результа тов проведенного R/S - анализа вытекает, что для урожайности по Кабардино-Балкарии значение k ограничено сверху цифрой 8. Последнее означает, что для всякого i = 1,2,..., n k + 1 значение лингвистической переменной ui+k в (2.10) или в (2.8) определяется лишь такими l -конфигурациями вида (2.9), для которых l k = 8. Алгоритм прогнозирования основывается на частотной статистике переходов в состояния Н,С и В всех l -конфигураций, имеющих место в ЛВР (2.8). Через M (U ) обозначим множество всех l -конфигураций l k, k = 8, которые можно обнаружить в ЛВР (2.8);
M (U ) = U M l, где M l - это подмножестl = во всех l -конфигураций в ЛВР U при фиксированном l. Для рассматриваемых ВР Y (2.7) и ЛВР U (2.8) эти подмножества имеют следующий состав:
M 1 = {H, C, B}, M 2 = {HH, HC, HB, CH, CC, CB, BH, BC, BB}, HHH, HHC, HHB, HCH, HCC, HCB, HBH, HBC, CHH, CHC, CHB, CCH, M3 =. CCC, CCB, CBH, CBC, CBB, BHC, BHB, BCH, BCC, BCB, BBC, BBB Для l = 4,5,6,7,8 состав подмножеств M l (U ) представлен вершинами левых до лей 2-дольных орграфов на рисунках 2.17-2. Примечание 2.5. Через N l обозначим количество всех попарно раз личных l -конфигураций в ЛВР (2.8). Для принятого терм-множества U = {H, C, B} конфигураций, теоретически возможное количество k =8 различных l l = 1,2,..., k, составляет l = k l = 3 + 3 2 + 3 3 + 3 4 + 3 5 + 3 6 + 3 7 + 38 = 9828, в то время как в реальном ЛВР (2.8), представленного в таб. 2.4, количество N l всех таких попарно различных l -конфигураций, l 8 составляет N = N l = 243. Из них N 1 = 3, N 2 = 9, l =1 N 3 = 24, N 4 = 38, N 5 = 41, N 6 = 42, N 7 = 42, N 8 = 43. Тем самым установлен тот факт, что количество реальных l - конфигураций составляет менее 2,47% от l количества теоретически возможных обозначим в виде отрезка - конфигураций.
l Рассмотрим какую-либо фиксированную 0 u10, u 2,..., u 0,..., u l0. j -конфигурацию, которую (2.11) Если в ЛВР (2.6) выделен отрезок u i +1, u i + 2,..., u i + j,..., u i + l, совпадающей с (2.11), т.е. u i + j = u 0, j = 1, l, то по отношению к следующему элементу j u i + l +1 = u 0, u 0 U = {H, C, B} условимся говорить, что l -конфигурация (2.11) переходит в состояние u 0, т.е. в лингвистическую переменную u i +l +1, совпадающую с термом u 0. В предлагаемом автором подходе базовым является следующее теоретическое предположение. Пусть последовательность (2.8) неограниченно растет, т.е. в ряду u i, i = 1, n значение параметра n. Если в этой сколь угодно длинной последовательности некоторая конкретная фиксированная конфигурация (2.11) появляется и при этом всякий раз после нее следует переход в одно и тоже состояние u 0 {H, C, B}, то говорим, что конфигурация (2.11) обладает памятью. Если имеют место перемежающиеся переходы в два фиксированные состояния, то говорим, что отрезок (2.11), т.е. l -конфигурация (2.11) обладает частичной памятью. Если же фиксированная конфигурация демонстрирует переходы в каждое из трех состояний Н, С, В, то говорим, что память у данной конфигурации не обнаружена. Переходы всех конфигураций, которые встретились в лингвистическом временном ряде урожайности озимой пшеницы по КБР за период с 1952 по 2002 гг., представлены в виде ориентированных графов на рисунках 2.172.24.
Н 4 3 6 Н С 9 8 8 С В В Рисунок 2.17. Орграф переходов из 1- конфигураций в состояния Н, С и В 1 1 1 НН Н СН 1 3 Н ВН 1 0 Н НС 2 2 2 С СС 2 4 3 С ВС 5 8 3 С НВ В СВ В ВВ В Рисунок 2.18. Орграф переходов из 2-конфигураций в состояния Н, С и В 0 0 0 ННН Н НСН 0 1 Н НВН 1 0 Н СНС 0 Н ННС 1 1 1 С НСС 1 1 1 С НВС 1 0 1 С СНВ 0 0 2 С ННВ В НСВ В СНН В ССН В ССС 1 0 1 0 0 2 2 0 1 0 Н СВС 0 Н ВНВ 0 0 Н ВСВ 1 1 Н ССВ С СВВ 2 1 0 С ВСН 0 0 1 С ВВС 1 2 1 С СВН В ВНС В ВСС В ВВВ В Рисунок 2.19. Орграф переходов из 3-конфигураций в состояния Н, С и В НННС 0 0 ННСС 0 0 ННСВ 0 1 В 1 С 0 1 Н ННВС 0 0 НСНН 0 Н НССВ 1 0 Н НВНВ 0 0 Н 0 С НСВС 1 С НВСН 0 С 1 НССС 0 0 В 1 В 0 НВСС 0 В НСВВ СННН 0 0 СННС 0 Н СНСН 0 1 Н ССНС 0 1 Н СССВ 0 0 Н 0 С СНСС 0 С ССНВ 0 С ССВС 2 С 0 СННВ 1 В 0 СНВН 0 В 0 СССН 0 В 0 ССВВ 0 В СВСС 1 0 СВВС 2 Н ВНСВ 0 Н ВССН 0 0 Н ВСВН 0 0 Н 0 С ВНВС 0 С ВССС 0 С ВСВВ 1 С 1 В 1 В 1 В СВВВ ВСНН ВССВ 1 ВВСС В ВВС В 1 Н С 1 0 В 0 ВВВС Рисунок 2.20. Орграф переходов из 4-конфигураций в состояния Н, С и В НННСС 0 1 ННССС 0 0 0 ННСВВ 1 0 Н ННВСС 0 0 Н НСВСС 0 0 Н НВСНН 0 0 Н С НСННВ 1 0 0 С НСВВС 0 С НВССВ 1 0 1 С 0 0 В В НСССН В НВНВС СНННС В СННСВ 1 0 СННВС 0 Н СНССВ 1 0 Н ССНСС 1 0 Н СССВС 0 0 Н 1 С СНВНВ 1 С ССНВН 0 С ССВСС 0 С 0 СНСНН В 0 0 В 1 СССНВ 0 0 В 0 ССВВВ 1 0 В ССНСН СВССН 0 0 СВССВ 0 Н СВВВС 0 0 Н ВСННС 1 0 Н ВССВС 0 0 Н 1 С ВНСВС 1 С ВССНС 1 С ВССВВ 0 С 1 СВВСВ 0 1 В 1 ВНВСН 0 0 В 0 ВСССВ 1 0 В 0 ВСВНС 0 1 В ВСВВС 1 0 ВВССС 0 Н ВВСВВ 0 1 Н 0 С С 0 1 0 В 0 ВВСВН 1 0 В ВВВСС Рисунок 2.21. Орграф переходов из 5-конфигураций в состояния Н, С и В НННССС 0 0 Н ННВССВ 0 1 Н НСВССВ 0 0 Н НВСННС 0 1 0 Н ННСССН 0 1 0 С НСННВС 0 1 0 С НСВВСВ 0 С НВССВВ 1 С ННСВВС 1 0 В НСССНВ 0 0 В НВНВСН 0 0 В СНННСС 1 В СННСВВ 0 0 Н СНВНВС 1 0 Н ССНВНВ 0 0 Н ССВССН 0 0 Н СННВСС 0 0 1 С ССНСНН 0 0 1 С СССНВН 0 0 1 С ССВВВС 1 С СНСННВ 1 0 В ССНССВ 0 1 В СССВСС 0 1 В СВССНС 1 В СВССВС 0 0 Н СВВВСС 0 0 Н ВСННСВ 0 1 Н ВСССВС 0 0 Н СВВСВН 1 0 С ВНСВСС 1 0 0 С ВССВСС 0 С ВССНСН 0 С СВВСВВ 1 В ВНВСНН 1 0 В ВССНСС 0 0 В ВССВВВ 1 В ВСВНСВ 0 0 Н ВВСВНС 0 1 Н ВСВВСВ 0 0 0 С ВВСВВС 0 С ВВСССВ 1 0 В ВВВССС 0 1 В Рисунок 2.22. Орграф переходов из 6-конфигураций в состояния Н, С и В НННСССН 0 1 Н ННВССВВ 0 1 Н НСВССВС 0 0 Н НВСННСВ 0 1 0 Н ННСССНВ 0 0 0 С НСННВСС 0 1 С НСВВСВВ 1 С НВССВВВ 1 С ННСВВСВ 0 0 В НСССНВН 0 В НВНВСНН 1 0 В СНННССС 0 0 В СННСВВС 0 1 0 Н СНВНВСН 1 0 Н СССНВНВ 0 0 Н ССВВВСС 0 0 Н 0 1 С ССНСННВ 0 1 0 С СССВССН 1 0 С СВССНСН СННВССВ 0 С СНСННВС 1 0 В ССНВНВС 0 1 В ССВССНС 1 0 В СВССНСС 0 1 В 1 0 СВВСВНС СВССВСС Н СВВВССС 0 1 Н ВСННСВВ 0 0 Н ВСССВСС 1 0 0 Н 0 1 С ВНСВССВ 0 1 0 С ВССНСНН 0 С ВССВСНН 1 С СВВСВВС 0 1 В ВНВСННС 0 1 В ВССНССВ 0 1 В ВССВВВС 1 В ВСВНСВС 0 0 0 Н ВВСВНСВ 0 0 Н 1 1 0 С ВВСВВСВ ВСВВСВН 0 С ВВСССВС 1 0 В ВВВСССВ 1 0 В Рисунок 2.23. Орграф переходов из 7-конфигураций в состояния Н, С и В НННСССНВ 0 1 Н ННВССВВВ 0 0 0 Н НСВССВСС 1 0 0 0 1 Н ННСССНВН 0 С НСННВССВ 0 С НСВВСВВС С ННСВВСВВ 1 0 В НСССНВНВ 1 0 В НВНВСННС 0 1 В НВСННСВВ 0 0 0 Н СННСВВСВ 0 1 0 Н СНВНВСНН 0 0 Н НВССВВВС 1 С СННВССВВ 0 С ССНСННВС 1 С СНННСССН 0 1 В СНСННВСС 0 1 В ССНВНВСН 0 0 В СССНВНВС 1 0 Н ССВССНСС 0 1 0 Н СВССНССВ 0 1 0 0 1 Н СССВССНС 1 С ССВВВССС 0 1 0 0 С СВССВССН С ССВССНСН 0 0 В 1 1 В СВССНСНН В СВВСВНСВ СВВСВВСВ 1 0 Н ВНВСННСВ 0 1 0 Н ВСССВВВС С 0 0 Н СВВВСССВ 1 0 0 1 С ВСННСВВС 0 С ВССВССНС 0 С 0 В ВССНСННВ 1 0 В ВССВВВСС 1 0 В ВНСВССВС ВСВНСВСС 0 1 Н ВВСВНСВС 0 0 0 1 0 Н ВСВВСВНС 0 С ВВСВВСВН С ВВСССВСС 0 0 В ВВВСССВС 1 В Рисунок 2.24. Орграф переходов из 8-конфигураций в состояния Н, С и В По составу представленной выше памяти клеточного автомата (рисунки 2.17-2.24) можно сказать, что выявлено наличие и глубина памяти ЛВР (2.8). Длина отрезка лингвистического временного ряда, не превосходящая 8, определяет состояние прогнозируемого показателя на очередном временном шаге. Анализ конкретного ЛВР, отражающего урожайность озимой пшеницы по Кабардино-Балкарии, позволяет сформулировать следующие утверждения. Для всякого отрезка длины 1 ( H, C или B ) и всякого отрезка длины (НН, НС, НВ, СН, СС, СВ, ВН, ВС, ВВ) в ряду u i, i = 1, n имеет место отсут ствие памяти (только переход в одно состояние), т.к. всякий раз находились случаи переходов из этих отрезков в 2 или 3 состояния из числа Н, С и В. Первые признаки наличия памяти (частичной, т.е. переход в 2 состояния) обнаружились при l = 2 : уже 30% 2-конфигураций из числа встречающихся в ряду (2.8) демонстрируют частичную память;
для l = 3 46% 3конфигураций вида (2.11) демонстрируют переход только в одно состояние (память), т.е. с различной частотой переходы в какое-либо из трех состояний u {H, C, B} и 46% 3-конфигураций демонстрируют наличие частичной па мяти. Для l = 4 88% 4-конфигураций в ряду (2.8) демонстрирует наличие памяти и 12% демонстрирует наличие частичной памяти, другие случаи отсутствуют. Для l = 5 наличие памяти демонстрирует 95% 5-конфигураций в ряду (2.8) и 5% демонстрирует частичную память. Для l = 6 наличие памяти демонстрируют все 97% 6-конфигураций вида (2.11), и 3% демонстрирует частичную память. Для l = 7 наличие памяти демонстрирует 97% 7конфигураций в ряду (2.8) и 3% - частичную память и для l = 8 все 100% 8конфигураций вида (2.11) демонстрируют наличие памяти. Формирование памяти клеточного автомата завершается вычислением частотной статистики переходов l -конфигураций (2.11) в определенное состояние u 0 U = {H, C, B}. Эта статистика формируется следующим образом. Сначала, для каждой 1-конфигурации u10 {H, C, B} подсчитываем количество ее переходов в каждое из трех состояний Н, С, В. Для наглядности эти переходы отражены на двудольных полных орграфах, представленные на рис. 2.17.-2.24., дугам которых приписаны числа, означающие количество наблюдаемых в ЛВР (2.8) переходов каждой из трех 1-конфигураций u10, u10 U в каждое из состояний Н, С, В. Например, в конкретном ЛВР (2.8), относящемся к КБР, как показано на рис.2.17, имеем 4 перехода из Н в Н, 5 переходов из Н в С и 3 перехода из Н в В. Как показано на рис.2.7, количество переходов из С в Н, С и В равно соответственно 6,9 и 8. Здесь же, количество переходов из В в Н, С и В равно соответственно 9, 8 и 5. На основании этих данных можно вычислить эмпирические значения частостей переходов из 1-конфигураций в каждое из состояний Н, С, и В:
w1 (Н Н ) = w1 (Н С ) = w1 (H В ) = 4, 12 w1 (C Н ) = w1 (С С ) = w1 (С В ) = 6, 23 9, 23 8 23 w1 (В H ) = w1 (В С ) = w1 (В В ) = 2, 15 8, 15 5. 5, 12 3 (2.12) 0 Далее, для каждой 2-конфигурации u10 u 2 (U U ) подсчитываем коли чество переходов в каждое из трех состояний Н, С, В. Для наглядности строим 3 двудольных полных орграфа, представленных на рисунке 2.18. Дугам этих орграфов приписаны числа, означающие количество наблюдаемых в 0 ЛВР (2.8) переходов каждой из девяти 2-конфигураций u10 u 2 (U U ) в со стояния Н,С или В. В конкретном ЛВР (2.8), относящемся к КБР, как показано на рис. 2.18, имеем 1 переход из НН в Н, 2 перехода из НН в С, 1 переход из НН в В, 1 переход из НС в Н, 2 перехода из НС в С, 2 перехода из НС в В, 1 переход из НВ в Н, 2 перехода из НВ в С и 0 переход из НВ в В. На основании этих данных можно вычислить эмпирические значения частостей переходов из 2-конфигураций НН, НС, НВ в состояния Н, С и В:
w2 (НН Н ) = w2 (НН C ) = w2 (НН В ) = 1, 4 2, 1, w2 (НС Н ) = w2 (НС С ) = w2 (НС В ) = 1, 2, 5 2, w2 (НВ H ) = w2 (НВ С ) = w2 (НВ В ) = 1, 2, 3 0. (2.13) Аналогичным образом, на основании рисунка 2.18 вычисляются эмпирические значения частостей переходов из 2-конфигураций СН, СС, СВ, ВН, ВС, ВВ в Н, С и В. Далее, для каждого значения l {3,4,5,6,7,8} рассматриваем множество M l всех l - конфигураций, встречающихся в ЛВР (2.6), мощность M l = N l.
По аналогии с (2.12), (2.13) вычисляем эмпирические значения частостей пе0 реходов из каждой конкретной l -конфигурации u10 u 2...u l0 M l в состояние Н, С и В, l = 3,4,5,6,7,8.
0 wl u10u2...ul0 Н, ( ) 0 wl u10u2...ul0 С, ( ) 0 wl u10u2...ul0 В, ( ) (2.14) l = 3,4,5,6,7,8.
Значения этих частостей (2.14) для ЛВР (2.8) представлены в Приложении 3. По результатам работы клеточного автомата была проведена верификация и валидация представленной прогнозной модели, которая отражается в следующем параграфе.
2.7.3. Получение лингвистических прогнозных значений урожайностей, верификация и валидация прогнозной модели Сначала на примере исследуемого конкретного ЛВР (2.8), представляющего временной ряд урожайностей озимой пшеницы по КБР, приведем описание алгоритма прогнозирования, работающего на базе представленной в п.2.7.2 прогнозной модели. Ставится задача прогнозирования для рассматриваемого ЛВР U неизвестного элемента u n +1 на основании известных членов этого ряда u i, i = 1, n, точнее, на основании вычисленных выше частостей вида (2.12)-(2.14), для l = 1,2,..., k, где k глубина памяти в ЛВР (2.8). Прогноз терма u n + представляется в виде нечеткого терм-множества (НТМ) U n+1 = {(H ;
H ), (C;
C ), (B;
B )}, где значение функции принадлежности удовлетворяет равенству H + C + B = 1. Значение, H, C, B вычисляются через значения частостей вида (2.10) - (2.12), получаемых для различных l конфигураций в следующем отрезке ЛВР u n l +1, u n k,..., u n. (2.15) Сначала согласно (2.12) вычисляются частости переходов из 1конфигурации un в состояния Н, С, В: w1 (u n H ), w1 (u n C ), w1 (u n B ). После чего, согласно (2.13), вычисляются эмпирические значения частостей переходов из 2-конфигурации u n 1u n в состояния Н, С и В:
w2 (u n 1u n H ), w2 (u n 1u n C ) и w2 (u n 1u n B ). Далее согласно (2.14) вычисляем значение час тостей переходов из 3-конфигурации в u n 2 u n 1u n в состояния Н, С и В. Если 3-конфигурация w3 (u n 2 u n 1u n C ) = 1, u n 2 u n 1u n демонстрирует наличие памяти, например, то переходим к вычислению искомых значений H, C, B. Для этого сначала вычисляем ненормированные значения = w1 (u n H ) + w 2 (u n 1u n H ) + 0, H С = w1 (u n С ) + w2 (u n 1u n С ) + 1, = w1 (u n B ) + w2 (u n 1u n B ) + 0 и их сумму 3 = + C + , после нормировH B B ки которых получаем H = H, C = C, B = B.
Если 3-конфигурация u n 2 u n 1u n не демонстрирует наличие памяти, то рассматриваем 4-конфигурацию u n 3 u n 2 u n 1u n, для которой вычисляем частости ее переходов в состояния Н, С и В. Всякий раз к вычислению искомых H, C, B переходим тогда, когда встретится такая l -конфигурация u n l +1u n l + 2...u n, которая демонстрирует наличие памяти, например, получаем единичное значение частости для терма В: w1 (u nl +1u n l + 2...u n B ) = 1. Тогда сначала вычисляем ненормированные значения:
= w1 (u n H ) + w2 (u n 1u n H ) +... + wl 1 (u n l + 2 u n l + 3...u n H ) + 0;
H C = w1 (u n С ) + w2 (u n 1u n С ) +... + wl 1 (u n l + 2 u n l +3...u n С ) + 0;
= w1 (u n B ) + w2 (u n 1u n B ) +... + wl 1 (u n l + 2 u n l +3...u n B ) + 1 B и значения их суммы l = H + C + . После чего, вычисляем искомое знаB = H, C = C, B = B. l l l чение функции принадлежности для НТМ U n +1 : H Представленный таблицей 2.1 ЛВР урожайности озимой пшеницы заканчивается элементом u n = B, где n = 51 соответствует 2002 году. Осуществим прогноз этой урожайности на 2003-й год, т.е. построим для отсутствую0 0 0 щего элемента u n +1 его нечеткое терм-множество U n0+1 = {(H ;
H ), (C;
C ), (B;
B )}.
Прогноз осуществляется на качественном уровне, т.е. определенно можно сказать, какая будет урожайность в следующем году: низкая, средняя или высокая. Учитывая установленную глубину памяти k = 8, рассматриваем отрезок ЛВР u n 7 u n 6 u n 5 u n 4 u n 3 u n 2 u n 1u n = ВССНССВВ (2.16) Для ряда (2.16) рассматриваем все его l конфигурации, l = 1, k, k = 8 : В;
ВВ;
СВВ;
ССВВ;
НССВВ;
СНССВВ;
ССНССВВ;
ВССНССВВ. Для l = 1 из рисунка 2.17 получаем w1 ( B H ) = 5 8 2, w1 ( B C ) =, w1 ( B B ) =. 15 15 (2.17) Для l = 2 из рисунка 2.18 получаем значения частостей переходов из 2 конфигурации ВВ в термы Н,С,В:
w2 ( BВ H ) = 0, w2 ( BВ С ) = 3 1, w3 ( ВB В) =. 4 (2.18) Для l = 3, из рисунка 2.19 получаем w3 (СBВ H ) = 0, w3 (СBВ С ) = 2 1, w3 (СВB В) =. 3 (2.19) Для l = 4, из рисунка 2.20 имеем w4 (ССBВ H ) = 0, w4 (ССBВ С ) = 0, w4 (ССВB В ) = 1, (2.20) Для l = 4, 4-конфигурация ССВВ, демонстрирует наличие памяти, в силу чего для ряда (2.8) процесс вычисления частостей можно прекратить, но для достижения более высокой точности прогнозного значения можно продолжить частотный анализ до исчерпания памяти, т.е. до конфигурации длины 8, а именно, для l = 5,6,7,8, соответственно из рисунков 2.21-2.24 имеем w5 ( НССBВ H ) = 0, w5 ( НССBВ С ) = 0, w5 ( НССВB В) = 1 w6 (СНССBВ H ) = 0, w5 (СНССBВ С ) = 0, w5 (СНССВB В) = 1 w7 (ССНССBВ H ) = 0, w7 (ССНССBВ С ) = 0, w7 (ССНССВB В) = w8 ( ВССНССBВ H ) = 0, w8 ( ВССНССBВ С ) = 0, w8 ( ВССНССВB В ) = (2.21) (2.22) (2.31) (2.24) На основании значений частостей (2.17-2.24), вычисляем ненормированные С = значения функции принадлежности:
Н = 2 = 0,13 ;
832 511 + + = 1,94 ;
= + + + 1 = 1,91 и их сумму = 0,13 + 1,94 + 1,91 = 3,98. В 15 4 3 15 4 Далее, осуществляя операцию нормирования получим искомое значение функции 0 принадлежности: Н = 1,94 1,91 0,13 0 0 H = = 0,03, С = C = = 0,49, В = B = = 0,48. l 3,98 l 3,98 l 3, Таким образом, прогноз урожайности озимой пшеницы по КБР на 2003 год представляется в виде НТМ U n0+1 = {(H ;
0,03), (C ;
0,49), (B;
0,48)}. В лингвистических терминах этот прогноз можно сформулировать следующим образом: урожайность озимой пшеницы ожидается средней ( С = 0,49) или, что менее вероятно высокой ( В = 0,48). Промежуточные и окончательные результаты работы алгоритма прогнозирования представлены в таб.2.5.
Промежуточные и окончательные результаты работы алгоритма прогнозирования Таблица 2. Переходы l- конфигурации в состояния Н,С,В Прогнозируемый год l - конфигурация Ненормированные значения функции принадлежности В , С, Н Сумма ненормированных значений функций принадлежности Значение функции принадлежности Н, С, В U = {(Н;
Н ), (C;
C ), (В, В )} Прогнозное нечеткое терм-множество ВССНССВВ Н С В 2/14=0,13 8/15+3/4+2/3=1,94 5/15+1/4+1/3+1=1, 3, 0,03 0,49 0, U={(Н;
0,03), (С;
0,49), (В;
0,48)} Применительно к понятию модель, термин верификация означает проверку структуры и логики модели, а термин валидация означает проверку соответствия данных, полученных на основе модели, реальному процессу. Для реализации этих видов проверки построенной прогнозной модели последовательно рассматриваем лингвистические временные ряды u i, i = 1,2,..., m, m = n r, r = 1, n k, (2.25) т.е. ряды (2.25) получаются последовательно путем удаления из ЛВР (2.8) последних r его членов. Для каждого фиксированного индекса m строим прогноз терма u m +1, представляемого в виде НТМ U m +1 = {(H ;
H ), (C ;
C ), (B;
B )}.
Пусть, в полученном НТМ U m+1, среди чисел H, C, B максималь ным является то число , {H, C, B }, у которого индекс совпадает с термом u m +1 ряда (2.8). Тогда, говорим, что для рассматриваемого индекса m прогнозная нечеткая модель привела к непротиворечивому прогнозу. В противном случае, говорим о противоречивом прогнозе для терма u m +1. Для ЛВР (2.8), соответствующего ряду (2.7) урожайности озимой пшеницы по КБР, была проведена валидация прогнозной модели и был получен непротиворечивый прогноз для каждого m = n r, r = 1,2,..., n 8. Иными словами, в процессе валидации прогнозной модели подтверждена адекватность предложенной прогнозной нечеткой модели реальным временным рядам урожайности озимой пшеницы по Кабардино-Балкарской республике. Результаты валидации прогнозной модели сведены в таблицу П4.1, представленной в Приложении 4.
2.7.4. Получение числового прогноза, и оценка его точности Пусть получено лингвистическое прогнозное значение урожайности 0 U n +1 = {(H ;
0,03), (C ;
0,49), (B;
0,48)}.
(2.26) Приведем описание процесса преобразования лингвистического нечеткого множества (ЛНМ) (2.26) в численное (классическое) НМ 0 0 0 Yn0+1 = y H ;
H, y C ;
C, y B ;
B.
{( )( )( )} (2.27) В качестве подходящих числовых значений элементов y u0, u {H, C, B} выбираются в ВР Y (2.7) ближайшие к элементам y u низкие, средние и высокие урожайности, которые затем усредняются:
0 y H = y 47 = 18,9 ;
0 yC = 1 ( y 48 + y 49 ) = 1 (28,4 + 25,5) = 26,85 ;
2 1 ( y 50 + y 51 ) = 1 (31,2 + 32,8) = 32 2 0 yB = Отсюда, с учетом представленных в ЛНМ (2.26) значений функции принадлежности H, C, B получаем искомый прогноз в виде НМ Yn0+1 = {(18,9;
0,03), (26,85;
0,49), (32;
0,48)}. Применяя к НМ Yn0+1 операцию дефазифи кации [24], получаем прогнозное значение урожайности в обычном числовом виде, т.е. Yn0+1 = t y t0 = 0,03 18,9 + 0,49 26,85 + 0,48 32 = 28,6 ц / га, где индексом t =1 t = 1,2, перенумерованы соответственно термы Н,С,В:
1 = H = 0,03, 2 = C = 0,49, B = B = 0,48.
Согласно определению прогнозной модели на ее выходе можно полу чить ВР Y 0 прогнозных значений y i0, i = L, L + 1,..., n, занумерованных тем же индексом, которым были занумерованы значения урожайности в ВР (2.7). Тогда относительная погрешность прогнозирования для каждого наблюдения i {L, L + 1,..., n} вычисляется по формуле i = y i y i0 yi. В качестве оценки точ n 1 ности прогнозирования принимаем среднее значение i = i. n L + 1 i=L Примечание 2.6. На основании валидации результатов прогнозирова ния ВР урожайности озимой пшеницы по Кабардино-Балкарской республике получена оценка средней погрешности прогноза 10% (см. Приложение 5). Оценка погрешности результатов, полученных с помощью предлагаемой прогнозной модели, обосновывается также по отношению такого результата валидации, как ВР лингвистических нечетких множеств U : u i, i = L + 1,..., n. В этом случае погрешность i лингвистического прогно зирования для каждого наблюдения i принимается равной нулю, если в ряду 0 ЛНМ U : u i, i = L, L + 1,..., n для полученного ЛНМ U 0 = {(u10, 1 ), (u 2, 2 ), (u 30, 3 )}, где максимальное значение функции принадлежности = max t достигается 1 t для такого индекса t = t 0, что в ЛВР (2.8) элемент u i совпадает с термом u t0, т.е. i = 0, если выполняется равенство u i = u t0, в противном случае значение i = 1. Погрешность лингвистического прогнозирования определяется как среднее значение = n 1 i. n L + 1 i=L Примечание 2.7. На основании валидации результатов лингвистиче ского прогнозирования ВР урожайности озимой пшеницы по КБР получена оценка средней погрешности прогноза i = 0, т.е. в процессе валидации прогнозная модель выдала точный прогноз в лингвистических термах для каждого года с 1952 по 2002 гг.
Выводы 1. В совокупности результаты главы 2 представляют собой логически завершенный комплекс математических инструментальных методов для моделирования задач землепользования на нижнем уровне, т.е. на уровне получения адекватных значений численных исходных данных. 2.Основным математическим результатом главы 2 является построенная на базе клеточных автоматов и нечетких множеств прогнозная модель для временных рядов с памятью. 3. Методическим, методологическим и инструментальным базисом для предложенной прогнозной модели и базирующегося на ней алгоритма послужили:
- алгоритм R/S- анализа;
- метод фрактального анализа временных рядов, базирующейся на содержательной и качественной интерпретации промежуточных и окончательных результатов работы алгоритма R/S- анализа;
- инструментарий фазовых портретов для выявления циклов временного ряда и уточнения прогноза;
- предложенные методы верификации и валидации прогнозной модели, включая метод вычисления численных и лингвистических оценок точности прогнозирования.
Глава 3. ТЕОРЕТИКО-ГРАФОВЫЕ МОДЕЛИ ЗАДАЧ ЗЕМЛЕПОЛЬЗОВАНИЯ С НЕЧЕТКИМИ ДАННЫМИ 3.1. Общая постановка дискретной многокритериальной задачи в условиях неопределенности данных Любые ситуации, требующие принятия решений, содержат, как правило, большое количество неопределенностей. Их принято разделять на три класса. Прежде всего, это - неопределенности природы - факторы нам просто не известные. Затем - неопределенность противника. Человек всегда существует в условиях, при которых результаты его решений не строго однозначны, они зависят от действий других лиц (партнеров, противников), действия которых он не может полностью учесть или предсказать. И, наконец, существуют так называемые неопределенности целей. В самом деле, перед исследователем всегда стоит несколько целей. Описать их одним показателем (критерием) невозможно. Конструктору самолета, например, необходимо обеспечить не только безопасность пассажиров, но и минимальную стоимость перелета. Экономисту нужно построить такой план, чтобы с минимумом затрат добиться максимума выпуска продукции и т.п., причем эти требования, как мы видим, часто противоречат друг другу. Легко понять, что свести подобные задачи с неопределенностями к точно поставленным математическим задачам нельзя в принципе - для этого надо тем или иным образом снять неопределенности, т.е. ввести какие-то гипотезы. В конечном счете, никогда никакой математический анализ не может дать строгого точного результата выбора альтернатив в условиях неопределенности. Именно с этих позиций надо оценивать и попытку одного из известных современных специалистов в прикладной математике Л.Заде [92,95], который предложил отказаться от какого-либо четкого описания в задачах принятия решений. В основе теории Л.Заде лежит достаточно очевидный факт - субъек тивные представления о цели всегда нечетки. Но он делает и следующий шаг - он полагает, что и все оценки субъекта и ограничения, с которыми он работает, также, как правило, нечетки, а иногда и вообще лишены в своем начальном виде количественных характеристик. Так он приходит к понятию лингвистической переменной - красное, не очень красное, совсем не красное и т.п. - а затем вводит некоторую функцию принадлежности, как способ формализации субъективного смысла этих качественных показателей. В свою очередь, лингвистическая переменная может иметь численное представление в виде нечеткого множества. Техника, развиваемая Л.Заде, основывается на использовании функции принадлежности. Эти функции всегда являются гипотезами. Они дают субъективное или прогнозное представление эксперта (исследователя) об особенностях исследуемой операции, о характере ограничений и целей исследования. Это всего лишь новая форма утверждения гипотез, но она открывает и новые возможности для упомянутой выше неопределенности природы. Имея в своем распоряжении функции принадлежности, исследователь получает в свои руки и определенный аппарат, позволяющий строить числовые оценки для альтернатив. Л.Заде показал, каким образом нечеткую, качественного характера информацию можно использовать в формализованных процедурах численного анализа. По существу, он предложил такое расширение языка математики, которое позволяет учитывать нечеткость исходной информации в математических моделях. Выше упомянутая неопределенность целей в процессе моделирования трансформируется в адекватную постановку дискретной многокритериальной задачи. Последняя состоит из описания условий, определяющих конечное или счетное множество допустимых решений X = { x}, и заданной на X векторной целевой функции (ВЦФ) (1.1)-(1.2). Если фиксированы все параметры ВЦФ (1.1) и система условий, определяющих МДР X, то принято говорить об индивидуальной задаче [17]. Под математическим решением индивидуальной задачи дискретной многокритериальной оптимизации следует понимать нахождение того или иного множества альтернатив (МА). Из найденного МА впоследствии с помощью методов многокритериального выбора [35] осуществляется выбор и принятие решения. Перечислим наиболее известные типы МА: а) X - множество всех допустимых решений (МДР), которое рассматривается в качестве МА в случае, % когда критерий выбора и принятия решения является очень сложным;
б) X паретовское множество (ПМ), состоящее из всех паретовских оптимумов (наряду с определениями 1.1 и 1.2 мы приведем ниже их аналоги определения несравнимых альтернатив в задачах с нечеткими данными);
в) X 0 - полное множество альтернатив (ПМА), которое формально определяется как под % % множество X 0 X минимальной мощности X 0 такое, что F ( X 0 ) = F X, F ( X * ) = {F ( x ) : x X * } X * X [22]. ПМА является обобщением опреде () ленного для 1-критериальных задач понятия лоптимум. Для всякой индивидуальной задачи представленные выше МА образуют иерархически упорядо % ченную цепочку включений X 0 X X.
Pages: | 1 | 2 | Книги, научные публикации