Конспект лекцій 2004 Загальна теорія систем. Конспект лекцій Для студентів денної І заочної форм навчання спеціальності 080200 "Інформатика"/Укл.

Вид материалаКонспект

Содержание


3.1 Этапы построения математических моделей.
Постановка задачи является наиболее трудной частью ее решения. Уме-ние поставить задачу - залог успеха в достижении поставленной
Под структурой понимается совокупность элементов и связей между ними, которые определяются исходя из распределения функций и цел
Структура - есть форма представления некоторого объекта в виде сос-тавных частей
Поскольку априорная информация о структуре объекта трудно форма-лизуема, здесь пока почти полностью господствуют экспертные мето
Задание класса функций F(x,a) является неформальным моментом в постановке задачи. Класс функций должен быть задан априори
Угадывать структуру нелинейных моделей мы пока не умеем. Просто даже не знаем, как подойти к этой задаче
4.1 Эмпирические континуальные методы
Функциональные зависимости, существующие в реальных объектах, обы-чно можно аппроксимировать в рабочей области с достаточной точ
4.5 Анализ эффективности известных методов математического моделирования для изучения реальных систем.
Чем глубже мы анализируем реальную задачу, тем неопределеннее стано-вится ее решение»
Подобный материал:
1   2   3   4   5
Тема 3 ПРОБЛЕМЫ ПОСТРОЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕ-ЛЕЙ

3.1 Этапы построения математических моделей.

При построении эмпирической математической модели изучаемой системы последовательно выполняются следующие этапы:

- Выделение объекта из среды, который включает в себя определение об-ласти исследования в пространстве входных параметров, выбор перечня су-щественных входных параметров, выбор перечня выходных показателей.

- Постановка задачи, которая в общем виде имеет следующую формулиров-ку: определить зависимость выходного показателя от входных параметров.

- Определение структуры модели (структурная идентификация).

- Определение коэффициентов при каждом элементе структуры модели (па-


раметрическая идентификация).

- Оценка адекватности модели изучаемой системе при заданной постановке задачи.


3.1.1 Выделение объекта из среды (постановка задачи, выбор входных параметров и выходных показателей)

Первым этапом математического моделирования является постановка зада-чи, в которую также входят определение объекта и целей исследования, задание критериев изучения объектов и управления ими.

Четкая содержательная постановка задачи - необходимое условие для построения формальной модели, поддающейся количественному анализу. Непра-вильная или неполная постановка задачи может свести на нет результаты всех последующих этапов.

При построении фундаментальных зависимостей постановка задачи требует не только высокой квалификации, но и таланта специалиста в соответсвую-щей предметной области.

В настоящее время искусство постановки задач постигается в практичес-кой деятельности на примерах успешно реализованных разработок и основы-вается на четком представлении преимуществ, недостатков и специфических особенностей различных методов идентификации и оптимизации.

« Постановка задачи является наиболее трудной частью ее решения. Уме-ние поставить задачу - залог успеха в достижении поставленной цели». (Ос-новы научных исследований./Под ред.В.И.Крутова, В.В.Попова. - М.: Высш. школа., 1989.- 400 с.).

Основным этапом при постановке задачи является выбор перечней вход-ных параметров и выходных показателей, между которыми необходимо уста-новить зависимость.

Однако корректных формальных методов для осуществления этого выбора, а также критериев оценки эффективности модели пока не существует.

В настоящее время выбор перечня входных параметров является не форма-лизованной процедурой и, как правило, осуществляется специалистами в соот-ветствующей предметной области на основании имеющихся у него знаний, опыта работы и интуиции.

«Есть еще одна совершенно не формализованная процедура при построении моделей: выбор величин, характеризующих процесс, между которыми устанавливаются определяющие математические связи». (А.А. Дородницын. Проблема математического моделирования в описательных науках. Кибернетика, N4, 1983, с.6-10).

Поэтому, «никогда нет гарантии что отклик и факторы выбраны разум-но». (Горский В.Г, Адлер Ю.П. Планирование промышленных экспериментов. - М.: "Металлургия", 1974, с.264)


В некоторых случаях эта проблема может быть частично упрощена. Напри-мер, при идентификации действующих производств, перечень входных пара-метров может быть заимствован из технологического регламента изучаемого процесса. Однако выбор входных параметров при разработке технологическо-го регламента часто диктуется чисто технологическими причинами, например, возможностью измерения и преобразования информации, а не степенью и фор-мой влияния на выходной показатель.

Ещё сложнее обстоит вопрос с выбором критериев для оценки качества функционирования изучаемой системы. Дело в том, что при идентификации выходной показатель должен быть один, а любая система характеризуется множеством выходных показателей.

Например, качество функционирования технологического процесса в хими-ческой, металлургической, нефтеперерабатывающей и других отраслях про-мышленности определяют следующие показатели:

- производительность;

- себестоимость;

- выход готового продукта на загруженное сырье;

- расходные нормы по энерго - и материальным ресурсам;

- показатели качества сырья (от 2-х до 10 и более показателей);

- количество отходов на единицу полученной продукции и т.п.

- и др.

Из предыдущей информации следует, что в настоящее время истинным является утверждение о том, что «умение хорошо поставить задачу - это искусство».


3.1.2 Построение обобщённого выходного критерия

Различные методы решения многокритериальной задачи отличаются алгоритмом "сворачивания" исходных критериев в один глобальный критерий. Решение этой задачи состоит в поиске и использовании дополнительной информации, с помощью которой многокритериальная задача сводится к одно-критериальной.

«Различные методы решения многокритериальной задачи отличаются видом и способом получения дополнительной информации, а также алгоритмом "сворачивания" исходных критериев в один глобальный критерий».

(Л.А.Расстригин. Современные принципы управления сложными объектами.- : Советское Радио, 1980.- 232 с.).

Допустим переход к всевозможным "обобщенным" критериям, представля-ющих собой скалярную функцию частных критериев, однако этот путь при внешней привлекательности обычно оказывается обманчивым. Неясно, как оп-ределить вид такой функции, трудно (или просто невозможно) обосновать принципы оценки ее параметров (весовых коэффициентов, показателей степе-ней и т.д.) проблематична интерпретация полученных результатов. В общем


же случае происходит замена одних неопределенностей другими, замаскиро-ванная формальными выкладками.

Одним из самых распространенных методов формирования обобщённого критерия является линейная свёртка. Суть её состоит в том, что вместо мно-жества частных критериев (Yi) предлагается рассматривать один обобщённый критерий (Yоб). При этом принимается, что Yоб =∑Ai Yi, где значения Ai – положительные числа, задаваемые экспертами.

Анализ эффективности экспертных методов определения весовых коэффициентов позволяет сделать заключение о том, что в настоящее время не существует такого метода который был бы свободен от недостатков, ограничивающих возможность его использования.

Поскольку корректные методы свёртки множества выходных показателей

в обобщенный критерий оценки качества работы изучаемой системы не извет-ны, идентификация обычно проводится по одному из этих критериев. (В луч-шем случае математическую модель строят по одному критерию с заданными ограничениям на значения других критериев).


3.1.3 Структурная идентификация модели

Под структурой модели в общем случае принято понимать вид элементов, из которых состоит система, и отношений между этими элементами. Структура модели изучаемой системы определяет вид и характер связи между входами (X) и выходами (Y) модели объекта независимо от конкретных значений параметров.

Как и всякое сложное понятие, структура системы имеет множество различных определений. Приведём некоторые из них.

« Под структурой понимается совокупность элементов и связей между ними, которые определяются исходя из распределения функций и целей, по-ставленных перед системой». (Денисов А.А., Колесников Д.Н. Теория боль-ших систем управления. - Л.: Энергоиздат, 1982. 288 с.).

« Структура - есть форма представления некоторого объекта в виде сос-тавных частей» (Овсиевич Б.Л. Модели формирования организационных структур. - Л.: Наука, 1979. 159 с.).

«Структура - это множество всех возможных отношений между под-системами и элементами внутри системы». (Дружинин В.В., Конторов Д.С. Проблемы системологии. - М.: Советское радио, 1976. 295 с.).

При построении математических моделей систем, для которых не установ-лены еще основные математические связи, начинать приходится с поиска структуры математической модели. Эта задача совершенно не формализована

- поиск структуры полностью зависит от объёма соответствующей априорной информации и интуиции исследователя.

« Поскольку априорная информация о структуре объекта трудно форма-лизуема, здесь пока почти полностью господствуют экспертные методы».


(Расстригин Л.А. Современные принципы управления сложными объектами. М.: "Советское радио" 1980, 232 с.)

«Априорная информация об объекте при структурной идентификации мо-дели отсутствует или очень бедна. Методы решения задач структурной идентификации практически не разработаны». (П.Эйкхофф. Основы иденти-фикации систем управления. - М.: Мир, 1975 г., 683 с.).

« Задание класса функций F(x,a) является неформальным моментом в постановке задачи. Класс функций должен быть задан априори». (В.Н. Вап-ник. Восстановление зависимостей по эмпирическим данным. - М.: Наука, 1979 г., 448 с).

«Не существует однозначных рекомендаций по выбору наилучшей струк-туры модели. Невозможно однозначно на основе формальных методов выб-рать наилучшую модель. При решении вопроса о выборе структуры модели исследователь вынужден полагаться на собственную интуицию и имеющую-ся априорную информацию. Литература по выбору структуры модели прак-тически отсутствует». (Ф.И. Бернацкий, В.И. Гладков, Г.К. Деркач и др. Автоматизированное управление процессами химической технологии. - М.: "Наука", 1981, с.216).

В настоящее время структура математической модели выбирается путем подбора из множества альтернативных вариантов.

« Угадывать структуру нелинейных моделей мы пока не умеем. Просто даже не знаем, как подойти к этой задаче). (А.А. Дородницын. Проблема ма-тематического моделирования в описательных науках. Кибернетика, 4, 1983).


3.1.4 Параметрическая идентификация модели

Под параметрической идентификацией модели понимается определение коэффициентов при элементах структуры. Параметрическая идентификация осуществляется на основании таблицы экспериментальных данных с помощью метода наименьших квадратов или какой-либо модификации этого метода.

Использование известных методов параметрической идентификации кор-ректно лишь при условии соблюдения ряда ограничений (входные параметры измеряются без ошибок, все погрешности приведены к выходной переменной, выходная переменная - случайная величина, распределённая по нормальному закону распределения, выходная переменная одна и измеряется в континуаль-ных шкалах, шум белый и т.д.). Следует отметить, что ни одно из этих усло-вий при работе с реальным экспериментальным материалом, полученным пу-тём наблюдения за изучаемой системой, не соблюдается.

Оценки, полученные МНК, оптимальны, если компоненты вектора случай-ых ошибок Ei (i=1,...n) независмые, нормально распределенные случайные ве-личины.


«Ахилесовой пятой пассивного эксперимента оказывется наличие тесных статистических связей между факторами, да и оценки коэффициентов моде-ли оказываются также тесно статистически связанными, и выяснить значи-мость вклада каждой из слагаемых по модели невозможно». (Я.И. Хургин. Как объять необъятное. - М.: Знание, 1985. 192 с.).

Кроме того, все реальные системы характеризуются существенно нелиней-ными зависимостями выходного показателя от входных параметров.

«Для нелинейной регрессии оценки МНК смещённые и неэффективные»

(Е.З. Демиденко. Вычислительные вопросы нелинейной регрессии. Заводская лаборатория, 1986, №3, с.51-54».

«Неидентифицируемость параметров нелинейной модели обусловлена ин-вариантностью модели, точнее функции отклика, к тем или иным преобразо-ваниям параметров, составляющим группы. По существу это обозначает, что причиной неидентифицируемости является их симметрия по парамет-рам». (В.Г. Горский Симметрия по параметрам - причина априорной неиденти-фицируемости нелинейных моделей. Заводская лаборатория, 5, 1987, с.50-54).

Из-за погрешностей известных методов параметрической идентификации выбор оптимальной по каким - либо критериям структуры модели из множест-ва альтернативных структур (метод исключения, метод всех регрессий, метод Эфроимсона, метод группового учёта аргументов и т.п.) является некоррект-ным. При работе с реальным экспериментальным материалом погрешности оценок коэффициентов модели могут быть как угодно большими, и, соответс-твенно, могут быть отброшены более сильные, лучше отражающие физический смысл структуры.


Тема 4. МЕТОДЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ СИС-ТЕМ

4.1 Эмпирические континуальные методы

4.1.1 Корреляционный анализ

Между случайными величинами обычно существует такая связь, при кото-рой с изменением одной величины меняется распределение другой. Такая связь называется стохастической.

В отличие от функциональной зависимости, при которой, зная значение од-ной из величин, можно точно указать значение другой, при стохастической связи с изменением величины Х величина Y лишь имеет тенденцию также изменяться. Эта тенденция соблюдается лишь в среднем, в общих чертах, и в каждом отдельном случае от неё возможны отступления.

Стохастическая связь может быть более или менее тесной, по мере увели-чения тесноты стохастической зависимости она всё более приближается к фун-кциональной. Функциональную зависимость можно рассматривать как пре-


дельный случай наиболее тесной стохастической связи. Другой крайний слу-чай – полная независимость случайных величин.

Назначение корреляционного анализа - исследование тесноты связи между переменными.

Количественной оценкой тесноты стохастической связи является коэффи-циент корреляции.

Коэффициент корреляции определяется только при линейной связи и в слу-ае совместного нормального распределения исследуемых величин имеет четкий смысл, как характеристика тесноты связи. На практике, как правило, закон распределения не известен

Если 2 случайные величины X и Y независимы, то дисперсия этих величин равна сумме дисперсий D(X+Y) = D(X) + X(Y). Если данное равенство не соб-людается, это признак зависимости.

Теснота связи между случайными величинами X и Y определяется с помо-щью коэффициента корреляции rxy. r xy = M [(X - mx)(Y - my)/ δxδy)], где:

- M - математическое ожидание

- mx и my математические ожидания величин X и Y

- δx и δy средние квадратичные отклонения величин X и Y

Коэффициент корреляции одновременно отмечает долю случайности и нелинейности связей между X и Y. Зависимость между X и Y может быть близкой к функциональной, но существенно нелинейной, а коэффициент корреляции будет значительно меньше единицы.


4.1.2 Дисперсионный анализ

Дисперсионный анализ состоит в выделении и оценке отдельных факторов, вызывающих изменчивость изучаемой случайной величины (выходного показателя). Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от её математического ожидания, т.е. D (X) = M (X- mx)2

Сущность дисперсионного анализа состоит в отделение дисперсии припи-сываемой одной группе причин, от дисперсии, приписываемой другим группам.

Дисперсионный анализ применяется для разложения суммарной дисперсии на дисперсии от каждого из входных параметров.

Свойства дисперсии:

- Дисперсия неслучайной величины равна 0 (D[С] = 0).

- Дисперсия случайной величины (X) равна математическому ожиданию квад-рата случайной величины минус квадрат её математического ожидания:

D[X] = M [X2] – mx2

- Дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин: D [X1+X2+…Xn] = D(X1)+ D(X2)+ ….D


При использовании дисперсионного анализа должны выполняться следу-ющие допущения:

- случайные ошибки наблюдений имеют нормальное распределение;

- факторы (входные параметры) влияют только на изменение средних значе-ний, а дисперсия наблюдений остаётся постоянной;

- эксперименты равноточны.

В реальных системах допущения, при которых обеспечивается корректное использование дисперсионного анализа, как правило, не соблюдаются.

Поэтому «ни один исследователь не скажет заранее только по величине изменения переменной (т.е. ее дисперсии) значима или незначима она в данном процессе». (Андрукович П.Ф. Применение метода главных компонент в регрессионном анализе. Заводская лаборатория, 3, 1970, с.312-318).


4.1.3 Факторный анализ

Задача факторного анализа состоит в замене множества исходных факто-ров меньшим их числом. Эти новые общие факторы являются линейной ком-бинацией исходных факторов. Существует различные методы получения та-кого сокращенного множества общих факторов. Оказалось, что одна и та же матрица может быть факторизована бесчисленным количеством способов.

Выбор того или иного метода факторного решения производится на осно-вании двух принципов - статистической простоты и логического смысла.

С точки зрения статистики оптимальным является следующий метод: исходный набор факторов заменяется общими факторами, определяемыми последовательно. Сначала определяется общий фактор, имеющий наибольшую дисперсию. Затем определяется общий фактор, имеющий наибольшую дисперсию из оставшегося множества факторов и т.д. (Метод Пуассона).

В основе различных моделей факторного анализа лежит следующая гипо-теза: наблюдаемые или измеряемые величины являются лишь косвенными ха-рактеристиками изучаемого объекта или явления, на самом же деле существу-ют внутренние (скрытые, не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения наблюдаемых величин.

В процессе факторного анализа необходимо определить такое число общих факторов, чтобы при минимальном их числе наиболее точно описать резуль-тирующие величины. Необходимо определить структуру этих факторов, как линейную комбинацию исходных.

При изучении реальных систем базовые посылки, на которых обосновано корректное применение факторного анализа, как правило, не соблюдаются.

Например, в химической технологии эти факторы, (макрокинетика, массо-обмен, теплообмен и гидродинамика) достоверно известны, и точно установ-лено, что эти факторы существенно взаимосвязаны. Поэтому, для практичес-


кого применения математического аппарата факторного анализа необходима разработка инженерных методик, учитывающих специфические особенности конкретного объекта исследования.


4.1.4 Регрессионный анализ.

С помощью регрессионного анализа по данным статистических наблюдений изучается зависимость выходного показателя от входных параметров изучаемой системы.

Регрессионный анализ является практически единственным эмпирическим методом, применяемым в настоящее время для построения математических моделей систем, с числом входных параметров более 2-ух.

Исходной информацией для построения моделей Y=F (Xi), i=1,n является таблица экспериментального материала, каждая строка которой содержит значения входных параметров и выходных показателей в одной реализации процесса.

Построение регрессионной модели изучаемой системы осуществляется в 2 этапа.

1 этап - Структурная идентификация - задание структуры (общего вида) математической модели. Обычно структура модели задаётся в виде полинома Колмогорова - Габора:

Y=A0 + Ai*Xi + Aij*XiXj + Aijl*XiXjXl+..., i=1,n

2 этап - Параметрическая идентификация - определение коэффициентов при членах полинома. Параметрическая идентификация осуществляется на основании таблицы экспериментальных данных с помощью метода наименьших квадратов (или какой-либо модификации этого метода).


4.2 Начальные посылки, при которых корректно использование регрессионного анализа.

Основными посылками, при выполнении которых использование регрессионного анализа является корректным:

1. Зависимая переменная (выходной показатель)Y является нормально распределённой случайной величиной при каждом фиксированном значении X.

2. В случае, когда аргумент (входной параметр) Х случаен, совместное распределение Х и Y должно быть нормальным.

3. Дисперсия зависимой переменной Y остаётся постоянной при изменении значения аргумента X

4. Наблюдения Xi и Yi стохастически независимы, т.е. результаты, полученные на i -ом шагу эксперимента, никак не связаны с предыдущими и не содержат никакой информации о последующих наблюдениях.

5. Изменение каждого контролируемого параметра представляет собой нор-мально распределённый случайный процесс, обладающий свойствами эрго-дичности.


6. Каждый неконтролируемый параметр характеризует случайно и независимо действующий фактор, среди которых нет доминирующих

7. Все неконтролируемые параметры некоррелированны с контролируемыми параметрами, а их изменения представляют случайный стационарный процесс с нулевым математическим ожиданием

8. Все независимые переменные должны быть включены в рассмотрение.

9. Независимые переменные измеряются без ошибок или с пренебрежительно малыми ошибками, по сравнению с ошибкой зависимой переменной.

10. Зависимая переменная образует случайный процесс типа белого шума.


Метод регрессионного анализа имеет следующие недостатки:

1. Хотя корректность математического описания любого объекта в режиме статики полиномом Колмогорова - Габора строго математически доказана, сплошь и рядом встречаются случаи, когда такое описание некорректно.

Например, полнота превращения исходных компонентов в конечный продукт (а значит и выход продукта) определяется не произведением компонентов, а отношением доли каждого из компонентов к основному веществу. Точно так же свойства композиционного материала определяются не произведением компонентов исходной смеси, а их отношениями.

2. Число членов полинома Колмогорова - Габора экспоненциально возрастает при увеличении количества входных параметров n. Поскольку формальный выбор структуры при n>8 практически неосуществим, эксперт должен оценить каждый из множества элементов структуры полинома Колмогорова - Габора (как линейный, так и нелинейный) как существенный или несущественный.

Такой информацией он просто не владеет. Из-за огромного дефицита объективной информации о структуре модели она задаётся на основании априорной информации специалистов в соответствующей предметной области или эвристик специалистов по математическому моделированию, существенно упрощающих реально существующие закономерности (объект стационарен, линеен, может быть описан моделью с сосредоточенными параметрами и т.д.)

Очевидно, что с помощью математической модели, в которой для синтеза структуры использованы субъективное представления экспертов, получить сколько - нибудь существенную нетривиальную информацию о системных закономерностях функционирования реального сложного объекта не представ-ляется возможным.

3. Использование известных методов параметрической идентификации - метода наименьших квадратов и его многочисленных модификаций корректно лишь при условии соблюдения ряда ограничений (входные переменные измеряются без ошибок, все погрешности приведены к выходной переменной, выходная переменная - случайная величина, распределённая по нормальному за-кону распределения, выходная переменная одна и измеряется в континуальных


шкалах, шум белый и т.д.). Следует отметить, что ни одно из этих условий при работе с реальным экспериментальным материалом не соблюдается.

4. При построении регрессионной модели выходной показатель должен быть один и измеряться в континуальных (численных) шкалах. Эффективность функционирования любого технологического процесса всегда определяется несколькими выходными показателями (производительность, выход целевого продукта, показатели его качества и др.).

«Обычно многокритериальная задача сводится к линейной свертке кри-териев - комбинированному критерию вида: k = Аj Cj; Aj=1. Меняя весовые коэффициенты Аj c учетом ограничения на их сумму можно получить эф-фективное решение задачи, принадлежащей области Парето». (А. Г. Ивахненко, В.С. Степашко. Помехоустойчивость моделирования. - Киев: Наукова думка, 1985. -216 с.)

Формальных методов свёртки вектора выходных показателей, измеряемого в континуальных шкалах, в обобщённый критерий не существует, а попытки осуществить эту свёртку по экспертным оценкам всегда некорректны.

Было предпринято много попыток усовершенствовать регрессионный анализ с целью устранения присущих ему недостатков. Однако ни в одной из его модификаций не удалось решить поставленную задачу при реальном коли-честве входных переменных реального технологического процесса.

Ниже приводятся высказывания специалистов по идентификации систем об ограничениях возможностей регрессионного анализа.

«Посылка регрессионного анализа: все независимые переменные должны быть включены в рассмотрение. А если это не так - часть независимых пере-менных нельзя включать из-за трудной измеримости, то коэффициенты рег-рессии будут искажены систематическими ошибками». (В.В. Налимов. Бли-зорукий, но не слепой. Знание-сила, 1, 1984, с.33-35)

«Ошибки в измерении переменной Xi всегда вызывают уменьшение алгеб-раической величины соответствующего коэффициента Ai; это уменьшение пропорционально значению Ai и коэффициенту корреляции между перемен-ной Xi и остальными переменными и обратно пропорциональна дисперсии переменной Xi. Чем сильнее коррелированны независимые переменные, тем сильнее искажаются регрессионные коэффициенты». (В.П. Бородюк. Вли-яние ошибок регистрации переменных на точность регрессионного уравне-ния. Заводская лаборатория, 1, 1970, с.62-68).


«Как правило, исследователю неизвестна истинная модель регрессии, т.е. неизвестно, какие факторы входят в регрессию. Поэтому ошибка от недо-бора и перебора факторов является весьма существенной. Если имеется не-добор переменных, то используемая оценка будет смещённой – неучтённая часть уравнения регрессии равномерно распределится в оценки с помощью до-весков. Суть этих довесков - регрессия неучтённых факторов на учтённые.


Оценка метода наименьших квадратов (МНК) в случае недобора перемен-ных является несостоятельной. К результатам, полученным с помощью МНК, особенно для многофакторных регрессий, следует относиться осто-рожно, не делая скоропалительных выводов.

В случае использования метода максимального правдоподобия (ММП) мы должны знать дисперсии величин хотя бы с точностью до постоянного мно-жителя. Если такой информации не имеется, то оценок ММП не существу-ет». (Е.З. Демиденко. Линейная и нелинейная регрессия. - М. Финансы и статистика. 1981)

«Для нелинейной регрессии оценки МНК смещённые и неэффективные»

(Е.З. Демиденко. Вычислительные вопросы нелинейной регрессии. Заводская лаборатория, 1986, №3, с.51-54».

«Ахиллесовой пятой пассивного эксперимента оказывается наличие тес-ных статистических связей между факторами, да и оценки коэффициентов модели оказываются также тесно статистически связанными, и выяснить значимость вклада каждой из слагаемых по модели невозможно». (Я.И. Хур-гин. Как объять необъятное. - М.: Знание, 1985. 192 с.)

«При пассивном эксперименте неуправляемые факторы (хотя и извест-ные) будут делать любые вычисленные математические эффекты управляемого фактора настолько запутанными, что они станут бесполезными для управления». (Дрейпер Н., Смит Г. Прикладной регрессионный анализ. - М.: "Статистика", 1973. с.392).


4.3 Модификации регрессионного анализа, методы:

Практически все известные модификации регрессионного анализа предназ-начены для решения одной единственной задачи – формализации этапа струк-турной идентификации. В каждом из них с помощью различных ухищрений делается попытка формализовать процесс выбора структуры модели.


4.3.1 Всех возможных регрессий

Строятся все возможные уравнения регрессии из n переменных, и оце-нивается эффективности каждого из них по значениям квадрата множест-венного коэффициента корреляции R2. Проводятся последовательно расчёт для серий с одним, двумя, тремя и т.д. членами. Для каждой серии вычисляют оценку R2, и если в лучшем уравнении она недостаточна, переходят к следующей серии, и т.д.

Число членов уравнения регрессии экспоненциально зависит от размернос-ти задачи (количества входных параметров). Соответственно, трудозатраты на построение модели методом всех возможных регрессий также экспоненциаль-но возрастают с увеличением размерности задачи.


При числе переменных более 5 затраты машинного времени становятся чрезмерными, возрастают также прямые физические усилия, связанные с ис-следованием всех результатов вычислений


4.3.2 Включения и исключения

Метод включения:

Определяют частные критерии корреляции каждого входного параметра с выходным показателем.

Последовательно включают по одному параметру и проверяют удовлетворительность получаемых уравнений по заранее выбранному критерию.

Порядок включения определяется при помощи частного критерия корреля-ции как меры важности переменного, ещё не включённого в уравнение.

Метод исключения:

Рассчитывается регрессионное уравнение, включающее все переменные. Рассчитывается величина F-критерия для каждой из переменных, как будто она была последней переменной, введённой в регрессионное уравнение.

Наименьшая величина частного F-критерия (Fi min) сравнивается с заранее выбранным уровнем значимости Fо. Если Fi min < Fо, соответствующая пере-менная исключается и производится перерасчёт уравнения регрессии. Эта про-цедура повторяется для вновь полученного уравнения регрессии и т.д. до тех пор, пока Fi min не станет больше, чем Fо.


4.3.3 Шаговый

Улучшенный вариант метода включения. Параметр, который может быть наилучшим отдельным параметром, достойным введения в модель на ранней стадии, на более поздней стадии может оказаться излишним из-за взаимосвязи между ним и другими параметрами, включёнными в модель на последующих шагах. Чтобы проверить это на каждом шаге для каждого пара-метра вычисляют частный F-критерий. Это позволяет сделать вывод о том, ка-кой вклад может сделать каждый параметр в предположении, что он введен в модель последним, безотносительно к тому, когда он введен на самом деле. Любой параметр, дающий незначительный вклад исключается из модели. Этот процесс продолжается до тех пор, пока никакие параметры не будут добав-ляться к уравнению и исключаться из него.


4.3.4 Ступенчатый

Идея метода: После того, как получено регрессионное уравнение для переменной Xi, наиболее сильно коррелированной с выходной переменной Y, находят остатки Zi=Yi-Y. Эти остатки рассматриваются как значения нового отклика, и строится регрессионная зависимость нового отклика от одной из оставшихся переменных, наиболее сильно коррелированной с новым откликом.

4.3.5 Группового учёта аргументов (МГУА)


Алгоритм реализации метода.

Дано: таблица экспериментального материала

1. Исходные данные делятся на обучающую и проверочную выборки.

2. Генерируется сочетания из всех входных переменных по 2.


3. Выбирается полином для описания входных переменных и их произведений.

4. Для каждой пары переменных составляется частное описание Y=F(Xi,Xj).

4.1. Y=a0+a1Xi+a2Xj+a3XiXj или

4.2. Y=a0+a1Xi+a2Xj+a3XiXj+a4XiXi+a5XjXj

5. Для каждого частного описания коэффициенты a определяются с помощью метода наименьших квадратов по данным обучающей выборки.

Каждое частное описание рассматривается как упрощённая модель устанавливаемой функции.

6. Выбирается критерий внешнего дополнения (критерий несмещенности, регулярности, баланса переменных и др.).

7. Каждая из частных моделей проверяется по всем строкам проверочной выборки, и модели ранжируются по величине соответствия критерию внешнего дополнения.

8. Задается количество частных моделей (n), которые должны перейти на следующий уровень селекции.

9. Выбранные по пп 7,8 n частные модели переносятся на 2-ой уровень селекции.

10. На 2-ом уровне селекции все частные модели рассматриваются как входные переменные, по которым необходимо составить перечень всех парных сочетаний: Z1=F(Y1,Y2), Z2=F(Y1,Y3), Z1=F(Y1,Y4) и т.д.

11. Для сочетаний, полученных по п.10. повторяют процедуры пп. 5-9.

12. И так далее.

Если на следующем K-ом уровне селекции минимум отклонений, полученный на проверочной выборке, становится больше, чем на предыдущем, происходит остановка алгоритма и в качестве окончательной выбирается лучшая (по выбранному критерию) модель из предыдущего шага.

Алгоритм останавливается сразу же по достижении единственного мини-ума отклонений, полученных на проверочной выборке. Тем самым выби-рается модель оптимальной сложности, устанавливающая компромисс между сложностью и объемом информации, используемой при синтезе модели.


Недостатки метода:

- интуитивный выбор критериев селекции для отбора частных моделей (n), которые должны перейти на следующий уровень селекции;


- не формализована процедура определения количества частных моделей (n), которые должны перейти на следующий уровень селекции;

- уже на втором уровне селекции рассматриваются переменные в 4 степени, на 3-ем - в 8 степени и т.д., тогда как большинство действующих производств может быть описано полиномами 2 степени.

" Функциональные зависимости, существующие в реальных объектах, обы-чно можно аппроксимировать в рабочей области с достаточной точностью полиномами вторых порядков". (В.М. Ордынцев Математическое описание объектов автоматизации. М.: Машиностроение,1965 г, с.360).

Основным недостатком всех известных модификаций регрессионного ана-лиза является то, что эффективность альтернативных структур оценивается после оценки коэффициентов модели с помощью метода наименьших квадра-тов или его модификаций. Как правило, ограничения, при которых корректно использование известных методов параметрической идентификации для слож-ных систем не выполняются. Следовательно, оценки коэффициентов не кор-ректны и, соответственно некорректен выбор «оптимальных» структур на ос-новании использования этих оценок.

"Результаты применения многомерного регрессионного анализа, как пра-вило, оказываются негативными". (Веселая Т.Н. О применении многомерного регрессионного анализа при исследовании технологических процессов. Завод-ская лаборатория,. 3, 1966 г.).


4.5 Анализ эффективности известных методов математического моделирования для изучения реальных систем.

Реальные системы немалой размерности в принципе не могут быть точно описаны с помощью континуальной математики.

Наличие среди входных переменных наблюдаемых не измеряемых и просто ненаблюдаемых параметров существенно влияющих на выходные показа-тели является специфической особенностью любого реального объекта, процесса, системы, явления.

Кроме того, качество работы реальных объектов, как правило, определяет-ся не одним, а несколькими показателями.

Построение математической модели реального объекта (процесса, систе-мы, явления) состоит из 4-ёх этапов:

- постановки задачи (выделения изучаемой системы из среды, т.е. опреде-ления перечня входных параметров и выходных показателей;

- структурной идентификации (задания общего вида математической мо-дели);

- параметрической идентификации (определения коэффициентов при каж-дом элементе структуры);

- свёртки вектора выходных переменных в обобщённый критерий, измеря-емый в континуальных шкалах.


Каждый из этих этапов представляет собой самостоятельную проблему, для которой в настоящее время корректные (формальные) методы решения не из-вестны. Более того, существует достаточно обоснованное мнение, что эти про-блемы не могут быть решены в принципе, т.е. корректную континуальную ма-тематическую модель реального сложного объекта построить невозможно.

В этих случаях справедлив афоризм - "нет математической модели объекта - невозможно его оптимизировать".

В случае, если появятся гении, которые решат указанные выше проблемы, возникнет новая ещё более сложная проблема реализации оптимального уп-равления, т.е. синтеза системы управления, которая могла бы удерживать ре-альный объект в определенной при оптимизации точке многомерного прост-ранства входных переменных.

На примере действующих производств в химии и металлургии, обладаю-щих мощным шумовым полем, вызываемым большим количеством ненаблю-даемых и неуправляемых входных параметров, очевидно, что реализовать та-кую систему и обеспечить её эффективную работу не поможет даже чудо.

Из выше сказанного можно сделать вывод о том, что постановка задачи идентификации сложных реальных объектов, описанных в терминах конти-нуальной математики, в принципе некорректна.

Вот что думают по этому поводу специалисты.

«Вопреки развитию теории, возможностей и реального применения иден-тификации, все же следует признать, что основные результаты получены для объектов с одним входом и одним выходом». (П. Эйкхофф. Оценка пара-метров и структурная идентификация. (Обзор). Автоматика. 1987, N6, с.21-38).


«По глубоко укоренившейся традиции научного мышления понимание явле-ния отождествляют с возможностью его количественного анализа.

Чем сложнее система, тем менее мы способны дать точные и в то же время имеющие практическое значение суждения о ее поведении.

Для систем, сложность которых превосходит некоторый пороговый уро-вень, точность и практический смысл становятся практически взаимоисклю-чающими друг друга характеристиками.

Чем глубже мы анализируем реальную задачу, тем неопределеннее стано-вится ее решение».

(Л.А. Заде. Основы нового подхода к анализу сложных систем и процессов принятия решений. В сб. "Математика сегодня". - М.: "Знание",7,1974. 64 с.).


«Описанием закономерностей в механике, физике и астрономии исчерпы-ваются конструктивные достижения непрерывной математики. В сравни-тельно несложных задачах непрерывная математика позволяет получить аналитическим путем явные решения и обеспечивает установление наглядных зависимостей вариации решений от изменения параметров. Однако это дос-


тоинство непрерывной математики утрачивается по мере усложнения за-дач, анализ которых невозможен без численного решения каждой индивиду-альной задачи класса. В терминах непрерывной математики ставятся и ис-следуются относительно "хорошие" задачи. В терминах дискретной мате-матики требования к формализации задачи менее жесткие.

С некоторых пор не только физики и представители других естественных наук, но и математики начинают склоняться к целесообразности описания реальных явлений не на языке математики бесконечного и непрерывного, а на языке конечного, дискретного».

(Юдин Д.Б., Юдин А.Д. Математики измеряют сложность. - М.: Знание, 1985. -192 с.)

По принятой в настоящее время в науке парадигме эмпирическое исследо-вание считается корректным, если оно заканчиваться построением адекватной математической модели, позволяющей установить существенные закономер-ности изучаемого объекта (процесса, явления).

Однако, для множества наиболее интересных научно - исследовательских и прикладных задач, связанных с изучением объектов (процессов), по своим ин-формационным характеристикам относящихся к классу «больших систем» (высокая размерность векторов входных и выходных переменных, наличие сложных нелинейных зависимостей между входными и выходными перемен-ными, и пр.) в настоящее время не имеется адекватного математического ап-парата, пригодного для их идентификации с помощью методов контину-альной математики.

Выводы

1. Практически все созданные человеком технические, биологические, ме-дицинские и другие «большие системы» неоптимальны и имеют большие ре-зервы для совершенствования.

2. Все действующие технологические процессы в металлургии, химии, нефтепереработке, биотехнологиях и др. отраслях промышленности работают не в оптимальных режимах и имеют существенные резервы по снижению себестоимости, энерго- и ресурсосбережению, повышению производительности и качества продукции, сокращению количества отходов производства и дру-гим показателям.

3. Неоптимальность функционирования действующих производств объяс-няется в первую очередь отсутствием корректных формальных методов иден-тификации и оптимизации действующих производств.

4. Для решения задачи существенного и практически беззатратного повы-шения эффективности работы действующих производств разработана, апроби-рована и прошла многолетнюю всегда успешную экспериментальную провер-ку интеллектуальная методология изучения больших систем (ИМИБС).

5. Например, ИМИБС позволяет ставить и решать единственно корректную на сегодняшний день для Украины задачу: - "В действующих производствах,


на основании экспериментальных данных о значениях входных параметров и выходных показателей, фиксируемых в режиме нормальной работы, найти условия проведения технологических режимов, обеспечивающие получение про-дуктов с заданными показателями качества и минимальной себестоимостью".

Решение этой задачи приводит к сокращению расходных норм по сырье-вым и энергетическим ресурсам, сокращению количества отходов производ-ства и снижению себестоимости и повышению качества продукта.