Східноукраїнський національний університет

Вид материалаКонспект
Тема 3. новые методы математического моделиро-вания «больших систем». - редукция к системным свойствам изучаемого процесса.
3.1. Требования к исходной экспериментальной информации
3.2. Идентификация изучаемого объекта (процесса, системы, явления) с помощью метода мозаичного портрета.
3.3. Область применения метода мозаичного портрета
3.4. Использование метода мозаичного портрета для прогнозирования поведения и диагностики «больших систем»
3.5. Построение мозаичной модели на примере стадии конденсации альдегидов в производстве пентаэритрита
3.5.1. Выбор границ поддиапазонов
3.5.2. Переход к измерению входных параметров и выходного показателя в дискретных шкалах
3.5.3. Построение системной модели с помощью метода мозаичного портрета
3.5.4. Содержательная интерпретация высказываний мозаичной модели (формальных гипотез) на технологическом языке
Подобный материал:
1   2   3   4   5   6
ТЕМА 3. НОВЫЕ МЕТОДЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРО-ВАНИЯ «БОЛЬШИХ СИСТЕМ». - РЕДУКЦИЯ К СИСТЕМНЫМ СВОЙСТВАМ ИЗУЧАЕМОГО ПРОЦЕССА.

План

1. Требования к исходной экспериментальной информации при построении одномерной модели.

2. Идентификация изучаемого объекта (процесса, системы, явления) с помощью метода мозаичного портрета.

3. Область применения метода мозаичного портрета

4. Использование метода мозаичного портрета для прогнозирования поведения и диагностики «больших систем»

5. Построение мозаичной модели на примере стадии конденсации альдегидов в производстве пентаэритрита

6. Содержательная интерпретация высказываний мозаичной модели (формальных гипотез) на технологическом языке


Ключевые понятия и термины

Редукция к системным свойствам. Метод мозаичного портрета. Дискретные шкалы. Реализация процесса. Высказывание. Мозаичная модель. Диагностика. Прогноз. Интерпретация высказываний. Гипотеза.


В теме 1 было показано, что с помощью известных математических методов континуальной (непрерывной, численной) математики невозможно построить адекватную системную модель реального технологического процесса.

В сравнительно несложных задачах непрерывная математика позволяет получать аналитическим путем явные решения и обеспечивает наглядное представление закономерностей, связывающих значения входных параметров и выходных показателей.

«Описанием закономерностей в механике, физике и астрономии исчерпываются конструктивные достижения непрерывной математики. В терминах непрерывной математики ставятся и исследуются относительно "хорошие" задачи. В терминах дискретной математики требования к формализации задачи менее жесткие». (Юдин Д.б., Юдин А.Д. Число и мысль. Вып.8 (Математики измеряют сложность). - М: Знание, 1985.-192 с.)

При переходе к измерению входных параметров и выходных показателей технологического процесса в дискретных шкалах задача построения математической модели существенно упрощается. Уходят проблемы структурной и параметрической идентификации модели, появляется возможность корректной формальной свёртки вектора выходных показателей в обобщённый критерий.

«С некоторых пор не только физики и представители других естественных наук, но и математики начинают склоняться к целесообразности описания реальных явлений не на языке математики бесконечного и непрерывного, а на языке математики конечного и дискретного». (Юдин Д.б., Юдин А.Д. Математики измеряют сложность).

Но, так же как и в методах континуальной математики, в дискретной математике остаётся нерешённой проблема размерности задачи (количества входных параметров).

Поэтому задачи дискретной идентификации и оптимизации являются наиболее трудными, так как для них до настоящего времени, за исключением частных случаев, не найдены общие методы решения, кроме полного перебора всех возможных вариантов. Поскольку полный перебор характеризуется экспоненциальным ростом времени от размерности задачи, то реальные технологические задачи являются практически неразрешимыми.


Для решения задачи построения математической модели изучаемого процесса по экспериментальным данным разработан, математически обоснован и прошел успешную экспериментальную проверку новый метод идентификации - метод мозаичного портрета (ММП)

ММП является единственным из методов дискретной математики, который позволяет за приемлемое время строить математические модели объектов с практически неограниченной размерностью векторов входных параметров и выходных показателей.


3.1. Требования к исходной экспериментальной информации

Исходной информацией для построения мозаичной модели служит таблица экспериментальных данных (см. таблица 1, тема 4), каждая строка которой содержит значения входных параметров и выходных показателей в одной реализации процесса.

Под реализацией процесса понимается:

- в периодических производствах - операция (в малотоннажной химии), плавка (в конвертерном, мартеновском и электропечном производстве стали) и т.п.;

- в непрерывных производствах - средние значения входных параметров и выходных показателей за фиксируемый промежуток времени, превышающий время пребывания обрабатываемой среды в технологической схеме (например, среднесуточные значения в доменном процессе или среднесменные значения в непрерывных химических производствах).

Независимо от количества входных параметров число строк таблицы должно быть не менее 50.


3.2. Идентификация изучаемого объекта (процесса, системы, явления) с помощью метода мозаичного портрета.

Сущность метода мозаичного портрета заключается в:

1. Свертке множества выходных показателей в обобщенный критерий Yоб, измеряемый в дискретных шкалах наименований и принимающий два значения: 1-"хорошо", если все частные выходные показатели в данной реализации процесса удовлетворяет заданным ограничениям, и 0-"плохо", если хотя бы один из этих показателей не удовлетворяет заданным ограничениям.

2. Формализованном переходе к измерению входных параметров в дискретных шкалах.

Диапазон вариаций параметра Х1 делится на 3 поддиапазона из условия попадания в каждый поддиапазон одинакового количества опытов (примерно одинакового - если число опытов в таблице экспериментального материала не кратно 3 или по разные стороны границы между двумя поддиапазонами находятся одинаковые значения). Границы поддиапазонов определяются как средние между значениями в последнем опыте предыдущего и первом опыте последующего поддиапазонов. Каждому поддиапазону присваивается порядковый номер (код). Каждое значение входного параметра Xi кодируется - вместо численного значения записывается код поддиапазона, в который попадает это значение.

3. Переходе от исходной таблице экспериментальных данных к новой таблице, в которой все значения входных параметров и выходных показателей приведены в дискретных шкалах в соответствии с пп. 1 и 2.

4. Организации полиномиальной по трудозатратам формализованной процедуры, позволяющей в таблице (см.п.3) находить сочетания кодов поддиапазонов входных параметров, которые встречаются только в опытах с обобщенным критерием (Yоб), имеющим значение 1, и отсутствуют во всех опытах с Yоб=0 (строится модель «хорошего» класса). Затем процедуру повторяют - ищут сочетания кодов поддиапазонов входных параметров, которые встречаются только в опытах с Yоб =0) и отсутствуют во всех опытах с Yоб=1 (строится модель «плохого» класса).

Полученное при реализации п.4 множество сочетаний (высказываний) составляет мозаичную модель изучаемого процесса.

Следует отметить, что задача дискретной идентификации до разработки ММП считались NP-полной, т.е. практически неразрешимой за приемлемое время.

Например, с помощью ММП задача идентификации объекта по экспериментальным данным с 98 входными параметрами была решена за 11 минут. По тем же данным усечённая задача (10 параметров) методом перебора была решена за 21 сек. Расчётное время на решение полной задачи перебором составило бы 21*3(98-10) сек или 7.4*1035 лет (здесь 3 - число поддиапазонов, на который делились диапазоны вариаций значений каждого параметра при переходе к дискретным шкалам).


3.3. Область применения метода мозаичного портрета

Метод мозаичного портрета (ММП) может быть использован для идентификации объектов (процессов, систем, явлений) любой физической природы, с практически любым количеством входных параметров и выходных показателей, которые могут быть представлены в виде «чёрного» ящика с n входами и k выходами.

Исходными данными для идентификации является таблица экспериментального материала, полученного в режиме наблюдения за изучаемым объектом, каждая строка которой содержит значения входных параметров и выходных показателей в одной его реализации. При увеличении количества строк таблицы растёт адекватность модели. Результаты практического применения ММП показывают, что число строк таблицы должно быть не менее 50.

С помощью ММП могут быть получены общие закономерности каких-либо процессов, освобождённые от влияния индивидуальных особенностей объектов, на которых собиралась исходная экспериментальная информация. Например:

- По экспериментальной информации, характеризующей процесс доменной плавки, полученной с различных домен, можно выявить общие закономерности доменной плавки, освобождённые от влияния индивидуальных особенностей каждой из них.

- По экспериментальной информации, собранной для построения модели дифференциальной диагностики внутри группы близких по проявлениям заболеваний, можно найти дифференциальные синдромы, специфичные для каждой болезни, независимо от показателей, характеризующих индивидуальность больного.


3.4. Использование метода мозаичного портрета для прогнозирования поведения и диагностики «больших систем»

В случае, если необходимо прогнозировать поведение изучаемого объекта при определённых значениях его входных параметров, реализуется следующая полностью формализованная процедура:

1. Строка значений всех входных параметров состояния объекта, кодируется кодом, принятым при построении мозаичной модели.

2. Сопоставление кодированной строки с мозаичной моделью позволяет выделить сочетания кодов поддиапазонов, полностью совпадающие с высказываниями модели. Если в анализируемой строке встречаются высказывания:

- только одного класса - принимается решение о принадлежности этой строки к соответствующему классу;

- разных классов - вопрос о принадлежности строки к определённому классу принимается с помощью голосования - по большинству высказываний одного из классов.

Наиболее эффективна эта процедура при проведении формальной дифференциальной диагностики близких по проявлениям заболеваний и прогнозе последствий и осложнений болезни в медицине.


3.5. Построение мозаичной модели на примере стадии конденсации альдегидов в производстве пентаэритрита

Исходные данные для идентификации процесса приведены в таблице 1 (темы 5). Проведенный анализ работы конденса1.торов показал их существенную индивидуальность. Так средний выход пентаэритрита для каждого конденсатора составил соответственно: 1-ый - 89.13 %; 2-ой - 86.41 %; 3-ий - 88.39 %; 4-ый - 88.05 %

Поэтому при построении мозаичной модели дополнительно в качестве входного параметра включён номер конденсатора. Таблица 2 полностью соответствует таблице 2 (тема 4), за исключением того, что номера параметров смещены на 1 (X1 - номер конденсатора).


3.5.1. Выбор границ поддиапазонов

Таблица 2


Входные параметры и единицы их измерения

min

гр1

гр2

max

К-во строк в поддиапазонах

X1- Номер конденсатора

1-4

X2- Содержание метанола в формалине, %

0.0

0.35

2.65

3.7

20 26 21

X3-Температура в начале дозировки ацетальдегида, °С

9

12.5

б.5

17

28 19 20

X4-Темпервтура в конце дозировки ацетальдегида, °С

15

27.5

36.5

42

22 24 21

X5-Темпер. реакционной массы в конце выдержки, °С

35

39.5

41.5

44

19 22 26

X6- Длительность дозировки ацетальдегида, мин

20

32.5

39.0

118

26 13 28

X7- Выдержка после загрузки ацетальдегида, мин

23

32.5

39.5

100

30 б 23

X8- Содержание щёлочи перед нейтрализацией, %:

0.01

0.245

0.325

0.44

21 24 22


3.5.2. Переход к измерению входных параметров и выходного показателя в дискретных шкалах

Переход от численных шкал, в которых измерены входные параметры (см. таблицу 1 темы 4 в разделе 6) к дискретным шкалам осуществляется с помощью таблицы 2 (выбор границ поддиапазонов). Вместо каждого численного значения подставляется код поддиапазона, в который оно попадает. Для выходного показателя переход к дискретным шкалам осуществляется в соответствии со следующим выражением: Yоб =1, если Y> 88.79%; Yоб=0, если Y< 88.79%.


Таблица 3

NN пп

X1

X2

X3

X4

X5

X6

X7

X8

Y

Yоб

1

1

1

3

3

2

3

1

2

83.1

0

2

3

1

3

3

2

3

1

2

88.5

0

3

4

1

1

2

3

3

1

2

80.4

0

4

3

1

1

1

3

3

1

2

83.7

0

5

2

1

2

3

3

3

1

3

84.2

0

6

1

1

1

3

2

3

1

2

84.2

0

7

4

1

3

1

3

3

1

2

88.0

0

8

3

1

3

1

3

3

1

2

87.5

0

9

4

1

1

1

1

3

1

2

82.4

0

10

2

1

3

1

3

1

1

2

81.8

0

11

3

1

3

3

3

3

1

2

92.2

1

12

1

1

3

1

2

1

1

3

81.5

0

13

4

1

3

3

2

1

1

1

81.4

0

б

2

1

3

2

3

3

3

3

86.6

0

15

3

1

3

3

2

1

1

1

90.6

1

16

1

1

3

1

3

3

3

2

82.4

0

17

4

2

3

3

3

1

1

2

89.2

1

18

2

2

3

1

2

3

3

2

80.8

0

19

3

2

3

3

3

1

1

1

90.1

1

20

1

2

3

1

3

3

3

1

86.8

0

21

4

1

2

2

3

1

3

3

90.0

1

22

2

1

1

3

1

1

1

2

80.7

0

23

3

3

1

1

3

2

3

3

92.9

1

24

1

3

1

2

2

2

3

3

92.8

1

25

3

2

2

3

1

3

3

2

93.6

1

26

2

2

2

3

1

3

3

2

93.6

1

27

1

2

2

2

3

3

1

1

92.5

1

28

3

2

2

2

1

3

3

1

84.5

0

29

2

2

1

2

3

3

3

1

89.4

1

30

4

2

1

2

1

1

1

1

84.9

0

31

1

2

1

1

1

3

3

3

95.2

1

32

3

3

2

2

1

1

2

2

82.5

0

33

2

2

1

2

1

2

3

3

89.6

1

34

4

2

3

2

2

1

2

3

91.0

1

35

4

2

1

2

2

1

2

3

91.3

1

36

3

2

2

3

2

2

3

1

89.1

1

37

4

2

2

3

2

2

2

1

89.1

1

38

1

2

1

1

2

1

1

3

88.9

1

39

3

2

2

1

2

3

1

1

84.5

0

40

2

3

1

2

1

1

1

3

89.0

1

41

4

2

1

1

1

2

3

2

86.1

0

42

1

2

1

1

3

1

3

2

92.6

1

43

3

3

1

3

2

3

1

1

84.6

0

44

2

2

1

1

1

1

2

3

86.0

0

45

4

2

2

2

1

2

2

1

87.4

0

46

1

2

1

2

2

2

3

3

92.8

1

47

3

3

3

3

2

1

3

1

88.7

0

48

2

3

2

2

3

1

2

2

88.6

0

49

4

3

2

2

1

3

2

3

90.5

1

50

1

3

3

3

3

2

2

3

90.0

1

51

4

3

1

2

2

1

1

3

91.5

1

52

2

2

2

2

1

3

3

1

82.5

0

53

3

2

2

2

1

3

2

1

84.6

0

54

1

3

2

1

3

1

2

1

88.6

0

55

4

2

1

1

2

2

2

2

89.0

1

56

2

3

2

2

3

2

1

1

82.5

0

57

3

3

3

3

3

3

1

2

91.7

1

58

1

3

2

1

3

1

1

1

88.3

0

59

4

3

1

3

2

2

2

3

93.1

1

60

1

3

1

1

3

1

3

1

90.3

1

61

3

1

1

2

1

1

1

3

92.9

1

62

4

3

1

2

1

3

1

3

91.6

1

63

1

3

1

1

3

1

3

3

94.4

1

64

2

3

1

2

2

2

3

3

95.1

1

65

1

1

2

3

1

1

1

2

90.0

1

66

2

3

3

3

3

3

2

2

88.0

0

67

1

3

1

1

2

1

3

1

90.0

1



3.5.3. Построение системной модели с помощью метода мозаичного портрета

Системная модель стадии конденсации альдегидов в производстве пентаэритрита имеет следующий вид:


Таблица 4.1. Гипотезы "хорошего" класса (Выход пентаэритрита выше 88.79%, Y=1).




NN пп

Частота встречаемости в исходном материале

Код гипотезы

1

2

X1d1*X4d2

2

3

X1d1*X6d2

3

2

X1d3*X6d2

4

2

X1d3*X8d3

5

6

X2d2*X4d3

6

4

X4d2*X6d2

7

6

X4d3*X6d2

8

7

X6d2*X6d2

9

4

X6d2*X7d2

10

4

X1d1*X2d2*X 3d1







б3

2

X6d2*X7d2*X8d3

144

2

X6d2*X7d3*X8d1

145

2

X1d3*X3d3*X7d1*X8d1

146

2

X2d1*X3d3*X4d3*X6d3

147

2

X2d1*X4d3*X6d3*X8d2

148

2

X2d3*X3d1*X4d2*X6d3

149

2

X2d3*X4d2*X6d3*X7d1

150

2

X2d3*X6d3*X6d3*X7d1

151

4

X3d3*X4d3*X6d3*X7d1

152

3

X4d3*X6d3*X7d1*X8d2



Таблица 4.2. Гипотезы "плохо" класса (Выход пентаэритрита ниже 88.79%, Y=0)




NN пп

Частота встречаемости в исходном материале

Код гипотезы

1

4

X1d2*X2d1

2

4

X1d2*X3d3

3

5

X1d2*X6d1

4

4

X1d2*X7d1

5

3

X1d3*X4d2

6

3

X1d4*X4d1

7

7

X2d1*X4d1

8

3

X3d2*X4d1

9

7

X3d3*X4d1

10

5

X3d3*X7d3







99

6

X4d1*X6d3*X8d2

100

2

X4d1*X7d1*X8d1

101

5

X4d1*X7d1*X8d2

102

3

X4d2*X6d1*X7d2

103

2

X4d2*X6d2*X8d1

104

3

X4d3*X6d2*X8d2

105

2

X6d1*X6d1*X7d2

106

3

X6d2*X7d1*X8d2

107

2

X6d3*X6d1*X7d2

108

2

X6d3*X6d3*X8d3



3.5.4. Содержательная интерпретация высказываний мозаичной модели (формальных гипотез) на технологическом языке

Интерпретация гипотез осуществляется с помощью таблицы 2 (выбор границ поддиапазонов). Вместо кода переменной приводится её название, а вместо кода поддиапазона - соответствующий диапазон значений.

Например, высказывания “хорошего” класса интерпретируются следующим образом:

Выход пентаэритрита на стадии конденсации будет выше 88.79%, если:

(Гипотеза №1 - X1d1*X4d2) - процесс проводится в 1-ом конденсаторе и температура в конце дозировки ацетальдегида от 27.5 до 36.5 °С.

(Гипотеза №10 - X1d1*X2d2*X3d1) - процесс проводится в 1-ом конденсаторе и содержание метанола в формалине от 0.35 до 2.65%, и температура в начале дозировки ацетальдегида от 9 до 12.5 °С.

(Гипотеза №б6 - X1d3*X3d3*X6d1*x8d1) - процесс проводится в 3-ем конденсаторе и температура в начале дозировки ацетальдегида от б.5 до 17.0 °С, и температура реакционной массы в конце выдержки от 35 до 39.5 °С, и содержание щёлочи перед нейтрализацией от 0,01 до 0.245 %.


Пример интерпретации высказывания “плохого” класса:

Выход пентаэритрита на стадии конденсации будет ниже 88.79%, если:

(Гипотеза №1 - X1d2*X2d1) - процесс проводится в 3-ем конденсаторе и cодержание метанола в формалине от 0 до 0.35 %.

(Гипотеза №10 - X3d3*X7d3) - температура в начале дозировки ацетальдегида от б.5 до 17 °С и длительность выдержки после загрузки ацетальдегида от 39.5 до 100 мин.

(Гипотеза №108 - X6d3*X6d3*X8d3) - температура реакционной массы в конце выдержки от 41.5 до 44 мин и длительность дозировки ацетальдегида от 39 до 118 мин, и содержание щёлочи перед нейтрализацией от 0.325 до 0.44%.


Каждое из полученных высказываний мозаичной модели интерпретируется как формальная, непротиворечивая на данном экспериментальном материале гипотеза, описывающая зависимость выходного показателя (комплекса выходных показателей) от взаимного влияния различных сочетаний входных параметров изучаемого объекта (процесса, системы, явления).

При количестве выходных показателей более 1-го практически все полученные гипотезы являются новыми, нетривиальными, неизвестными ранее экспертам. Аналогично, при одном выходном показателе нетривиальными являются практически все полученные гипотезы, включающие более 2-ух входных параметров.

В случае необходимости выходной показатель может принимать более двух дискретных значений. Например, при дифференциальной диагностике более чем двух близких по проявлениям заболеваний.

Таким образом, с помощью метода ММП решается одна из важнейших задач искусственного интеллекта - формализованное конструирование гипотез по матрице экспериментальных данных. (Получение знаний из данных). Причём новые знания выделяются в виде системных гипотез, описывающих взаимное влияние входных параметров процесса на выходной показатель (комплекс выходных показателей) на языке технолога.

Обычно при обсуждении со специалистами в соответствующей предметной области формальные гипотезы делятся на 3 группы:

- тривиальные: - "это всё давно уже известно из литературы, (патентных данных, личного опыта и т.п.)";

- не сформулированные ранее, но не вызывающие особых возражений, поскольку соответствуют имеющейся априорной информации и сложившимся представлениям;

- вызывающие резко отрицательное отношение типа: "этого не бывает потому, что этого не может быть никогда".

Поскольку построение мозаичной модели осуществляется с помощью формализованной процедуры, тривиальные гипотезы подтверждают эффективность метода мозаичного портрета и служат дополнительным доказательством того, что гипотезы 3-ей группы корректны.

Содержательная интерпретация нетривиальных гипотез специалистами позволяет им осознать новые системные закономерности, «прорваться» в недосягаемую для них ранее область системных знаний об изучаемом объекте и существенно уменьшить его энтропию.

Следует отметить, что практически все гипотезы, в которые входят более 2-ух входных параметров, являются новыми, нетривиальными, не известными ранее специалистам, и, соответственно, несут новые системные знания об изучаемом технологическом процессе.


Выводы

1. С помощью метода мозаичного портрета решается главная задача искусственного интеллекта: формального порождение новых системных знаний из данных для объектов (процессов, систем, явлений) любой физической природы. Даже самый талантливый человек в силу присущих ему психофизиологических ограничений принципиально не способен решать эту задачу.


Контрольные вопросы

1. В чем сущность редукции к системным свойствам?

2. Какие требования предъявляются к исходной экспериментальной информации при построении системной (мозаичной) модели?.

3. Как осуществляется переход от континуальных (численных) шкал к дискретным при построении мозаичной модели?

4. Как строится системная модель в случае, если выходной показатель один?

5. Как производится свертка множества выходных показателей в обобщенный критерий оценки эффективности изучаемой системы?

6. Как интерпретируются полученные после построения мозаичной модели системные зависимости?

7. Как с помощью методв мозаичного портрета получаются новые системные знания об изучаемой системе любой физической природы?


Задача оптимизации является самой распространенной задачей нашего времени. (Л.А.Расстригин).

Даже для одноэкстремальных задач специальных математических методов решения задач нелинейного программирования не существует. (Л.А.Расстригин).