А.В.Блохин ТЕОРИЯ ЭКСПЕРИМЕНТА Курс лекций в двух частях Часть 2 Блохин А.В. Теория эксперимента [Электронный ресур]: Курс лекций в двух частях: Часть 2. Ч Электрон. текст. дан. (1,0 Мб). Ч Мн.:
Научно-методический центр УЭлектронная книга БГУФ, 2003. Ч Режим доступа:
Ч Электрон.
версия печ. публикации, 2002. Ч PDF формат, версия 1.4. Ч Систем.
требования: Adobe Acrobat 5.0 и выше.
МИНСК Электронная книга БГУ 2003 й Блохин А.В.
й Научно-методический центр Электронная книга БГУ www.elbook.bsu.by elbook@bsu.by БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ХИМИЧЕСКИЙ ФАКУЛЬТЕТ Кафедра физической химии А. В. Блохин ТЕОРИЯ ЭКСПЕРИМЕНТА Курс лекций В двух частях Часть 2 МИНСК 2002 УДК 542(042) ББК 24.в.я73 Б70 Рецензенты:
кандидат химических наук, доцент Н. И. Горошко;
старший преподаватель кафедры физической химии БГУ Л. М. Володкович Печатается по решению Редакционно-издателъского совета Белорусского государственного университета Блохин А. В.
Б70 Теория эксперимента: Курс лекций. В 2 ч. Ч. 2 / А, В. Бло хин. - Мн.: БГУ, 2002. - 67 с.
ISBN 985-445-815- Вторая часть курса лекций посвящена статистическим методам опти мизации экспериментальных исследований в физической химии и содержиг основы методов регрессионного, корреляционного и дисперсионною анали зов и планирования экстремальною эксперимента.
Предназначено для студентов IV курса химического факультета.
УДК 542(042) ББК 24.в.я ISBN 985-445-815-6(ч. 2) @Блохин А. В., ISBN 985-445-792-3 @БГУ, СОДЕРЖАНИЕ ЛЕКЦИЯ 7 7.1. Системы случайных величин. Функция и плотность распределения системы двух случайных величин. Условные законы распределения _ 7.2. Стохастическая связь. Ковариация. Коэффициент корреляции. Регрессия _ 7.3. Выборочный коэффициент корреляции. Проверка гипотезы об отсутствии корреляции 7.4. Приближенная регрессия. Метод наименьших квадратов _ ЛЕКЦИЯ 8 _ 8.1. Линейная регрессия от одного параметра _ 8.2. Регрессионный анализ 8.2.1. Проверка адекватности приближенного уравнения регрессии эксперименту 8.2.2. Оценка значимости коэффициентов уравнения регрессии _ 8.2.3. Оценка доверительного интервала для искомой функции _ 8.3. Оценка тесноты нелинейной связи _ 8.4. Аппроксимация. Параболическая регрессия_ 8.5. Приведение некоторых функциональных зависимостей к линейному виду 8.6. Метод множественной корреляции _ ЛЕКЦИЯ 9 _ 9.1. Задачи дисперсионного анализа. Однофакторный дисперсионный анализ 9.2. Двухфакторный дисперсионный анализ ЛЕКЦИЯ 10 10.1. Планирование эксперимента при дисперсионном анализе 10.2. Постановка задачи при планировании экстремальных экспериментов 10.3. Полный факторный эксперимент типа 22: матрица планирования, вычисление коэффициентов уравнения регрессии _ ЛЕКЦИЯ 11 11.1. Матрица планирования полного факторного эксперимента типа 23_ 11.2. Проверка значимости коэффициентов и адекватности уравнения регрессии, полученных при обработке результатов ПФЭ 22 и 23 _ 11.3. Дробный факторный эксперимент. Планы типа 2k-1 _ ЛЕКЦИЯ 12 12.1. Оптимизация методом крутого восхождения по поверхности отклика _ 12.2. Описание функции отклика в области, близкой к экстремуму.
Композиционные планы Бокса-Уилсона 12.3. Ортогональные планы второго порядка, расчет коэффицентов уравнения регрессии _ 12.4. Метод последовательного симплекс-планирования ЛЕКЦИЯ Системы случайных величин. Функция и плотность распределения сис темы двух случайных величин. Условные законы распределения. Сто хастическая связь. Ковариация. Коэффициент корреляции, его свойства.
Линии регрессии. Выборочный коэффициент корреляции;
проверка ги потезы об отсутствии корреляции. Приближенная регрессия;
метод наи меньших квадратов.
7.1. Системы случайных величин. Функция и плотность рас пределения системы двух случайных величин. Условные законы распределения На практике чаще всего приходится иметь дело с экспериментами, результатом которых является не одна случайная величина, а две и более, образующие систему. Свойства системы случайных величин не ограничиваются свойствами величин, в нее входящих;
они определя ются также взаимосвязью (зависимостями) этих случайных величин.
Информация о каждой случайной величине, входящей в систему, со держится в ее законе распределения.
Рассмотрим систему из двух случайных величин Х и Y. Функцией распределения такой системы называется вероятность совместного выполнения двух неравенств F(x, y)= P (X < x, Y < y). (7.1) Плотность распределения системы f (x, y) определяется как вторая смешанная производная F(x, y) 2F(x, y).
f (x, y)= (7.2) x y Вероятность попадания точки (Х, Y) в произвольную область D равна P[(X,Y ) D]= f (x, y)dx d y. (7.3) (D) Свойства плотности распределения:
1) она является неубывающей функцией:
f (x, y) 0 ;
(7.4) 2) вероятность попадания случайной точки на всю координатную плоскость равна вероятности достоверного события:
+ + f (x, y) d x d y =1;
(7.5) - 3) функция распределения выражается через плотность распреде ления как y x F(x, y)= f (x, y) d x d y ;
(7.6) - 4) плотность распределения каждой из случайных величин можно получить следующим образом:
x + F1(x)= F(x,)= f (x, y) d x d y, (7.7) - + dF1(x) f1(x)= = f (x, y)d y, (7.8) d x + dF2(y) f2(y)= = f (x, y)d x. (7.9) d y Чтобы полностью охарактеризовать систему (т. е. получить ее за кон распределения), кроме распределения каждой величины, входя щей в систему, необходимо знать и связь между этими величинами.
Эта зависимость характеризуется с помощью условных законов рас пределения.
Условным законом распределения величины Y, входящей в систе му (X, Y), называется ее закон распределения при условии, что другая случайная величина Х приняла определенное значение х. Условная функция распределения обозначается F(y/x), плотность распределе ния Ч f (y/x). Для условных плотностей распределений справедлива теорема умножения законов распределения:
f (x, y)= f1(x) f (y / x), (7.10) f (x, y)= f2(y) f (x / y). (7.11) Тогда f (x, y) f (x, y), f (y / x)= (7.12) f1(x)= f (x, y)d y f (x, y) f (x, y).
f (x / y)= (7.13) f2(y)= f (x, y)d x 7.2. Стохастическая связь. Ковариация. Коэффициент корре ляции. Регрессия Стохастической связью между случайными величинами называ ется такая связь, при которой с изменением одной величины меняется распределение другой. Функциональной зависимостью называется та кая связь между случайными величинами, при которой при известном значении одной из величин можно точно указать значение другой.
В отличие от функциональной связи при стохастической связи с изменением величины Х величина Y имеет лишь тенденцию изменять ся. По мере увеличения тесноты стохастической зависимости она все более приближается к функциональной, а в пределе ей соответствует.
Крайняя противоположность функциональной связи Ч полная неза висимость случайных величин.
Если случайные величины независимы, то согласно теореме умно жения (7.10Ц7.11) получаем f (y / x)= f2(y) и f (x / y)= f1(x), (7.14) f (x, y)= f1(x) f2(y). (7.15) Условие (7.15) можно использовать в качестве необходимого и доста точного критерия независимости двух случайных величин, если из вестны плотности распределения системы и случайных величин, в нее входящих.
При неизвестном законе распределения системы для оценки тес ноты стохастической связи чаще всего используется коэффициент корреляции. Дисперсия суммы двух случайных величин X и Y равна D{X + Y}= M{[X + Y - M (X + Y )]2 }= M{[X - M (X )+ Y - M (Y )]2 }= = M[X - M (X )]2 + 2M{[X - M (X )][Y - M (Y )]}+ M[Y - M (Y )]2 = = D(X )+ 2M{[X - M (X )][Y - M (Y )]}+ D(Y ). (7.16) Если X и Y независимы, то D(X + Y )= D(X )+ D(Y ).
Тогда зависимость между X и Y существует, если M ([X - mx][Y - my]) 0. (7.17) Величина (7.17) называется корреляционным моментом, или ковариа цией cov{XY}, (covxy) случайных величин. Она характеризует не толь ко зависимость величин, но и их рассеяние.
Из (7.17) следует, что если одна из величин мало отклоняется от своего математического ожидания, то ковариация будет мала даже при тесной стохастической связи. Чтобы избежать этого, для характе ристики связи используют безразмерную величину, называемую ко эффициентом корреляции:
covxy M([X - mx][Y - my]) rxy = =, (7.18) xy xy где x и y Ч стандартные отклонения X и Y.
Случайные величины, для которых ковариация (значит, и коэффи циент корреляции) равна нулю, называются некоррелированными. Ра венство нулю коэффициента корреляции не всегда означает, что слу чайные величины X и Y независимы: связь может проявляться в мо ментах более высокого порядка (по сравнению с математическим ожиданием). Только в случае нормального распределения при rxy = связь между случайными величинами однозначно отсутствует.
Плотность нормального распределения системы двух случайных величин выражается следующей формулой:
, f (x, y)= 2x y 1- r (y 1 (x - mx )2 2r(x - mx )(y - my)+ - my) exp- -, (7.19) xy 2(1 - r2) 2 x y где r Ч коэффициент корреляции. Если X и Y некоррелированы (т. е.
r = 0), то из (7.19) следует, что (y - my) 1 1 (x - mx ) f (x, y)= exp- + = 2x y 2 x y (y - my) 1 (x - mx )2 = exp- exp- = 2 x 2 y 22 x y = f1(x)f2(y), (7.20) т. е. нормально распределенные случайные величины X и Y не только некоррелированы, но и независимы.
Отметим следующие свойства коэффициента корреляции:
1) величина rxy не меняется от прибавления к X и Y неслучайных слагаемых;
2) величина rxy не меняется от умножения X и Y на положитель ные числа;
3) если одну из величин, не меняя другой, умножить на Ц1, то на Ц1 умножится и коэффициент корреляции.
Тогда, если от исходных величин перейти к нормированным Y - my X - mx X0 =, Y0 =, x y величина rxy не изменится: rxo yo = rxy. Из (7.16) и (7.18) следует, что 2(X + Y ) = 2(X ) + 2(Y ) + 2r 2(X ) 2(Y ). (7.21) xy Для нормированных величин 2(X0) = 2(Y0) = 1, тогда 2(X0 + Y0) = 2 + 2rxy. (7.22) Аналогично в случае разности (X - Y) можно получить, что 2(X0 - Y0) = 2 - 2rxy. (7.23) По определению дисперсии 2(X0 + Y0) 0 и 2(X0 - Y0) 0, следовательно 2 + 2rxy 0, 2 - 2rxy 0, rxy -1, rxy 1, -1 rxy 1. (7.24) При rxy = 1 имеем линейные функциональные зависимости вида y = b0 + b1x, при этом если rxy = 1, то b1 > 0;
если rxy = Ц1, то b1 < 0.
Если мeжду величинами X и Y имеется произвольная стохастиче ская связь, то Ц1 < rxy < 1. При rxy > 0 говорят о положительной корре ляционной связи между X и Y, при rxy < 0 Ч об отрицательной. Следу ет учитывать, что коэффициент корреляции характеризует не любую зависимость, а только линейную.
Для нормально распределенной системы двух случайных величин можно доказать, что f (x, y) f (y / x)= f1(x)= - my x - mx y 1 = exp- - r = y x 2(1- r2) y 1- r2 y 1 - my - r (x - mx ). (7.25) = exp y x 2(1- r2) y 1- r2 y Условная плотность распределения величины Y соответствует плотно сти нормального распределения с математическим ожиданием y my/x = my + r (x - mx ) (7.26) x и среднеквадратичным отклонением y/x = y 1- r2. (7.27) Величина my/x называется условным математическим ожиданием ве личины Y при данном Х. Линейная зависимость (7.26) Ч регрессией Y на X. По аналогии прямая x mx/y = mx + r (y - my) (7.28) y есть регрессия X на Y.
Линии регрессии совпадают только при наличии линейной функ циональной зависимости. Из (7.26) и (7.28) видно, что для независи мых X и Y линии регрессии параллельны координатным осям.
7.3. Выборочный коэффициент корреляции. Проверка гипоте зы об отсутствии корреляции При обработке результатов большинства физико-химических из мерений возникает задача описания зависимости между исследуемы ми случайными величинами. Для экспериментального изучения зави симости между двумя случайными величинами Х и Y проводят n неза висимых опытов, при этом в каждом из них получают пару значений (xi, yi), i = 1, 2, Е, n. О наличии или отсутствии корреляции между Х и Y можно качественно судить по виду поля корреляции, нанеся точки (xi, yi) на координатную плоскость.
Для количественной оценки тесноты связи служит выборочный ко эффициент корреляции. Как было установлено ранее, состоятельными и несмещенными оценками для математических ожиданий mx и my служат выборочные средние x и y, а генеральных дисперсий 2 и x 2 Ч выборочные дисперсии sx и s2. Можно доказать, что состоя y y тельной и несмещенной оценкой генеральной ковариации covxy слу жит выборочная ковариация n cov* = xi - x)(yi - y). (7.29) xy ( n - i = Пользуясь этой оценкой, рассчитывают выборочный коэффициент корреляции n xi - x)(yi - y) ( i = * rxy =, (7.30) (n -1) sx sy который является состоятельной оценкой коэффициента корреляции генеральной совокупности со смещением, равным r (1- r2) / 2n. Вели чина смещения убывает с увеличением числа опытов и при n > 50 со ставляет менее 1 %. Выборочный коэффициент корреляции обладает теми же свойствами, что и rxy, и по абсолютной величине также не больше единицы:
* -1 rxy 1. (7.31) Величина выборочного коэффициента корреляции определяет ме ру криволинейности связи между X и Y. Поэтому возможны случаи, когда при коэффициенте корреляции, значительно меньшем единицы, связь между X и Y оказывается близкой к функциональной, хотя и су щественно нелинейной.
В случае, если полученное значение r* близко к нулю, необходимо провести проверку гипотезы об отсутствии корреляции между слу чайными величинами. Требуется определить, значимо ли отличается r* от нуля. Если число опытов n достаточно велико (более 20), то в ус ловиях нулевой гипотезы (Н0: r = 0) можно использовать нормальное распределение со стандартом r* (1- r *2) / n. (7.32) Тогда при = 0,95 генеральный коэффициент корреляции находится в следующих доверительных границах:
1.96 (1- r *2) 1.96 (1- r *2) r * - r r * +. (7.33) n n С вероятностью 0,95 можно ожидать, что существует корреляция ме жду случайными величинами, если 0 не содержится внутри довери тельного интервала.
На практике, особенно при числе опытов n < 20, часто приходится решать вопрос о том, насколько хорошо полученные эксперименталь ные точки подтверждают линейную связь между величинами X и Y.
Ответить на этот вопрос можно следующим образом. Предположим, что две переменные X и Y действительно некоррелированы, т. е. при проведении бесконечно большого числа измерений выборочный ко эффициент корреляции для них был бы равен нулю. При конечном числе измерений, однако, маловероятно, чтобы величина r* была точ но равна нулю из-за воздействия случайных факторов.
Обозначим через Pn ( r * r1 *) вероятность того, что n измерений двух некоррелированных перемен ных X и Y приведут к значению r* (по модулю), не меньшему некото рого частного значения r1*. Результаты расчетов вероятностей Pn для выборок различного объема n и чисел r1* представлены в табл. 1. Для ответа на вопрос о том, насколько хорошо n пар полученных значений (xi, yi) подтверждают линейную связь между исследуемыми величина ми, вначале по измеренным точкам вычисляют выборочный коэффи циент корреляции r1*. Далее по табл. 1 находят вероятность Pn того, что n некоррелированных точек приведут к значению коэффициента Таблица Вероятность Pn того, что n измерений двух некоррелированных переменных дадут коэффициент корреляции |r*| r1* (прочерками отмечены значения, меньшие 0,01) r1* n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0. 3 0.94 0.87 0.81 0.74 0.67 0.59 0.51 0.41 0. 4 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0. 5 0.87 0.75 0.62 0.50 0.39 0.28 0.19 0.10 0. 6 0.85 0.70 0.56 0.43 0.31 0.21 0.12 0.06 0. 7 0.83 0.67 0.51 0.37 0.25 0.15 0.08 0.03 Ч 8 0.81 0.63 0.47 0.33 0.21 0.12 0.05 0.02 Ч 9 0.80 0.61 0.43 0.29 0.17 0.09 0.04 0.01 Ч 10 0.78 0.58 0.40 0.25 0.14 0.07 0.02 0.01 Ч 11 0.77 0.56 0.37 0.22 0.12 0.05 0.02 Ч Ч 12 0.76 0.53 0.34 0.20 0.10 0.04 0.01 Ч Ч 13 0.75 0.51 0.32 0.18 0.08 0.03 0.01 Ч Ч 14 0.73 0.49 0.30 0.16 0.07 0.02 0.01 Ч Ч 15 0.72 0.47 0.28 0.14 0.06 0.02 Ч Ч Ч 16 0.71 0.46 0.26 0.12 0.05 0.01 Ч Ч Ч 17 0.70 0.44 0.21 0.11 0.04 0.01 Ч Ч Ч 18 0.69 0.43 0.23 0.10 0.04 0.01 Ч Ч Ч 19 0.68 0.41 0.21 0.09 0.03 0.01 Ч Ч Ч 20 0.67 0.40 0.20 0.08 0.03 0.01 Ч Ч Ч 25 0.63 0.34 0.15 0.05 0.01 Ч Ч Ч Ч 30 0.60 0.29 0.11 0.03 0.01 Ч Ч Ч Ч 35 0.57 0.25 0.08 0.02 Ч Ч Ч Ч Ч 40 0.54 0.22 0.06 0.01 Ч Ч Ч Ч Ч 50 0.49 0.16 0.03 Ч Ч Ч Ч Ч Ч 60 0.45 0.13 0.02 Ч Ч Ч Ч Ч Ч 80 0.38 0.08 0.01 Ч Ч Ч Ч Ч Ч 100 0.32 0.05 Ч Ч Ч Ч Ч Ч Ч корреляции, не меньшего r1*. Если Pn 0,05 (для высокозначимых корреляций Pn 0,01), то гипотеза о линейной зависимости между ве личинами X и Y принимается (при выбранном уровне значимости 0, или 0,01 соответственно).
Например, по выборке из 5 пар значений (xi, yi) получено r1* = 0,9.
Вероятность получения коэффициента r* такого, что |r*| 0,9, для некоррелированных точек равна Pn = 0,04 (табл. 1). Следовательно, гипотеза о линейной связи двух исследуемых величин может быть принята с уровнем значимости 0,05.
7.4. Приближенная регрессия. Метод наименьших квадратов При исследовании корреляционной зависимости между двумя случайными величинами необходимо по данной выборке объемом n найти уравнение приближенной регрессии, чаще всего в виде следую щего полинома:
k j y (x) = b0 + b1x + b2x2 + b3x3 +... = b0 + bj x, (7.34) j = где коэффициенты b0 и bj являются оценками соответствующих теоре тических коэффициентов истинного уравнения регрессии k j my/x = (x) = 0 + 1x + 2x2 + 3x3 +... = 0 + x, (7.35) j j = и оценить допускаемую при этом ошибку. Для этого обычно исполь зуют метод наименьших квадратов.
Рассмотрим некоторый класс функций, аналитическое выражение которых содержит некоторое число неопределенных коэффициентов, равное k. Наилучшее уравнение приближенной регрессии дает та функция из рассматриваемого класса, для которой сумма квадратов S имеет наименьшее значение:
n S = (7.36) i y - y (xi ) = min.
i = Предположим, что экспериментальные точки отклоняются от уравнения истинной регрессии (x) только в результате воздействия случайных факторов, а ошибки измерения нормально распределены.
Полученные в опытах значения yi будут распределены по нормально му закону с математическим ожиданием m(yi )= (xi) и дисперсией 2 i. При равноточных экспериментах 1 = 2 = Е = 2 = 2. Тогда 2 n плотность распределения величины Yi принимает вид 1 fi ( yi ) = exp- [yi - (xi )]2. (7.37) В результате опытов случайные величины Yi приняли совокуп ность значений yi. Используем принцип максимального правдоподо бия: определим так математические ожидания (xi), чтобы вероят ность этого события была максимальной. Обозначим через рi = fi (yi) вероятность того, что случайная величина Yi примет значение из ин тервала yi - /2, yi + /2. Вероятность совместного осуществления по добных событий для i = 1, 2, Е, n равна n n P = n fi ( yi ) = n-n (2)-n/2 exp- = i [y - (xi )] i =1 i = n = K exp- (7.38) i [y - (xi )]2, i = где К Ч коэффициент, не зависящий от (xi).
Очевидно, что при заданном 2 вероятность Р максимальна при условии, что n i [y - (xi )]2 = min.
i = Таким образом, при нормальном распределении случайных величин оптимальность метода наименьших квадратов легко обосновывается.
Нахождение коэффициентов уравнения приближенной регрессии по этому методу связано с задачей определения минимума функции многих переменных. Пусть y (x) = f (x, b0, b1, b2,..., bk ). (7.40) Требуется найти значения коэффициентов b0, b1, b2, Е, bk так, чтобы n S = i y - y (xi ) = min.
i = Если S принимает минимальное значение, то S S S S = 0, = 0, = 0,..., = 0, (7.41) b0 b1 b2 bk что соответствует следующей системе уравнений:
n = i 2y - y(xi ) y (xi ) 0, b i = n = (7.42) i 2y - y(xi ) y (xi ) 0, b i = ЕЕЕЕЕЕЕЕЕЕЕ, n = i 2y - y(xi ) y (xi ) 0.
bk i = Преобразуем (7.42) n n y(xi ) - y (xi ) = 0, i y y (xi ) b0 i =1 b i = n n y(xi ) - y (xi ) = 0, (7.43) i y y (xi ) b1 i =1 b i = ЕЕЕЕЕЕЕЕЕЕЕЕЕЕ, n n y(xi ) - y (xi ) = 0.
i y y (xi ) bk i =1 bk i = В последней системе содержится столько же (k + 1) уравнений, сколько и неизвестных коэффициентов в уравнении (7.40), т. е. она является системой нормальных уравнений. Поскольку S 0 при лю бых значениях коэффициентов, то у нее должен существовать по меньшей мере один минимум. Поэтому если система (7.43) имеет единственное решение, то оно и является минимумом для S.
ЛЕКЦИЯ Линейная регрессия от одного параметра. Регрессионный анализ. Аппрок симация, параболическая регрессия. Оценка тесноты нелинейной связи, корреляционный анализ. Метод множественной корреляции.
8.1. Линейная регрессия от одного параметра Пусть из опытов получена выборка точек (xi, yi) объемом n. Най дем методом наименьших квадратов коэффициенты линейного урав нения регрессии y = b0 + b1 x. (8.1) Система нормальных уравнений уравнений (7.43) с учетом того, что y (xi ) = b0 + b1 xi, принимает вид n n yi - (b0 + b1xi ) = 0, i =1 i = n n yi xi - (b0 + b1xi ) xi = 0, (8.2) i =1 i = или после преобразования n n nb0 + b1 xi = yi, i =1 i = n n n b0 i + b1 xi2 = yixi. (8.3) x i =1 i =1 i = Решив систему уравнений, получим n n n n yi xi2 - xi xi yi i =1 i =1 i =1 i = b0 =, (8.4) n n n xi2 - xi i =1 i = n n n n n xi yi - xi yi (xi - x) ( yi - y) i =1 i =1 i =1 i = b1 = = = 2 n n n (xi - x) n xi2 - xi i = i =1 i = n (xi - x) ( yi - y) i = =. (8.5) (n -1) sx Из системы уравнений (8.3) видно, что между коэффициентами b и b1 существует корреляционная зависимость, выражение для которой можно получить, например, из первого уравнения системы:
b0 = y - b1 x. (8.6) Выборочный коэффициент корреляции с учетом (8.5) равен n i (x - x)(yi - y) b1(n -1) sx b1sх i = * rxy = = = (8.7) (n -1) sx sy (n -1) sx sy sy и оценивает силу линейной связи между Y и Х.
8.2. Регрессионный анализ Итак, уравнение линейной регрессии определено. Проведем стати стический анализ полученных результатов, заключающийся в оценке значимости коэффициентов регрессии и проверки адекватности полу ченного уравнения экспериментальным данным. Подобный анализ и называется регрессионным.
Примем, что 1) входной параметр х измеряется с гораздо большей точностью по сравнению с выходной величиной y;
2) значения yi получены независимым образом и нормально рас пределены;
3) если при каждом заданном значении хi проводится серия па раллельных опытов, то выборочные дисперсии si2 однородны.
8.2.1. Проверка адекватности приближенного уравнения регрес сии эксперименту Рассмотрим три наиболее часто встречающихся варианта проверки адекватности полученного уравнения регрессии.
1. Пусть при каждом значении хi проведена серия из m параллель ных опытов. Тогда дисперсия воспроизводимости с числом степеней свободы fвоспр. = n (m - 1) равна n si i = sвоспр. =. (8.8) n Дисперсия адекватности определяется формулой n m yi - y (xi ) i = sад. =, (8.9) n - l где l Ч число коэффициентов в уравнении регрессии (при линейной регреcсии l = 2), m yi = yi u. (8.10) m u = Число степеней свободы дисперсии адекватности равно fад. = n - l.
Адекватность уравнения проверяется по критерию Фишера 2 F = sад. / sвоспр.. (8.11) Если вычисленное значение F окажется меньше табличной величины F1-p(f1, f2) для уровня значимости р и числа степеней свободы f1 = fад. и f2 = fвоспр., то уравнение адекватно эксперименту.
2. Основная серия опытов проведена без параллельных, а диспер сия воспроизводимости определена в отдельной серии из m опытов, тогда n yi - y (xi ) i = sад. =, (8.12) n - l m yu - y0) ( m u = sвоспр. =, где y0 = yi0. (8.13) m -1 m u = Адекватность уравнения проверяется по критерию Фишера (8.11), при этом f2 = fвоспр. = m - 1.
3. Основная серия опытов выполнена без параллельных, и нет дан ных для расчета дисперсии воспроизводимости. Тогда по критерию Фишера сравнивается дисперсия адекватности и дисперсия относи тельно среднего s2 ( f1) y F =, (8.14) sад.( f2) где n yi - y) ( i = s2 =. (8.15) y n - Чем больше полученное F превышает табличное F1-p(f1, f2) для уровня значимости р и чисел степеней свободы f1 = n - 1 и f2 = n - l, тем эффективнее уравнение регрессии.
8.2.2. Оценка значимости коэффициентов уравнения регрессии Значимость коэффициентов уравнения регрессии оценивается по критерию Стъюдента bj t =, (8.16) j s (bj ) где bj Ч j-й коэффициент уравнения регрессии;
s(bj) Ч среднее квад ратичное отклонение j-го коэффициента. Если tj больше табличной величины t1-p/2 для выбранного уровня значимости р и числа степеней свободы f дисперсии j-го коэффициента, то коэффициент bj значимо отличается от нуля.
В случае линейной регрессии средние квадратичные отклонения коэффициентов рассчитываются следующим образом:
n n n s (b0) = s2 i2 n i2 - (8.17) i x x x, i =1 i =1 i = n n s(b1) = (s2 n) (8.18) n i i x - x, i =1 i = где дисперсия s2 в общем случае определяется как 2 2 2 fвоспр.sвоспр. + fад.sад. n(m -1) sвоспр. + (n - l) sад.
s2 = =. (8.19) fвоспр. + fад. n(m -1) + (n - l) Число степеней свободы средневзвешенной дисперсии s2 равно f = n(m -1) + (n - l) = nm - n + n - l = nm - l.
Дисперсии воспроизводимости и адекватности рассчитываются по формулам (8.8) и (8.9) или (8.12) и (8.13). Если у экспериментатора нет оснований сомневаться в линейном характере изучаемой зависи мости и опыты проведены без параллельных (т. е. m = 1), то s2 = sад. и f = fад. = n - l. Дисперсия адекватности в этом случае определяется по формуле (8.12).
Для оценки случайных ошибок в определении коэффициентов приближенного уравнения регрессии можно также воспользоваться критерием Стъюдента. Рассмотрим величину b0 - t =, (8.20) s (b0) где 0 Ч истинное значение коэффициента b0. Произведя выкладки, аналогичные представленным в лекции 4, получим b0 - s (b0) t1- p/2 0 b0 + s (b0) t1- p/2, (8.21) или 0 = b0 s (b0) t1- p/2, (8.22) где t1-p/2 Ч квантиль t-распределения для числа степеней свободы f и выбранного уровня значимости р.
Аналогично можно построить доверительный интервал для коэф фициента b1:
b1 - s (b1)t1- p/2 1 b1 + s (b1) t1- p/2, (8.23) 1 = b1 s (b1) t1- p/2. (8.24) С учетом (8.22) и (8.24), уравнение регрессии принимает следую щий вид:
y = 0 + 1 x = (b0 s (b0) t1- p/2) + (b1 s (b1) t1- p/2) x.
8.2.3. Оценка доверительного интервала для искомой функции На практике нередко возникает необходимость в оценке точек, резко выделяющихся из общей линейной закономерности. Подобную оценку легко произвести, построив доверительный интервал (лкори дор ошибок) искомой функции. Под коридором ошибок понимают границы, отсчитываемые по обе стороны от полученной прямой и по казывающие пределы, в которых должны лежать экспериментальные точки. Точки, лежащие за пределами этого коридора, следует при знать ошибочными и исключить из общей выборки.
Воспользуемся критерием Стъюдента и рассмотрим величину y- my/x t =, (8.25) s(y) где my/x Ч условное математическое ожидание Y при заданном Х;
s ( y) Ч выборочное среднеквадратичное отклонение, соответствую щее выборочной дисперсии s2 ( y) = s2 (b0 ) +(x2 - 2xx)s2 (b1) (8.26) с числом степеней свободы f = nm - 2, если среднеквадратичные от клонения коэффициентов рассчитываются на основе средневзвешен ной дисперсии s2, определяемой по формуле (8.19), и f = n - 2, если s2 = sад.. Тогда границы коридора ошибок для произвольного значе ния аргумента x определяются следующим выражением:
my/x = y (x) t1- p / 2 s( y), (8.27) где t1-p/2 Ч квантиль t-распределения для числа степеней свободы f и выбранного уровня значимости р (обычно 0,05).
Процедура выделения из общей совокупности точек, содержащих грубые ошибки, заключается в следующем. Вначале методом наи меньших квадратов обрабатываются все полученные эксперименталь ные данные, не выбрасывая ни одной точки. Далее по формуле (8.27) для каждой ординаты (для каждого заданного значения х) определяет ся доверительный интервал при выбранной доверительной вероятно сти. Если оказывается, что одна или несколько точек при этом выпа дают из рассчитанных для них интервалов и величина отклонения превышает систематическую погрешность измерения, то их следует признать ошибочными и исключить из рассмотрения. Затем весь рас чет коэффициентов, их случайных ошибок и коридора ошибок повто ряется заново.
8.3. Оценка тесноты нелинейной связи Если уравнение регрессии получено с достаточной точностью, то силу стохастической связи между величинами Y и Х можно охаракте ризовать величиной (n - l) sад.
=. (8.28) (n -1) s y Дисперсия адекватности (остаточная дисперсия) и дисперсия относи тельно среднего рассчитываются по формулам (8.12) и (8.15) соответ ственно. Связь тем сильнее, чем меньше. Величина = 1 - (8.29) называется корреляционным отношением, для которого справедливо 0 1. (8.30) Чем больше, тем сильнее связь.
В общем случае анализ силы связи по корреляционному отноше нию называют корреляционным анализом. Функциональная зависи мость между случайными величинами существует, если = 1. Однако при = 0 однозначно говорить об отсутствии связи можно только в случае нормального распределения случайных величин.
При линейной регрессии корреляционное отношение равно коэф фициенту корреляции:
(n - 2) sад.
= 1- = r *. (8.31) (n -1) s y 8.4. Аппроксимация. Параболическая регрессия В общем случае при описании функциональной зависимости меж ду двумя случайными величинами используют полиномы некоторой степени, коэффициенты которых могут и не иметь определенного фи зического смысла. Такая операция называется аппроксимацией экспе риментальных данных. Полученная эмпирическая формула обычно справедлива только для сравнительно узкого интервала измерений и неприменима вне этого интервала. При использовании метода наи меньших квадратов коэффициенты приближенного уравнения регрес сии определяются решением системы линейных уравнений.
Допустим, что зависимость между величинами Х и Y описывается параболой второго порядка y(x) = b0 + b1x + b2x2. (8.32) Тогда y (x) y (x) y (x) = 1, = x, = x2, (8.33) b0 b1 b и система нормальных уравнений (7.43) принимает вид n n n b0n + b1 i + b2 i2 = yi, x x i =1 i =1 i = n n n n b0 i + b1 i2 + b2 i3 = yi, (8.34) i x x x x i =1 i =1 i =1 i = n n n n b0 i2 + b1 i3 + b2 i4 = i x x x x yi.
i =1 i =1 i =1 i = Решая систему (8.34), находят коэффициенты искомой квадратичной функции. При описании функциональных зависимостей полиномами большей степени коэффициенты определяются из аналогичных по структуре систем уравнений.
На практике адекватности уравнения регрессии эксперименту до биваются повышением степени аппроксимирующего полинома. При использовании полинома k-степени требуется определять k + 1 коэф фициент. Увеличение степени полинома прекращают, если дисперсия адекватности (остаточная дисперсия) уравнения регрессии k + 1 сте пени ( sk +1) перестает быть значимо меньше дисперсии адекватности, вычисленной для полинома k-степени ( sk ). Значимость различия ис следуется по критерию Фишера 2 F = sk / sk +1, где n n ( yi - y (xi ))2 ( yi - y (xi )) i =1 i = 2 sk =, sk +1 =. (8.35) n - (k + 1) n - (k + 2) Если полученное F меньше табличного F1-p(f1, f2) для уровня значимо сти р и чисел степеней свободы f1 = f k = n - k - 1 и f2 = f k+1 = n - k - 2, то увеличение степени полинома нужно прекратить и в качестве при ближенного уравнения регрессии использовать полином k-степени.
8.5. Приведение некоторых функциональных зависимостей к линейному виду При малых объемах выборки увеличение порядка полинома может иногда приводить к росту остаточной дисперсии. Чтобы избежать это го, при решении многих задач производят замену переменных. На пример, зависимости типа x z = a0 a1 или z = a0 ta1 (8.36) сводятся к линейным y = b0 + b1x следующим образом:
ln z = ln a0 + xln a1, y = ln z, b0 = ln a0, b1 = ln a1, (8.37) ln z = ln a0 + a1 lnt, y = ln z, b0 = ln a0, b1 = a1, x = lnt. (8.38) Коэффициенты уравнений (8.37) и (8.38) находятся методом наи меньших квадратов.
Рассмотрим некоторые наиболее часто встречающиеся случаи ли неаризации зависимостей при обработке результатов физико-химичес ких экспериментов.
1. Температурная зависимость контанты равновесия реакции для небольшого интервала температур имеет вид S H ln K = -, (8.39) R R T где S и Н Ч энтропия и энтальпия реакции. Непосредственно измеряемыми величинами являются константа равновесия K и темпе ратура T. Произведем замену переменных:
S H y = b0 + b1x, где y = ln K, b0 =, b1 = -, x =.
R R T Коэффициенты b0 и b1 определяются методом наименьших квадратов.
Энтальпия и энтропия реакции с учетом случайных ошибок равны S = R (b0 s(b0) t1- p/2) = Rb0 R s(b0 ) t1- p/2, H = -R (b1 s(b1) t1- p/2 ) = -(Rb1 R s(b1) t1- p/2 ).
2. Температурная зависимость давления насыщенного пара веще ства в узком интервале температур имеет вид H ln P = a -, (8.40) R T где а Ч константа, Н Чэнтальпия парообразования (испарения или сублимации). Непосредственно определяемыми величинами являются давление насыщенного пара Р и температура T. Произведем замену переменных:
H y = b0 + b1 x, где y = ln P, a = b0, b1 = -, x =.
R T Энтальпия парообразования с учетом случайной ошибки равна H = -R (b1 s(b1)t1- p/2 ) = -(Rb1 R s(b1) t1- p/2 ).
3. Константа скорости реакции первого порядка описывается сле дующим уравнением:
1 C k = ln, (8.41) t C или lnC = lnC0 - k t, где k Ч константа скорости реакции, С0 и С Ч исходная и текущая концентрация реагирующего вещества к моменту времени t соответ ственно. Произведем замену переменных:
y = b0 + b1 x, где y = lnC, b0 = ln C0, b1 = k, x = t.
Определив коэффициент b1 методом наименьших квадратов, получим значение константы скорости реакции с учетом случайной ошибки:
k = -(b1 s(b1) t1- p/2 ).
8.6. Метод множественной корреляции На практике часто бывает необходимым исследовать корреляци онную связь между многими (а не только двумя) величинами. В слу чае, когда необходимо установить зависимость величины Y от более чем одного параметра, обычно используют уравнения множественной регрессии следующего вида y = b0 + b1x1 + b2x2 +... + bk xk. (8.42) Коэффициенты уравнения находят методом наименьших квадра тов, т. е. определяют из условия n S = yi - yi = min, (8.43) i = где yi = y (x1i, x2i,..., xki ). Условия минимума функции S следующие:
S S S = 0, = 0,..., = 0. (8.44) b0 b1 bk Коэффициенты уравнения приближенной регрессии находят из реше ния системы (k + 1) нормальных уравнений, полученных из условий (8.44).
Рассмотрим случай, когда величина Y линейно зависит от двух пе ременных X1 и X2. Пусть из опытов получена выборка точек (x1i, x2i, yi) объемом n. Найдем методом наименьших квадратов коэффициенты линейного уравнения регрессии y = b0 + b1 x1 + b2 x2. (8.45) Тогда y y y =1, = x1, = x2. (8.46) b0 b1 b Система нормальных уравнений, соответствующих условиям (8.44), принимает следующий вид:
n y 2 yi - yi = 0, b i = n y 2yi - yi = 0, (8.47) b i = n y 2 yi - yi = 0.
b i = С учетом того, что yi = b0 + b1 x1i + b2 x2i и значений частных произ водных (8.46), после арифметических преобразований получаем n n n b0n + b1 1i + b2 2i = yi, x x i =1 i =1 i = n n n n b0 1i + b1 1i + b2 1ix2i = (8.48) x x x x yi, i i =1 i =1 i =1 i = n n n n b0 2i + b1 1i x2i + b2 2i = 2i x x x x yi.
i =1 i =1 i =1 i = Решая полученную систему уравнений относительно b0, b1 и b2, находим наилучшую аппроксимацию для соотношения (8.45). Силу линейной связи между переменными Х1 и Х2 можно оценить на осно вании выборочного коэффициента корреляции n 1i (x - x1)(x2i - x2) i = r * (x1, x2) =. (8.49) (n -1) s (x1) s (x2) ЛЕКЦИЯ Дисперсионный анализ, его задачи. Проведение однофакторного и двух факторного дисперсионного анализа.
9.1. Задачи дисперсионного анализа. Однофакторный диспер сионный анализ Средние значения измеряемых величин зависят от комплекса ос новных факторов (качественных и количественных), определяющих условия проведения опыта, и случайных факторов. Задачей дисперси онного анализа и является изучение влияния тех или иных факторов на изменчивость средних. В зависимости от числа источников диспер сии (числа рассматриваемых факторов) различают однофакторный и многофакторный дисперсионный анализ. Многофакторный дисперси онный анализ более эффективен по сравнению с классическим мето дом исследования, при котором изменяется только один фактор при постоянстве всех остальных, что не позволяет определить влияние взаимодействия различных факторов на результаты эксперимента.
При дисперсионном анализе каждое наблюдение используется для одновременной оценки всех факторов и их взаимодействий. Суть дис персионного анализа заключается в выделении и оценке отдельных факторов, влияющих на значения среднего. При этом суммарная вы борочная дисперсия разлагается на составляющие, обусловленные действием независимых факторов. Влияние данного фактора призна ется значимым, если соответствующая ему выборочная дисперсия значимо отличается от дисперсии воспроизводимости, обусловленной случайными ошибками. Проверка значимости оценок дисперсий про водится по критерию Фишера.
В дальнейшем примем, что:
1) случайные ошибки нормально распределены;
2) эксперименты равноточны;
3) изучаемые факторы влияют только на изменчивость средних, но не на дисперсию наблюдений (она постоянна).
При дисперсионном анализе рассматриваются факторы двух ви дов: со случайными уровнями и с фиксированными. В первом случае выбор уровней фактора производится из бесконечной совокупности возможных значений. Если все уровни выбираются случайным обра зом, то математическая модель объекта называется моделью со слу чайными уровнями факторов. Если же каждый фактор может прини мать только некоторые из фиксированных значений, то говорят о мо дели с фиксированными уровнями факторов. В случае модели сме шанного типа одна группа факторов рассматривается на случайных уровнях, а другая Ч на фиксированных.
Рассмотрим влияние на результаты опытов единичного фактора А, принимающего k различных значений (фактор А имеет k фиксирован ных уровней ai, i = 1, 2, Е, k). Обозначим через yij результат j-опыта в серии из ni числа измерений ( j = 1, 2, Е, ni), выполненных на i-уровне фактора А (табл. 2).
Таблица Исходные данные для однофакторного дисперсионного анализа Номер Уровни фактора А наблюдения а1 а2 Е аk 1 y11 y21 Е yk 2 y12 y22 Е yk ЕЕ Е Е Е n Е y1n y2n ykn Итоги: B1, C1 B2, C2 Е Bk, Ck Предположим, что результат каждого опыта можно представить в виде следующей модели:
yij = + i + ij, (9.1) где Ч суммарный эффект во всех опытах;
i Ч эффект, обуслов ленный влиянием фактора А на i-уровне;
ij Ч случайная ошибка опы та на i-уровне. Примем также, что наблюдения на фиксированном уровне фактора А нормально распределены относительно среднего значения ( + i) с общей дисперсией 2. Для того чтобы решить ош.
вопрос о значимости влияния фактора А, следует проверить нулевую гипотезу равенства математических ожиданий сумм ( + i) на раз личных уровнях этого фактора:
H0 : m1 = m2 =... = mk = m, (9.2) где mi = M{ + i}.
Рассмотрим случай, когда на каждом уровне выполнено равное число опытов (n1 = n2 = Е = nk = n). Общее число опытов равно N = n1 + n2 +... + nk = kn. (9.3) Обозначим сумму результатов всех опытов (итогов) на i-уровне через n Bi = yij, (9.4) j = а сумму квадратов итогов на i-уровне через n Ci = yij 2. (9.5) j = Тогда среднее значение наблюдений на i-уровне равно n ij y Bi j = yi = =, (9.6) n n а общее среднее для всей выборки из N наблюдений Ч k n k k y = (9.7) ij i i y = 1y = 1 B.
N k kn i =1 j =1 i =1 i = Общая выборочная дисперсия опытов определяется выражением k n ( yij - y) k n k n i =1 j = s2 = = yij 2 - 1 yij = i =1 j =1 N N -1 N - i =1 j = k k = (9.8) i C - 1 B, i =1 i N N - i = а выборочная дисперсия на i-уровне Ч n n n 1 si2 = yij 2 - yij = ( yij - yi )2 = n -1 n -1 n j =1 j =1 j = 1 Bi =. (9.9) C - i n -1 n Если выборочные дисперсии si2 однородны (проверка по крите рию Кохрена), то лучшей оценкой дисперсии 2, характеризующей ош.
влияние случайных факторов, будет выборочная дисперсия k 2 sош = (9.10) i s k i = с числом степеней свободы fош = k(n - 1) = N - k. Приближенно оце нить дисперсию фактора А можно следующим образом:
2 s2 - sош. (9.11) A Для получения более точной оценки рассмотрим отклонение сред них на фиксированных уровнях от общего среднего:
k 2 1 ош sош ( yi - y)2 2 + 2 +. (9.12) A A k -1 n n i = В данном случае под дисперсией фактора А понимают математиче ское ожидание среднего квадрата отклонений, обусловленного влия нием этого фактора. Выборочная дисперсия k n s2 = ( yi - y)2 n2 + sош (9.13) A A k - i = с числом степеней свободы fA = k - 1 используется для проверки нуле вой гипотезы (9.2) по критерию Фишера.
При этом, если нулевая гипотеза ( H0 : 2 = ош ) верна, выполня A ется следующее условие:
(s2 sош) F1- p, (9.14) A т. е. различие между дисперсиями s2 и sош является незначимым, и A следовательно влияние фактора А на результаты опытов тоже незна чимо (сопоставимо с эффектом случайности). При проверке гипотезы используется односторонний критерий, так как альтернативной гипо тезой является H1 : 2 > ош. Если же A (s2 sош)> F1- p, (9.15) A то нулевая гипотеза о равенстве математических ожиданий сумм ( + i) отвергается (влияние фактора А значимо). Чтобы выяснить, какие средние различны, можно использовать критерий Стъюдента, сравнивая средние попарно. Оценить влияние фактора А можно на основании (9.13):
s2 - sош A 2 =. (9.16) A n Если на каждом уровне выполнено разное число опытов, выбороч ная дисперсия фактора А рассчитывается по формуле k k 1 Bi2 s2 = - Bi, (9.17) A k -1 ni N i =1 i = а выборочная дисперсия, характеризующая влияние случайных фак торов, по формуле k k sош = fisi2 fi, (9.18) i =1 i = где fi = ni - 1. Число степеней свободы sош равно fош = N - k.
Если дисперсия s2 значимо отличается от дисперсии sош, т. е. вы A полняется неравенство (9.15), то дисперсия фактора А оценивается по формуле k - 2 (s2 - sош ). (9.19) A A N - 9.2. Двухфакторный дисперсионный анализ Рассмотрим влияние на результаты опытов двух факторов А и В.
Фактор А исследуется на k уровнях (i = 1, 2, Е, k), фактор В Ч на m уровнях ( j = 1, 2, Е, m). Пусть при каждом сочетании уровней факто ров выполнено n параллельных опытов (q = 1, 2, Е, n). Тогда общее число опытов равно N = nkm. Обозначим через yijq результат q-го опы та, выполненного на i-уровне фактора А и j-уровне фактора В.
Предположим, что результат каждого опыта можно представить следующим образом:
yijq = + i + + i + ijq, (9.20) j j где Ч общее среднее (суммарный эффект во всех опытах);
i и j Ч эффекты, обусловленные влиянием фактора А на i-уровне и фактором В на j-уровне соответственно;
ijq Ч случайная ошибка опыта, распре деленная нормально с нулевым математическим ожиданием и диспер сией ош ;
ij Ч эффект взаимодействия факторов. Величина ij характеризует отклонение среднего в (ij)-серии опытов от суммы пер вых трех членов в ур-и (9.20), а соответствующую ей дисперсию AB можно оценить только при наличии параллельных опытов.
При отсутствии параллельных опытов (табл. 3) или в случае, если эффектом взаимодействия факторов пренебрегают, для описания ре зультатов экспериментов используется линейная модель yij = + i + + ij. (9.21) j Таблица Исходные данные для двухфакторного дисперсионного анализа без параллельных опытов. Факторы А и В исследуются на 3 уровнях Уровни Уровни фактора А фактора В а1 а2 а3 (аk) Средние:
' b1 y11 y21 y31 (yk1) y b2 y12 y22 y32 (yk2) y' ' b3 (bm) y13 y23 y33 (ykm) y3( y' ) m Средние:
y1 y2 y3( yk ) Обозначим через yi и y' средние по столбцам и по строкам:
j m k ij ij y y j =1 i = yi =, y' =, (9.22) j m k а через y Ч среднее всех опытов:
k m k 1 y = (9.23) yij = yi.
km k i =1 j =1 i = Рассмотрим влияние факторов А и В на рассеяние средних по столбцам и по строкам соответственно относительно общего среднего.
Рассеяние в средних по строкам не зависит от фактора А, так как все его уровни усреднены, и определяется влиянием фактора В и случай ных факторов.
Тогда с учетом того, что дисперсия среднего в k раз меньше дис персии случайной ошибки единичного измерения, имеем m ош 2 + y' - y). (9.24) B j ( k m - j = Аналогичным образом можно показать, что k ош 2 + yi - y). (9.25) A ( m k - i = Таким образом, чтобы оценить дисперсии факторов А и В, необходи мо знать дисперсию случайной ошибки.
Оценить влияние случайных факторов при отсутствии параллель ных опытов можно следующим образом. Рассеяние результатов опы тов в i-столбце относительно его среднего обусловлено влиянием фак тора В и фактора случайности:
m si2 = yij - yi) 2 + ош. (9.26) B ( m - j = Равенство (9.26) станет более точным, если использовать средне взвешенное значение дисперсии по всем столбцам:
k 2 + ош si2. (9.27).
B k i = Вычитая (9.24) из (9.27), получим k m ош 1 ош - si2 - y' - y), (9.28) j ( k k m - i =1 j = или после арифметических преобразований k m 2 (m -1) si2 k y' y) ош - - sош. (9.29) j ( (k -1)(m -1) i =1 j = Полученную оценку для дисперсии случайной ошибки с числом сте пеней свободы fош = (k - 1)(m - 1) обозначим через sош. Определим также следующие выборочные дисперсии:
k m s2 = yi - y) m2 + sош, (9.30) A A ( k - i = m k 2 sB = y' - y) k2 + sош (9.31) B j ( m - j = с числом степеней свободы fA = (k - 1) и fB = (m - 1).
Проверка нулевой гипотезы о незначимости влияния факторов А и В проводится по критерию Фишера: если s2 sB A F1- p ( fA, fош ) и (или) F1- p ( fB, fош ), (9.32) 2 sош sош то влияние фактора признается незначимым (i = 0 и (или) j = 0).
Если одно (или оба) из неравенств (9.32) не выполняется, то влия ние соответствующего фактора (факторов) значимо. Определить, ка кие именно средние различны, можно по критерию Стъюдента.
Рассмотрим теперь случай, когда при каждом сочетании уровней факторов А и В выполнено n параллельных опытов (u = 1, 2, Е, n), что дает возможность оценить влияние взаимодействия этих факторов на результаты опытов.
Так, например, в табл. 3 вместо одного значения y11 появится серия значений y111, y112, Е, y11n. Обозначим через yij среднее в ячейке (среднее серии параллельных опытов):
n yij = yiju (9.33) n u = Тогда m k 1 yi = yij, y' = yij, (9.34) j m k j =1 i = k m k 1 y = yij = yi (9.35) km k i =1 j =1 i = и дисперсии s 2 и s B рассчитываются по формулам (9.30) и (9.31).
A В качестве оценки дисперсии воспроизводимости используем средне взвешенное значение дисперсий результатов в каждой ячейке k m 2 sош = sij, (9.36) mk i =1 j = где n sij = yiju - yij). (9.37) ( n - u = Число степеней свободы дисперсии sош равно fош = mk (n - 1).
Введем также выборочную дисперсию, характеризующую влияние взаимодействия факторов k m m n s2 yij - yi) - k y' - y), (9.38) AB j ( ( (k -1)(m -1) i =1 j =1 j = с числом степеней свободы fAB = (k - 1)(m - 1).
Проверка значимости влияния факторов и их взаимодействия про водится по критерию Фишера, но неодинаково для моделей с фикси рованными и случайными уровнями:
1. Для модели с фиксированными уровнями выборочные диспер сии s2, sB и s2 сравниваются с оценкой дисперсии воспроизводимо A AB сти sош. Если выполняются неравенства 2 2 (s2 sош)> F1- p( f, fош ), (sB sош)> F1- p( fB, fош ), A A (s2 sош)> F1- p( f, fош ), (9.39) AB AB то влияние факторов и их взаимодействия значимо.
2. Для модели со случайными уровнями проверка значимости взаимодействия факторов проводится так же, как и для для модели с фиксированными уровнями. Влияние факторов значимо, если выпол няются следующие неравенства:
(s2 s2 )> F1- p( f, f ), A AB A AB (sB s2 )> F1- p( fB, f ). (9.40) AB AB ЛЕКЦИЯ Планирование эксперимента при дисперсионном анализе. Постановка за дачи при планировании экстремальных экспериментов. Полный фактор ный эксперимент типа 22: матрица планирования, вычисление коэффици ентов уравнения регрессии.
10.1. Планирование эксперимента при дисперсионном анализе При двухфакторном дисперсионном анализе минимальное число опытов (в условиях линейной модели), обеспечивающее перебор всех возможных сочетаний уровней факторов, определяется произведени ем числа их уровней: N = km. Подобный эксперимент называется пол ным факторным экспериментом (ПФЭ). Если изучается влияние на процесс k факторов при одинаковом числе уровней n, то необходимое число опытов при ПФЭ равно N = nk. (10.1) Так, если k = 2 и n = 3 (табл. 3, лекция 9), то N = 32 = 9.
Эксперимент, в котором пропущены некоторые сочетания уров ней, называется дробным факторным экспериментом (ДФЭ). Сокра щение числа опытов неизбежно приводит к потере части информации, при этом обычно пренебрегают эффектами взаимодействия факторов.
Рассмотрим трехфакторный дисперсионный анализ при одинако вом числе уровней n для каждого фактора. Пусть n = 2. Тогда при ПФЭ потребуется провести N = 23 = 8 опытов (табл. 4).
Таблица Полный факторный эксперимент Уровни а1 а факторов b1 b2 b1 b c1 *y111 y121 y211 *y c2 y112 *y122 *y212 y При отсутствии параллельных опытов результаты наблюдений можно представить в виде линейной модели yijq = + i + + q + ijq, (10.2) j при этом линейные эффекты оказываются смешанными с эффектами взаимодействия: эффект А с ВС взаимодействием, эффект В с АС взаи модействием, эффект С с АВ взаимодействием. Однако число опытов в условиях линейной модели можно существенно сократить при ис пользовании ДФЭ, спланированного по схеме латинского квадрата.
Латинским квадратом n x n называют квадратную таблицу, со ставленную из n элементов (чисел или букв) таким образом, чтобы каждый элемент повторялся в каждой строке и каждом столбце только один раз. Из двух элементов образуется латинский квадрат 2 x 2:
A B c1 c или ;
(10.3) B A c2 c из трех Ч латинский квадрат 3 x 3:
A B C c1 c2 c B C A или c2 c3 c1. (10.4) C A B c3 c1 c Стандартными латинскими квадратами называются квадраты, у ко торых первые строка и столбец построены или в алфавитном порядке, или в порядке натурального ряда (квадраты (10.3) и (10.4)). Получены эти квадраты путем одношаговой циклической перестановки.
При ДФЭ по схеме латинского квадрата вводится в планирование третий фактор, при этом основой служит ПФЭ типа n2. Так, при n = на ПФЭ типа 22 (для факторов А и В) накладывается латинский квад рат 2 x 2 (табл. 5). План эксперимента, соответствующий табл. 5, на зывается матрицей планирования и представлен в табл. 6. Число опы тов при этом сокращается до четырех вместо восьми при ПФЭ.
Таблица 2 x 2 латинский квадрат В А b1 b a1 c1 c a2 c2 c Хотя латинский квадрат 2 x 2 является частью плана, всю табл. также называют латинским квадратом. В нем каждый элемент повто ряется только один раз в каждой строке и каждом столбце, что в рав ной степени сказывается при подсчете средних по строкам и столб цам. Приведенный в табл. 6 план представляет собой половину Ч по луреплику от ПФЭ типа 23 (вошедшие в полуреплику опыты отмечены в табл. 4 звездочками).
Таблица План ДФЭ по схеме латинского квадрата 2 x (k = 3, n = 2, N = 4) Номер АВС Итоги опыта 1 а1 b1 c1 y 2 а1 b2 c2 y 3 а2 b1 c2 y 4 а2 b2 c1 y Аналогично планируется ДФЭ по схеме латинского квадрата 3 x (табл. 7). За основу взят ПФЭ типа 32, третий фактор (С) введен в рас смотрение по схеме латинского квадрата (10.4). ДФЭ 32 можно рас сматривать как 1/3 реплику от ПФЭ типа 33.
Таблица Латинский квадрат 3 x A B b1 b2 b a1 c1 c2 c y1 y2 y a2 c2 c3 c y4 y5 y a3 c3 c1 c y7 y8 y В общем случае при планировании дробного факторного экспери мента по схеме латинского квадрата число опытов по сравнению с ПФЭ уменьшается в n раз (так, если n = 4, то при ПФЭ N =43 = 64, а при ДФЭ по схеме латинского квадрата 4 x 4 Ч N = 42 = 16).
Дисперсионный анализ латинского квадрата, выполненного без параллельных опытов, проводится аналогично двухфакторному дис персионному анализу. При этом для факторов А и В рассматривается их влияние на рассеяние средних по столбцам и по строкам относи тельно общего среднего соответственно, а для фактора С Ч на рас сеяние средних по латинским буквам Сq. Так, например, для ДФЭ, представленного в табл. 7, средние по латинским буквам равны y1 + y6 + y8 y2 + y4 + y9 y3 + y5 + y C1 =, C2 =, C3 =. (10.5) 3 3 Значимость линейных эффектов проверяют по критерию Фишера.
Адекватность принятой линейной модели можно проверить, выполнив для каждого сочетания уровней факторов (для каждой ячейки латин ского квадрата) одинаковое число параллельных опытов. При этом наличие параллельных наблюдений используется только для оценки случайной ошибки опыта. Если эффекты взаимодействия незначимы, то остаточная дисперсия будет незначимо отличаться от дисперсии воспроизводимости, обусловленной ошибкой опыта.
10.2. Постановка задачи при планировании экстремальных экспериментов Решение экстремальных задач физической химии и химической технологии (например, определение оптимальных условий проведе ния опыта и протекания процесса, оптимального состава материалов) возможно на основе математической модели объекта Ч функции от клика, связывающей выходной параметр, характеризующий результа ты эксперимента, с переменными, определяющими условия проведе ния опыта (факторами):
y = (x1, x2,Е, xk). (10.6) На основе теоретического анализа физико-химических процессов при наличии достаточной информации об их механизмах можно со ставить детерминированную математическую модель объекта. Однако при проведении большинства исследований механизмы процессов, протекающих в изучаемых объектах, остаются неизвестными, поэтому для решения задач оптимизации необходимо использовать методы ма тематической статистики.
При статистическом подходе математическая модель объекта или процесса представляется в виде полинома, т.е. отрезка ряда Тейлора, в который разлагается неизвестная функция (10.6):
k k k y = 0 + x + uj xu x + x2 + j j j jj j j =1 u, j =1 j = u j k + iuj xixux +..., (10.7) j i,u, j = i u j где (0) (0) 0 = (0), =, uj =, j x xu x j j (0) (0) =, iuj =. (10.8) jj xi xu x 2 x j j Из-за воздействия случайных факторов на результаты опыта при обработке и анализе экспериментальных данных для полиномиальной модели (10.7) находят выборочные коэффициенты регрессии b0, bj, buj, bjj, buij, которые являются оценками соответствующих теоретических коэффициентов. Уравнение регрессии записывается в виде k k k k y = b0 + bj x + buj xu x + bjj x2 + biuj xixu x +...
j j j j j =1 u, j =1 j =1 i,u, j = u j i u j k + biuj xixux +..., (10.9) j i,u, j = i u j где b0 Ч свободный член;
bj Ч линейные эффекты;
buj Ч эффекты парного взаимодействия;
bjj Ч квадратичные эффекты;
buij Ч эффекты тройного взаимодействия.
В зависимости от целей исследования и имеющейся информации можно ограничиться расчетом только части коэффициентов, пренеб регая влиянием остальных эффектов (например, в условиях линейной модели значимыми считаются только линейные эффекты, квадратич ной модели Ч линейные и квадратичные эффекты, при этом в обоих случаях принимается, что эффекты взаимодействия факторов пренеб режимо малы).
Следует отметить, что на основании оценок теоретических коэф фициентов нельзя определить аналитическое выражение функции от клика и, следовательно, получить информацию о механизме процесса.
Полиномиальные модели используются только для решения задач оп тимизации и управления процессами.
Под планированием эксперимента понимают оптимальное (наибо лее эффективное) управление ходом эксперимента с целью получения максимально возможной информации на основе минимально допус тимого количества опытных данных. Весь эксперимент обычно разби вается на несколько этапов. Информация, полученная после каждого этапа, используется для планирования исследований на следующем этапе. Планирование эксперимента позволяет варьировать все факто ры и получать одновременно количественные оценки всех эффектов, и при этом, в отличие от классического регрессионного анализа, из бежать корреляции между коэффициентами уравнения регрессии.
10.3. Полный факторный эксперимент типа 22: матрица пла нирования, вычисление коэффициентов уравнения регрессии При полном факторном эксперименте (ПФЭ) число опытов равно числу всех возможных комбинаций уровней факторов и при одинако вом числе уровней для каждого фактора определяется формулой N = nk, (10.10) где n Ч число уровней, k Ч число факторов ( j = 1, 2, Е, k). ПФЭ 2k называется такое проведение опытов, при котором каждый из k фак торов рассматривается только на двух уровнях. При этом уровни фак торов представляют собой границы варьирования данного параметра.
Допустим, что изучается влияние на выход продукта (y) двух па раметров (факторов): температуры (z1) в интервале 50Ц100 оС и давле ния (z2) в диапазоне 1Ц2 атм. При реализации ПФЭ требуется выпол нить N = 22 = 4 опыта. Произведем кодирование факторов (замену пе ременных):
z - zo j j x =, (10.11) j z j где zmax + zmin zmax - zmin j j j j zo =, z =, (10.12) j j 2 zmax и zmin Ч верхняя и нижняя границы варьирования j-фактора.
j j o o Точка (z1, z2 ) называется центром плана, или основным уровнем;
ве личины z1 и z2 Ч интервалами варьирования по осям z1 и z2.
Как следует из уравнений (10.11) и (10.12), для переменных х1 и х нижний уровень равен Ц1, верхний Ч +1, координаты центра плана равны нулю. В табл. 8 представлен план ПФЭ 22, который в безраз мерном масштабе может быть интерпретирован в виде четырех вер шин квадрата (рис. 1).
Таблица Полный факторный эксперимент № Факторы Факторы Выход опыта в натуральном в безразмерном продукта, y масштабе масштабе z1 (oC) z2 (атм) x1 x 1 50 1 Ц1 Ц1 y 250 2 Ц1 +1 y 3 100 1 +1 Ц1 y 4 100 2 +1 +1 y Рис. 1. Полный факторный эксперимент Вычислим коэффициенты линейного уравнения регрессии y = b0 + b1x1 + b2x2. (10.13) Для нахождения b0 в план ПФЭ надо ввести столбец фиктивной пере менной х0 = 1;
соответствующая матрица планирования представлена в табл. 9. В математической статистике доказывается, что при плани ровании эксперимента по предложенной схеме и нахождении коэф фициентов уравнения регрессии по методу наименьших квадратов любой коэффициент определяется скалярным произведением столбца y на соответствующий столбец факторов хj в безразмерном масштабе (табл. 9), деленным на число опытов в матрице планирования:
N x yi ji i = bj =. (10.14) N Таблица Матрица планирования ПФЭ типа с фиктивной переменной № опыта х0 х1 х2 y 1+1 Ц1 Ц1 y 2+1 Ц1 +1 y 3+1 +1 Ц1 y 4+1 +1 +1 y Так, значение коэффицента b1 определяется выражением 1 [- y1 + y2 - y3 + y4 ] b1 = x1i yi =. (10.15) 4 i = Если ввести в рассмотрение эффект парного взаимодействия, то уравнение регрессии примет вид y = b0 + b1x1 + b2x2 + b12x1x2. (10.16) Для нахождения коэффициента b12 необходимо расширить матрицу планирования, представленную в табл. 9, добавив в нее столбец x1x2, характеризующий эффект взаимодействия (табл. 10).
Таблица Расширенная матрица планирования ПФЭ типа № опыта х0 х1 х2 х1х2 y 1 +1-1-1+1y 2 +1-1+1-1 y 3+1 +1 -1 -1 y 4 +1+1+1+1 y Значения фактора взаимодействия в безразмерном масштабе опре деляются произведением соответствующих значений факторов x1 и x2:
(x1x2)i = x1i x2i. (10.17) Коэффициент b12 определяется так же, как и линейные эффекты:
N 1 b12 = (x1x2)i yi = [ y1 - y2 - y3 + y4]. (10.18) N i = ЛЕКЦИЯ Матрица планирования ПФЭ 23. Проверка значимости коэффициентов и адекватности уравнения регрессии, полученных при обработке результа тов ПФЭ 22 и 23. Дробный факторный эксперимент. Планы типа 2k-1.
11.1. Матрица планирования полного факторного эксперимен та типа Рассмотрим планирование ПФЭ типа 23, при котором исследуется влияние на результат опыта уже трех факторов. При реализации тако го ПФЭ требуется выполнить N = 8 опытов. Проведем кодирование факторов по уравнениям (10.11) - (10.12). План проведения опытов представлен в табл. 11, геометрически в безразмерном масштабе он может быть интерпретирован в виде восьми вершин куба (рис. 2).
Таблица Полный факторный эксперимент № Факторы в безразмерном масштабе Выход опыта продукта, y x1 x2 x 1Ц1Ц1 Ц1 y 2+1Ц1 Ц1 y 3Ц1+1 Ц1 y 4+1+1 Ц1 y 5Ц1Ц1 +1 y 6+1Ц1 +1 y 7Ц1+1 +1 y 8+1+1 +1 y Уравнение регрессии с учетом эффектов взаимодействия факторов запишется в следующем виде:
y = b0 + b1x1 + b2x2 + b3x3 + b12x1x2 + b13x1x3 + + b23x2x3 + b123x1x2x3, (11.1) где коэффициенты b12, b13 и b23 характеризуют эффекты парного взаи модействия, b123 Ч эффект тройного взаимодействия.
Для нахождения коэффициентов уравнения (11.1) необходимо со ставить расширенную матрицу планирования ПФЭ с фиктивной пере менной, представленную в табл. 12.
Рис. 2. Полный факторный эксперимент Таблица Расширенная матрица планирования ПФЭ типа № x0 x1 x2 x3 x1x2 x1x3 x2x3 x1x2x3 y 1 +1 Ц1 Ц1 Ц1 +1 +1 +1 Ц1 y 2 +1 +1 Ц1 Ц1 Ц1 Ц1 +1 +1 y 3 +1 Ц1 +1 Ц1 Ц1 +1 Ц1 +1 y 4 +1 +1 +1 Ц1 +1 Ц1 Ц1 Ц1 y 5 +1 Ц1 Ц1 +1 +1 Ц1 Ц1 +1 y 6 +1 +1 Ц1 +1 Ц1 +1 Ц1 Ц1 y 7 +1 Ц1 +1 +1 Ц1 Ц1 +1 Ц1 y 8 +1 +1 +1 +1 +1 +1 +1 +1 y Как и при ПФЭ 22, коэффициенты уравнения регрессии (11.1) оп ределяются скалярным произведением столбца y на соответствующий столбец факторов или их взаимодействий в безразмерном масштабе, деленным на число опытов в матрице планирования (см. уравнения (10.14) и (10.18)).
Так, например, коэффициент b123 рассчитывается по следующему выражению:
b123 = [- y1 + y2 + y3 - y4 + y5 - y6 - y7 + y8]. (11.2) 11.2. Проверка значимости коэффициентов и адекватности уравнения регрессии, полученных при обработке результатов ПФЭ 22 и Для оценки значимости коэффициентов уравнения регрессии и проверки адекватности уравнения эксперименту достаточно провести серию параллельных опытов, выполненных при каком-то одном соче тании факторов.
o o o o o Пусть в центре плана (в точках (z1, z2 ) и (z1, z2, z3 ) для ПФЭ 22 и 23 соответственно) проведена серия из m опытов. Тогда выборочная дисперсия воспроизводимости, характеризующая влияние случайных факторов, равна m o yu - yo) ( u = sвоспр =, (11.3) m - o где yu Ч результат u-го опыта (u = 1, 2, Е, m), yo Ч среднее значе ние серии опытов. В математической статистике доказывается, что для спланированных экспериментов все коэффициенты уравнений регрессии определяются с одинаковой точностью, равной sвоспр s(bj ) =. (11.4) N Значимость коэффициентов проверяется по критерию Стъюдента.
В условиях нулевой гипотезы Н0: j = 0;
отношение абсолютной вели чины коэффициента к его ошибке имеет распределение Стъюдента.
Для каждого коэффициента определяется t-отношение:
bj bj t = = N, (11.5) j s(bj ) sвоспр которое сравнивается с табличным значением критерия Стъюдента tp(f ) для выбранного уровня значимости р (обычно 0,05) и числа сте пеней свободы f = m - 1. Если для рассматриваемого коэффициента tj > tp(f ), то он значимо отличается от нуля. Выборочные коэффициен ты, для которых tj tp(f ), незначимы, и их следует исключить из урав нения регрессии.
Допустим, при проверке значимости коэффициентов уравнения (11.1) оказалось, что все коэффициенты, характеризующие эффекты взаимодействия факторов, незначимы. После их исключения получа ем линейное уравнение регрессии y = b0 + b1x1 + b2x2 + b3x3, (11.6) при этом значения b0, b1, b2 и b3 не требуется вычислять заново из-за того, что коэффициенты уравнения некоррелированы между собой.
В отличие от классического регрессионного анализа, исключение не значимого коэффициента не сказывается на величинах остальных ко эффициентов уравнения регрессии, а сами выборочные коэффициен ты, полученные при реализации ПФЭ, являются несмешанными оцен ками теоретических коэффициентов.
Адекватность уравнения проверяется по критерию Фишера 2 F =(sад sвоспр), (11.7) Дисперсия адекватности (остаточная дисперсия) равна N 2 sад = sост = (11.8) ( yi - yi )2, N - l i = где l Ч число значимых коэффициентов (для рассматриваемого слу чая l = 4). Уравнение адекватно описывает эксперимент, если F F1- p ( f1, f2), (11.9) где F1-p (f1, f2) Ч табличное значение критерия Фишера для р = 0,05 и чисел степеней свободы f1 = fад = N - l и f2 = fвоспр = m - 1.
Рассмотрим также схему проведения регрессионного анализа для спланированного эксперимента в случае, когда каждый опыт в матри це планирования повторялся m раз. В качестве примера используем ПФЭ 23;
при получении уравнения регрессии ограничимся линейным приближением (уравнение (11.6)). Матрица планирования такого экс перимента представлена в табл. 13.
Для каждого сочетания уровней факторов определяется среднее значение измеряемой величины и выборочная дисперсия:
m yi = yiu, (11.10) m u = m si2 = (11.11) ( yiu - yi )2.
m -1u = Таблица Матрица планирования ПФЭ 23 в условиях линейной модели с одинаковым числом параллельных опытов при каждом сочетании уровней факторов № x0 x1 x2 x3 y yi si y 1 +1 Ц1 Ц1 Ц1y11, y12, Е, y1m s y 2 +1 +1 Ц1 Ц1y21 y22, Е, y2m s y 3 +1 Ц1 +1 Ц1y31, y32, Е, y3m s y41, y42, Е, y4m y 4 +1 +1 +1 Ц1 s y 5 +1 Ц1 Ц1 +1y51, y52, Е, y5m s y 6 +1 +1 Ц1 +1y61, y62, Е, y6m s y 7 +1 Ц1 +1 +1y71, y72, Е, y7m s y 8 +1 +1 +1 +1y81, y82, Е, y8m s Однородность дисперсий проверяется по критерию Кохрена. От ношение максимальной дисперсии к сумме всех дисперсий smax G = (11.12) N i s i = сравнивается с табличным значением G1-p ( f1, f2) для р = 0,05 и чисел степеней свободы f1 = m - 1 и f2 = N. Если G G1-p ( f1, f2), то выбороч ные дисперсии однородны. Тогда наилучшей оценкой дисперсии вос производимости будет средневзвешенная дисперсия N 2 sвоспр = (11.13) i s N i = с числом степеней свободы fвоспр = N (m - 1).
Коэффициенты уравнения регрессии определяются по формуле N bj = (11.14) ji x yi.
N i = Поскольку дисперсия среднего в m раз меньше дисперсии единичного измерения, т. е.
s2( y) = sвоспр m, (11.15) то выборочные среднеквадратичные отклонения коэффициентов рас считываются следующим образом:
sвоспр 1 N s(bj ) = = (11.16) i s.
Nm N m i = Значимость коэффициентов проверяется по критерию Стъюдента:
если bj t = > t ( f ), (11.17) j p s (bj ) где tp(f ) Ч табличное значение критерия Стъюдента для р = 0,05 и числа степеней свободы f = N (m - 1), то коэффициент значимо отли чается от нуля.
Адекватность уравнения регрессии эксперименту проверяется по критерию Фишера. Дисперсия адекватности равна N m yi - yi ) ( i = sад =, (11.18) N - l где l Ч число значимых коэффициентов в уравнении регрессии.
Уравнение адекватно эксперименту, если sад F = F1- p ( fад, fвоспр), (11.19) sвоспр где F1-p (fад, fвоспр) Ч табличное значение критерия Фишера для р = 0, и чисел степеней свободы fад = N - l и fвоспр = N (m - 1). В противном случае для описания результатов эксперимента необходимо увеличить порядок аппроксимирующего полинома.
11.3. Дробный факторный эксперимент. Планы типа 2k- Число необходимых опытов в условиях линейной модели сущест венно сокращается при проведении дробных факторных эксперимен тов (дробных реплик от ПФЭ). В качестве реплики обычно использует ся полный факторный эксперимент для меньшего числа факторов.
При этом вычисление коэффициентов уравнения и оценка их значимо сти проводится так же, как и в рассмотренных выше примерах ПФЭ и 23. Число опытов в дробной реплике должно быть больше или равно числу неизвестных коэффициентов в уравнении регрессии.
Спланируем дробный факторный эксперимент для получения ли нейного уравнения регрессии небольшого участка поверхности откли ка при трех независимых факторах:
y = b0 + b1x1 + b2x2 + b3x3. (11.20) Постановка ПФЭ 23 требует проведения 8 опытов. Для решения же поставленной задачи можно ограничиться 4 опытами, если в матрице планирования ПФЭ 22 (табл. 10, лекция 10) использовать столбец х1х в качестве плана для х3. Матрица планирования такого сокращенного эксперимента Ч ДФЭ типа 23-1, или полуреплики от ПФЭ 23, Ч пред ставлена в табл. 14.
Таблица Матрица планирования ДФЭ типа 23- № опыта х0 х1 х2 х3 y 1+1 Ц1 Ц1 +1 y 2 +1Ц1+1Ц1 y 3+1 +1 Ц1 Ц1 y 4 +1+1+1+1 y Проведение ДФЭ по предложенной схеме позволяет оценить сво бодный член и три коэффициента при линейных членах уравнения (11.20), однако при этом они будут являться несмешанными оценками теоретических коэффициентов только в том случае, если генеральные коэффициенты регрессии при парных взаимодействиях равны нулю. В противном случае найденные выборочные коэффициенты будут сме шанными оценками теоретических:
b1 1 + 23, b2 2 + 13, b3 3 + 12. (11.21) Генеральные коэффициенты не могут быть оценены по отдельно сти на основании только 4 опытов, поскольку при этом столбцы для линейных членов и парных произведений одинаковы (например, эле менты вычисленного столбца для произведения х2х3 в точности совпа дут с элементами столбца х1). Чтобы определить, оценкой суммы ка ких именно генеральных коэффициентов явяются выборочные коэф фициенты, удобно пользоваться генерирующим соотношением x3 = x1x2, (11.22) в общем случае означающим, какой именно столбец ПФЭ 2k был ис пользован в качестве плана для введения (k + 1)-го фактора в ДФЭ.
При умножении обоих частей (11.22) на x3, получаем x3 = x1x2x3. (11.23) Единичный столбец I = x1x2x3 (11.24) называется определяющим контрастом и позволяет определить, эле менты каких столбцов в расширенной матрице планирования одина ковы. Умножая I по очереди на x1, x2 и x3, получаем 2 x1 = x1 x2x3 = x2x3, x2 = x1x2 x3 = x1x3, x3 = x1x2x3 = x1x2, (11.25) в точности соответствующих системе смешанных оценок (11.21).
При постановке ДФЭ с числом факторов k 4 в зависимости от генерирующего соотношения выборочные коэффициенты регрессии оказываются смешанными оценками того или иного сочетания гене ральных коэффициентов. Поэтому важно заранее определиться с тем, какая информация является наиболее важной в данном исследовании, и в зависимости от поставленной задачи подобрать нужную дробную реплику.
Рассмотрим, например, планирование ДФЭ типа 24-1, представ ляющего собой полуреплику от ПФЭ 24. В качестве реплики исполь зуем ПФЭ 23 (табл. 12). Используем два генерирующих соотношения:
x4 = x1x2x3, (11.26) x4 = x1x3. (11.27) Для соотношения (11.26) определяющим контрастом будет I = x1x2x3x4. (11.28) Тогда x1 = x2x3x4, b1 1 + 234;
x2 = x1x3x4, b2 2 + 134 ;
x3 = x1x2x4, b3 3 + 124;
x4 = x1x2x3, b4 4 + 123;
x1x2 = x3x4, b12 12 + 34;
x1x3 = x2x4, b13 13 + 24 ;
x1x4 = x2x3, b14 14 + 23. (11.29) В реальных задачах влияние тройных взаимодействий обычно равно нулю. Следовательно, генерирующее соотношение (11.26) следует ис пользовать, если наибольший интерес представляют оценки для ли нейных эффектов.
Для соотношения (11.27) определяющим контрастом будет I = x1x3x4. (11.30) Тогда x1 = x3x4, b1 1 + 34;
x2 = x1x2x3x4, b2 2 + 1234;
x3 = x1x4, b3 3 + 14;
x4 = x1x3, b4 4 + 13 ;
x1x2 = x2x3x4, b12 12 + 234;
x2x3 = x1x2x4, b23 23 + 124 ;
x2x4 = x1x2x3, b24 24 + 123. (11.31) Следовательно, дробную реплику с генерирующим соотношением x4 = x1x3 следует использовать, если наибольший интерес представля ют эффекты парных взаимодействий.
В общем случае число опытов в дробной реплике должно удовле творять следующему соотношению:
k +1 N < 2k, (11.32) где k Ч число факторов. Если число опытов равно числу определяе мых коэффициентов в линейном уравнении регрессии (N = k + 1), дробная реплика представляет собой линейный насыщенный план, для которого все линейные эффекты смешаны с эффектами взаимодейст вия. Число степеней свободы остаточной дисперсии в таких планах равно нулю, поэтому для проверки адекватности линейного уравнения необходимо проведение дополнительных опытов.
Итак, рассмотренные двухуровневые планы ПФЭ 2k и ДФЭ 2k-1 об ладают следующими свойствами: вычисления просты;
все коэффици енты регрессии определяются независимо друг от друга и с одинако вой и минимальной дисперсией;
каждый коэффициент рассчитывается по результатам всех опытов.
ЛЕКЦИЯ Оптимизация методом крутого восхождения по поверхности отклика.
Описание функции отклика в области, близкой к экстремуму. Компози ционные планы Бокса-Уилсона. Ортогональные планы второго порядка, расчет коэффицентов уравнения регрессии. Метод последовательного симплекс-планирования.
12.1. Оптимизация методом крутого восхождения по поверхно сти отклика Задача оптимизации сводится к опытному определению такого со четания уровней k факторов (координаты точки в (k+1)-мерном фак торном пространстве), при котором достигается максимальное (мини мальное) значение выходного параметра y (или нескольких парамет ров), т. е. функция отклика системы y = (x1, x2,..., xk ) принимает экстремальное значение.
Рассмотрим случай, когда на систему оказывают влияние только два фактора (х1 и х2 в безразмерном масштабе). Построим контурные сечения y = const поверхности отклика при k = 2 (рис. 3 а).
Рис. 3. Движение по поверхности отклика (а) к экстремуму в традиционном эксперименте и в методе крутого восхождения (б) Поиск экстремальной точки поверхности отклика в традиционном эксперименте проводится следующим образом. В точке L с известным значением у фиксируется один из факторов, например х1, и начинается движение из этой точки вдоль оси х2. Движение по х2 продолжается до тех пор, пока не прекращается прирост y (рис. 3 б). В точке М с наи лучшим значением выходного параметра фиксируется фактор х2 и на чинается движение в направлении оси х1. В точке N со следующим наилучшим значением y снова фиксируется х1 и начинается движение по х2 и т. д. Очевидно, что путь к экстремуму по ломаной кривой LMNR (рис. 3 б) не является оптимальным.
Кратчайшим, наиболее крутым путем достижения экстремума бу дет движение из точки L по градиенту перпендикулярно изолиниям y = const (на рис. 3 б этот путь показан пунктирной линией). Для рас сматриваемого случая градиент функции отклика равен grad = i + j, (12.1) x1 x где i и j Ч орты координатных осей. Предполагается, что функция непрерывна, дифференцируема и не имеет особых точек.
Для реализации метода крутого восхождения Бокс и Уилсон пред ложили шаговый метод движения по поверхности отклика. В окрест ности точки L ставится эксперимент для локального описания поверх ности отклика линейным уравнением регрессии:
y = b0 + b1x1 + b2x2. (12.2) Движение из точки L начинается в направлении градиента линейного приближения y y = b1;
= b2. (12.3) x1 x Для случая, представленного на рис. 3 б, выборочные коэффици енты при линейных членах в окрестности точки L имеют разные зна ки: b1 > 0, b2 < 0, поэтому при движении к максимуму функции откли ка значение х1 увеличивается, а х2 уменьшается. Движение по гради енту линейного приближения продолжается до тех пор, пока не пре кращается прирост y. В точке с наибольшим значением y (центр пла на) ставится новая серия опытов и определяется новое направление движения по поверхности отклика. Такой шаговый процесс продол жается до достижения области, близкой к экстремуму.
При постановке опытов величина шага должна быть пропорцио нальна произведению коэффициента на интервал варьирования: bj zj.
Например, при движении из точки L следующий эксперимент ставит ся в точке со значениями x1 и х2, отличающимися от начальных на ве личины 2b1z1 и 2b2z2 соответственно. В общем случае направление градиента будет зависеть от выбранного интервала варьирования не зависимых факторов. При изменении в n раз интервала варьирования некоторого j-фактора величина шага для него меняется в n2 раз, так как при этом в n раз изменяется и коэффициент регрессии bj. Инвари антными к изменению интервала остаются только знаки составляю щих градиента. При увеличении числа рассматриваемых факторов бо лее двух оптимизация методом крутого восхождения по поверхности отклика проводится аналогичным способом.
12.2. Описание функции отклика в области, близкой к экстре муму. Композиционные планы Бокса-Уилсона В области, близкой к экстремуму, (или почти стационарной об ласти) функция отклика существенно нелинейна, поэтому для ее аде кватного описания необходимо использовать нелинейные полиномы.
В настоящее время для этой цели наиболее широко применяют поли номы второго порядка, для получения которых имеются хорошо раз работанные планы эксперимента.
Для описания полиномом второго порядка эксперимента, реализо ванного для нахождения оптимальных условий процесса, число опы тов N в плане должно быть не меньше числа определяемых коэффи циентов в уравнении регрессии второго порядка для k факторов k k k y = b0 + bj x + buj xu x + bjj x2. (12.4) j j j j =1 u, j =1 j = u j Выборочные коэффициенты (12.4) являются оценками соответствую щих коэффициентов уравнения теоретической регрессии:
k k k my = 0 + x + uj xu x + x2. (12.5) j j j jj j j =1 u, j =1 j = u j В зависимости от числа рассматриваемых факторов число коэф фициентов l уравнения регрессии (12.4) определяется по формуле k! (k +1)(k + 2) l = (k +1) + k + Ck = 2k +1+ =, (12.6) 2!(k - 2)! где Ck Ч количество сочетаний из k факторов по два, равное числу эффектов парного взаимодействия.
В области, близкой к экстремуму, становятся значимыми эффекты парного взаимодействия и квадратичные эффекты. Поэтому то, что адекватное описание результатов эксперимента требует использова ния полиномов второго порядка, может служить признаком нахожде ния в почти стационарной области. Близость к этой области можно также установить, поставив дополнительно к ПФЭ 2k или ДФЭ 2k-1 се рию опытов в центре плана. Среднее значение результатов этих опы тов является оценкой для свободного члена уравнения (12.5):
yo 0. (12.7) Выборочный коэффицент b0, вычисляемый по формуле N b0 = (12.8) 0i x yi, N i = оценивает сумму свободного и квадратичных членов:
k b0 0 + (12.9) jj.
j = Поэтому, чем больше разность k (b0 - yo ) (12.10) jj, j = тем значимее квадратичные эффекты.
Для описания поверхности отклика полиномами второго порядка независимые факторы в планах должны принимать не менее трех раз ных значений. Эксперимент, в котором каждый из k факторов рас сматривается на трех уровнях и реализуются все возможные сочета ния уровней факторов, является ПФЭ типа 3k. В качестве примера в табл. 15 представлена матрица планирования ПФЭ 32.
Проведение ПФЭ 3k требует большого числа опытов, намного пре вышающего число определяемых коэффициентов l в уравнении (12.4) уже при k > 2:
k 2 3 3k 9 27 l 6 10 Таблица Матрица планирования ПФЭ № опыта х1 х2 y 1Ц1 Ц1 y 20 Ц1 y 3+1 Ц1 y 4Ц1 0 y 50 0 y 6+1 0 y 7Ц1 +1 y 80 +1 y 9+1 +1 y Сократить общее число опытов при условии получения несмешан ных оценок для линейных эффектов и эффектов взаимодействия мож но с помощью композиционных планов Бокса-Уилсона. Ядро таких планов при k < 5 составляет ПФЭ 2k, и полуреплика от него при k 5.
Если линейное уравнение регрессии оказалось неадекватным экс перименту, необходимо:
1) добавить 2k звездных точек, расположенных на координатных осях факторного пространства. Координаты звездных точек в общем случае равны (,0,...,0), (0, ,...,0),..., ( 0,...,0, ), где Ч расстояние от центра плана до звездной точки, или звездное плечо;
2) увеличить число экспериментов в центре плана n0.
Общее число опытов в матрице композиционного плана при k составляет N = 2k + 2k + n0. (12.11) Рассмотрим построение композиционных планов на примере k = (рис. 4). Точки 1, 2, 3, 4 образуют ПФЭ 22, точки 5, 6, 7, 8 являются звездными точками с координатами (,0) и (0, ), координаты n опытов в центре плана нулевые Ч (0, 0).
Композиционный план второго порядка для двух факторов пред ставлен в табл. 16, при этом в центре плана выполнена серия из трех опытов (№ 9Ц11).
Рис. 4. Композиционный план второго порядка для двух факторов Таблица Композиционный план второго порядка для двух факторов № опыта x0 x1 x2 x1x2 2 y x1 x 1 +1 +1 +1 +1 +1 +1 y 2+1 +1 Ц1 Ц1 +1 +1 y 3+1 Ц1 Ц1 +1 +1 +1 y 4 +1 Ц1 +1 Ц1 +1 +1 y 5+1 0 y + 00 6+1 - 00 0 y 7+1 0 y + 00 y 8+1 0 - 00 9 +1 00000 y 10 +1 00000 y 11 +1 00000 y 12.3. Ортогональные планы второго порядка, расчет коэффи центов уравнения регрессии Выбор звездного плеча в композиционных планах БоксаЦУилсона может быть произвольным, однако расчеты коэффициентов уравнения регрессии при k < 5 существенно упрощаются, если величина плеча определяется исходя из следующего уравнения:
4 + 2k2 - 2k -1(k + 0.5n0) = 0. (12.12) Значения 2, определенные по (12.12), приведены в табл. 17.
Таблица Значения 2 для k факторов и n0 опытов в центре плана kk n0 n 234 1 1.00 1.476 2.00 6 1.742 2.325 2. 2 1.160 1.650 2.164 7 1.873 2.481 3. 3 1.317 1.831 2.390 8 2.00 2.633 3. 4 1.475 2.00 2.580 9 2.113 2.782 3. 5 1.606 2.164 2.770 10 2.243 2.928 3. Выбрав, проведем следующее линейное преобразование квадра тичных столбцов:
N x'j = x2 - x2 = x2 - (12.13) j j j ji x.
N i = Композиционные планы, полученные таким образом, называются ор тогональными планами второго порядка.
Ортогональный план второго порядка при k = 2 и n0 = 1 представ лен в табл. 18. За его основу взят композиционный план для двух фак торов (табл. 16) с общим числом опытов N = 9. Величину звездного плеча определим по табл. 17: 2 = 1, = 1. Средние значения элемен тов квадратичных столбцов в табл. 16 равны 9 1 1 1 2 2 2 x1 = x1i = x2 = x2i = (4 + 22) =. (12.14) 9 9 9 i =1 i = В математической статистике доказывается, что для ортогональных планов второго порядка все коэффициенты уравнения регрессии оп ределяются независимо друг от друга по формуле N N bj = x yi x2, (12.15) ji ji i =1 i = а дисперсии коэффициентов равны N s2 (bj ) = sвоспр x2. (12.16) ji i = Таблица Ортогональный план второго порядка для двух факторов ' ' № опыта y x0 x1 x2 x1x2 x1 x 1 +1 +1 +1 +1 +1/3 +1/3 y 2 +1 +1 Ц1 Ц1 +1/3 +1/3 y 3 +1 Ц1 Ц1 +1 +1/3 +1/3 y 4 +1 Ц1 +1 Ц1 +1/3 +1/3 y 5+1 0 +1/3 Ц2/3 y + 6+1 - 0 0 +1/3 Ц2/3 y 7+1 + 0 Ц2/3 +1/3 y 8+1 0 - 0 Ц2/3 +1/3 y 9 +1 0 0 0 Ц2/3 Ц2/3 y Для определения дисперсии воспроизводимости необходимо вы полнить серию опытов в центре плана. В результате расчетов по мат рице с преобразованными столбцами для квадратичных эффектов (табл. 18) получаем следующее уравнение:
' 2 2 2 y = b0 + b1x1 + b2x2 + b12x1x2 + b11(x1 - x1 ) + b22(x2 - x2 ). (12.17) Чтобы перейти к обычной записи уравнения регрессии в виде 2 y = b0 + b1x1 + b2x2 + b12x1x2 + b11x1 + b22x2, (12.18) определим b0 по формуле ' 2 b0 = b0 - b11 x1 - b22 x2 (12.19) с дисперсией, равной 2 ' 2 s2 (b0 ) = s2 (b0 ) +(x1 ) s2 (b11) +(x2 ) s2 (b22 ). (12.20) Значимость коэффициентов проверяется по критерию Стъюдента.
Если bj t = > t ( f ), (12.21) j p s(bj ) где tp(f ) Ч табличное значение критерия Стъюдента для р = 0,05 и числа степеней свободы дисперсии воспроизводимости, то коэффици ент значимо отличается от нуля.
Коэффициенты уравнения регрессии, получаемые при помощи ор тогональных планов второго порядка, определяются с разной точно стью. В случае, когда k 4, согласно (12.16) имеем sвоспр ' s2(b0) = ;
N sвоспр s2(bj ) =, j =1, 2,..., k ;
2k + sвоспр s2(buj ) =, u, j =1, 2,..., k, u j ;
(12.22) 2k sвоспр s2(bjj ) =, j = 1, 2,..., k.
2k (1- x2)2 + 2(2 - x2)2 + (n0 + 2k - 2)(x2) j j j После исключения незначимых коэффициентов проводится про верка адекватности уравнения по критерию Фишера. Уравнение адек ватно эксперименту, если sад F = F1- p ( fад, fвоспр), (12.23) sвоспр где F1-p (fад, fвоспр) Ч критерий Фишера для р = 0,05;
fад = N - l Ч число степеней свободы дисперсии адекватности (l Ч число значимых ко эффициентов в уравнении регрессии);
fвоспр Ч число степеней свободы дисперсии воспроизводимости.
12.4. Метод последовательного симплекс-планирования В рассмотренных выше планах ПФЭ 22 и 23 экспериментальные точки располагались в вершинах квадрата и куба соответственно. В качестве экспериментального плана можно также использовать регу лярный симплекс. Симплексом в k-мерном пространстве называют вы пуклый многогранник, имеющий ровно (k + 1) вершину, каждая из ко торых определяется пересечением k гиперплоскостей данного про странства. Симплекс называется регулярным, если расстояния между всеми его вершинами равны. Примерами регулярных симплексов яв ляются правильный треугольник в двумерном пространстве и тетра эдр в трехмерном.
На практике планирование эксперимента с использованием регу лярных симплексов применяется для решения задач оптимизации при движении к почти стационарной области. Для получения регулярного симплекса проводится линейное преобразование уровней факторов z - zo j j x =, (12.24) j z j где zo Ч j-я координата центра плана;
z Ч интервал варьирования j j по j-фактору.
Оптимизация методом последовательного симплекс-планирования проводится следующим образом: исходная серия опытов планируется так, чтобы экспериментальные точки образовывали регулярный сим плекс в факторном пространстве. После проведения опытов определя ется вершина симплекса, соответствующая наихудшим результатам.
Далее строится новый симплекс, для чего наихудшая точка исходного симплекса заменяется новой, расположенной симметрично относи тельно центра грани симплекса, находящейся против наихудшей точ ки. Новая точка вместе с оставшимися точками образует новый сим плекс, центр тяжести которого смещен в сторону повышения качества процесса. После реализации опыта в дополнительной точке опять проводится выявление наихудшей вершины симплекса и т. д. При достижении области оптимума, симплекс начинает вращение вокруг вершины с максимальным значением отклика.
На рис. 5 показаны схемы достижения экстремума поверхности отклика методами крутого восхождения и симплекс-планирования на примере зависимости целевой функции y от двух факторов. При оп тимизации методом крутого восхождения (рис. 5 а) в окрестности точки М поставлен ПФЭ 22, движение по градиенту линейного при ближения осуществлялось в опытах 5Ц9. Далее был поставлен новый ПФЭ 22 (точки 10Ц13) с центром в точке 7, в которой было получено наилучшее значение y. Движение по новому градиенту (точки 14Ц15) приводит к экстремуму.
При оптимизации методом симплекс-планирования (рис. 5 б) в ис ходном симплексе (точки 1Ц3) худшей точкой оказалась точка 2. Ее зеркальным отражением относительно с1 Ч центра грани 1Ц3 Ч явля ется точка 4. В новом симплексе 1, 3, 4 худшей оказалась точка 1, в результате ее зеркального отражения получен симплекс 3, 4, 5 и т. д.
Область оптимума достигается при реализации симплекса 9, 10, 11.
Хотя оба рассмотренных метода требуют проведения примерно оди накового числа опытов, симплекс-планирование имеет ряд важных Рис. 5. Достижение экстремума поверхности отклика методами крутого восхождения (а) и симплекс-планирования (б) преимуществ: при использовании этого метода параметр оптимизации y может измеряться приближенно, достаточно иметь возможность проранжировать его величину;
можно одновременно учитывать не сколько параметров оптимизации;
метод не предъявляет жестких тре бований к локальной аппроксимации поверхности отклика уравнени ем регрессии.
На практике рекомендуется ориентировать исходный симплекс в факторном пространстве следующим образом: центр симплекса сов падает с началом координат, одна из вершин лежит на координатной оси, а остальные располагаются симметрично относительно коорди натных осей, плоскостей и гиперплоскостей (в многомерном случае).
Тогда координаты вершин симплекса при k = 5 задаются матрицей x1 x2 x3 x4 x - x1 x2 x3 x4 x - 2x2 x3 x4 x X =. (12.25) 0 0 - 3x3 x4 x 0 0 0 - 4x4 x 0 0 0 0 - 5x При k < 5 координаты вершин симплекса определяются частью мат рицы (12.25), при этом число столбцов равно числу факторов, а число строк равно k + 1;
при k > 5 для каждого добавленного фактора в мат рицу (12.25) добавляются соответствующие столбец и строка. В об щем случае число опытов в симплексной матрице для k независимых факторов N = (k + 1) равно числу коэффициентов линейного уравне ния регрессии, т. е. симплексные планы являются насыщенными.
Если длину стороны симплекса принять равной 1, то x =. (12.26) j 2 j( j +1) Для практического использования матрицы (12.25) ее числовые эле менты заранее подсчитаны по формуле (12.26) 0.5 0.289 0.204 0.158 0. - 0.5 0.289 0.204 0.158 0. 0 - 0.578 0.204 0.158 0. X =. (12.27) 0 0 - 0.612 0.158 0. 0 0 0 - 0.632 0. 0 0 0 0 - 0. План эксперимента в безразмерном масштабе для k факторов со стоит из k столбцов и k + 1 строки матрицы (12.27). Коэффициенты уравнения линейной регрессии k y = b0 + x (12.28) j j b j = вычисляются следующим образом:
N N b0 = yi, bj = 2 (12.29) ji x yi.
N i =1 i = Если в одной из вершин симплекса поставить серию параллельных опытов и рассчитать дисперсию воспроизводимости, то выборочные дисперсии коэффициентов определяются по формуле sвоспр s2 (bj ) = = 2sвоспр. (12.30) N ji x i = Следует отметить, что коэффициенты уравнения регрессии, полу ченные по симплексному плану, определяются с меньшей точностью по сравнению с коэффицентами, полученными при реализации ПФЭ 2k и ДФЭ 2k-1, для которых s2 (bj ) = sвоспр / N. (12.31) После реализации исходного симплекса требуется провести отра жение наихудшей точки относительно центра противоположной гра ни. Координаты отраженной точки равны:
x(jk +2) = 2x(jc) - x(jl), j = 1, 2,..., k, (12.32) где x(jl) Ч j-я координата наихудшей точки;
x(jk +2) Ч j-я координата новой точки, получаемой в результате отражения;
x(jc) Ч j-я коорди ната центра противоположной грани, определяемая по формуле k + x(jc) = x(ji), i l, (12.33) k i = где x(i) Ч j-я координата i-й вершины симплекса (i = 1, 2, Е, k+1).
j Координаты центра оптимального симплекса (точка S) в почти стационарной области находятся следующим образом:
k + x(jS ) = x(ji). (12.34) (k +1) i = Учебное издание Блохин Андрей Викторович ТЕОРИЯ ЭКСПЕРИМЕНТА КУРС ЛЕКЦИЙ В двух частях Часть В авторской редакции Художник обложки А. А. Федорченки Технический редактор Г. М. Романчук Корректор Р. П. Кадырко Ответственный за выпуск А. В. Блохин Подписано в печать 20.11.2002. Формат 60x84/16. Бумага офсетная.
Гарнитура Тайме. Печать офсетная Уел печ. л. 3,95. Уч.-изд. л. 3,62.
Тираж 100 экз. Зак. Белорусский государственный университет.
Лицензия ЛВ №315 от 14.07.98.
220050, Минск, проспект Франциска Скорины, 4.
Отпечатано с оригинала-макета заказчика.
Республиканское унитарное предприятие Издательский центр Белорусского государственного университета.
Лицензия ЛП№ 461 от 14.08.2001.
220030, Минск, ул. Красноармейская, 6.
Книги, научные публикации