Егоров Е. А. Организация модельного эксперимента
Вид материала | Документы |
СодержаниеZ = SUMMA Xi 4.1.3. Моделирование потоков случайных событий |
- Опыт Резерфорда. Планетарная модель атома. Постулаты Бора, 33.72kb.
- Отчет о результатах эксперимента это документ, который содержит систематизированные, 38.43kb.
- «Организация и математическое планирование эксперимента», 22.88kb.
- Къэбын / къэбун Qabyn, 295.49kb.
- Войтукевич Рекомендовано Советом физико-технического факультета Гргу им. Я. Купалы, 1018.88kb.
- Егоров Валерий Александрович Доктор медицинских наук, профессор Чельцов Виктор Владимирович, 976.08kb.
- Название эксперимента, 71.27kb.
- Название эксперимента, 42.5kb.
- Название эксперимента, 62.85kb.
- Название эксперимента. Изучение эффектов двухнуклонных корреляций в адрон, 32.97kb.
вательностей,
"-" - трудность получения высококачественных датчиков БСВ.
4.1.2.2. Моделирование непрерывных СВ с произвольным распределением.
На практике очень популярным для одномерных распределений явля-
ются так называемый метод обратной функции.
----------------------
Пусть f(x) - плотность распределения (желаемая) и существует
датчик БСВ Z [0, 1[.
Условие: возможность получения прямой и обратной функции f,f*(-1).
z x
F(z) = INTEGRAL fz(TAU)dTAU F(x) = INTEGRAL fx(f)df
-0-0 -0-0
Если допустить F(x) = F(z), то можно применить обратное
преобразование
Fx**(-1)(F(x)) = Fx**(-1)(F(z))
+
| 0, z < 0
x = Fx**(-1)(F(z)) F(z) = | z, z принадлежит [0, 1[
| 1, z > 1
+
| f(z) | F(z)
| |
+-----------+ | -------
| | | /
| | | /
| | | /
| | | /
+-----------+-----> ----+----------------------->
0 1 z 0 1 z
Пример. Пусть необходимо смоделировать СВ с экспоненциальным распре-
делением.
f(x) = LA * exp (- LA*x)
| \ f(x)
| \
| \
| \
| \
| \
| \
| \
| \
| \
+------------------------------>
x
x = Fx**(-1)(z), где z - БСВ
Пусть fх(х) = LA * е **(-LA * х), х >= 0
Найдем Fx(x) = 1 - е**(-LA * х)
Fx(x) = Fz(z) = z
1 - е**(-LA * х) = z
1 - z = е**(-LA * х)
ln(1 - z) = ln [е**(-LA * х)]
-LA * х * lne = ln(1 - z)
-LA * х = ln(1 - z)
+-----------------------------+
| 1 - ln(1 - z)|
|x = - --- * lnz = -----------|
| LA LA |
+-----------------------------+
т.к. СВ (1 - z) распределена по такому же ЗР как и СВ z. Рассмот-
ренный метод положен в основу формирования экспоненциально-распре-
деленной СВ в GPSS.
Второй метод - метод исключения.
----------------
Требует наличия какого - либо датчика БСВ. Предположим, что из-
вестен вид плотности распределения СВ, f(x) - плотность распределения
СВ х.
Ограничения.
f(x)
|
fmax _ _ _ _ _ _____
| / \
| / \
| |
| |
+-----+----------------->
a b
f(x) принимает ненулевые значения в диапазоне [a, b].
Можно получить СВ х по правилам:
1. Получить два отсчета БСВ Z1, Z2.
2. Расчет промежуточных значений
e1 = Z1*(b - a) + a e2 = Z2*fmax
| |
V V
масштабирование смещение
3. Если значения e2 <= f(e1), f - функция плотности, то значе-
ния е1 - новый элемент последовательности.
Метод исключения легко обобщается на случай многомерной СВ.
Пример. Пусть необходимо моделировать многомерную СВ с n - мерной
плотностью f(x1, x2, ..., xn) для системы n СВ, причем значения
всех переменных должны удовлетворять ограничениям ai <= xi <= bi.
В данном случае функция плотности - поверхность в n-мерном прост-
ранстве (строится по линиям равного уровня) и характеризуется мак-
симальным значением fmax.
Для получения нового элемента псевдослучайной последователь-
ности, которым является вектор из n компонент, используются следую-
щие шаги:
1. Генерируются n+1 отсчет БСВ: z1, z2, ..., zn, zn+1
2. Рассчитываются промежуточные значения
___
ei = zi*(bi - ai) + ai, i = 1,n;
где ai, bi - граничные значения для i координаты, и
en+1 = zn+1 * fmax
3. Если en+1 <= f(e1...en), то (e1...en) - новый отсчет слу-
чайного вектора, в противном случае этот вектор исключается из
рассмотрения.
Сравнительная оценка рассмотренных методов
Метод обратной функции.
"+" - сравнительно прост в реализации;
- пригоден для "хвостатых" распределений.
"-" - пригоден только для распределений, для которых существу-
ет обратная функция F**(-1);
- пригоден только для одномерных распределений.
Метод исключения.
"+" Метод исключения применим для моделирования как одномер-
ных, так и многомерных распределений;
"-" - пригоден только для распределений, удовлетворяющих
свойствам ограниченности по каждой из координат (непригоден для
"хвостатых" распределений.
- сравнительно низок коэффициент использования
исходной последовательности, формируемой датчиком БСВ, причем коэф-
фициент использования падает с ростом размерности случайной величи-
мы.
4.1.2.3. Моделирование нормально-распределенных СВ
Нормальный закон распределения (закон Гаусса):
(x - Mx) ** 2
- -------------
1 2 * SIGMAx**2
f(x) = ---------------- * e
SIGMAx*SQRT(2*PI)
Для моделирования непрерывных СВ с нормальным законом распре-
деления(НЗР) неприменимы рассмотренные выше метод обратной функции
(не существует прямая и соответственно обратная функция распределе-
ния) и метод исключения ("хвостатое" распределение).
Широко распространенным методом моделирования СВ с НЗР являет-
ся метод суммирования, основанный на одной из центральных предель-
ных теорем теории вероятностей.
Теорема Ляпунова: при широких предположениях относительно за-
конов распределения независимых случайных величин xi, i in Nn с
ростом n закон распределения суммы
n
Z = SUMMA Xi
i=1
неограниченно приближается к нормальному.
Пусть Xi - отсчеты равномерно-распределенной БСВ:
МО MXi = 0.5; Dzi = 1 / 12.
Для суммы Z: MZ = n * MXi = n * 0.5;
DZ = n * DXi = n / 12.
при n = 12 MZ = 6, DZ = 1.
Распределение СВ Z будет являться некоторым приближением к
нормально распределенной СВ. Для получения нормированного нормаль-
ного распределения СВ с MZ = 0 и SIGMAZ = SQRT(DZ) = 1 надо выпол-
нить преобразования
12
Z = SUMMA Xi - 6 (устранение смещения).
i = 1
Рассмотренные методы обратной функции, исключения, суммирова-
ния показывает возможность моделирования непрерывной псевдослучай-
ной величины с заданным ЗР на основании БСВ с равномерным ЗР.
4.1.2.4. Моделирование дискретных СВ с произвольным распределением.
Пусть задано произвольное распределение дискретной СВ (ДСВ):
xi - множество значений ДСВ X, P(x1) P(x3) P(xn)
P(xi) - вероятность xi, | | |
сумма P(xi) = 1 --+--+--+--+-------------+-
P(x2)
Множество вероятностей P(xi), i in Nn отображается на интервал
[0, 1[ согласно следующему рисунку.
P(x1) P(x2) P(xi) P(Xn)
+-----+-------+----------+---*---+-------+----------+------> Z
0 z 1
При обращении к датчику БСВ будет разыграно значение z, попа-
дающее на некоторый подинтервал интервала [0,1[. Надо определить
подинтервал, содержащий значение z, и принять в качестве отсчета
ДСВ значение хi, связанное с этим подинтервалом. Чем больше P(Xi),
тем чаще отсчет БСВ будет попадать на соответствующий подинтервал.
Время, необходимое для определения подинтервала, содержащего
z, уменьшается, если предварительно расположить возможные значения
СВ X x1,x2,.....,xn в порядке убывания их вероятностей, то есть
так, чтобы p(x1) >= p(x2) >= ......>= p(xi) >= ......>= p(xn).
4.1.3. МОДЕЛИРОВАНИЕ ПОТОКОВ СЛУЧАЙНЫХ СОБЫТИЙ
Рассмотрим вначале моделирование полной группы несовместных
событий:
----
{Ai} - множество событий Ai, i = 1, n;
----
P(Ai) - вероятность события Ai, i = 1, n;
n
SUMMA P(Ai)= 1 - полная группа событий.
i = 1
P(Ai, Aj) = 0 - несовместные события, i =/= j.
Моделирование полной группы сводится к рассмотренному
случаю моделирования дискретных СВ. В качестве значений
дискретных СВ можно рассматривать номера событий.
P(A1) P(A2). . . P(Ai) . . . P(An)
+-----+-------+---+-----+---+-+-+---+-+
0 1
| Z - отсчет датчика СВ
Последовательность шагов:
1. Разыграть значения БСВ, используя датчик.
2. Определить подинтервал, содержащий значение z.
3. Номер подинтервала принять в качестве номера наступающего
в опыте события Ai.
Очень важной является задача моделирования потока однородных
событий. В общем случае поток можно охарактеризовать многомерной
совместной плотностью распределения вероятностей. На оси каждой
вершины (+) соответствует однородное событие. Отметим интервалы Ti
между соседними событиями в потоке.
Т1 Т2 Т3 Ti
____ ___ _____ _ ___ ___
/ \ / \ / \ / \ / \ / \
--+-----+-----+-------+---+-----+-----+-- t
Полная характеристика: многомерная плотность распределения.
f(TAU1, TAU2, ..., TAUi, ..., TAUn)
Если многомерная плотность распределения задана каким-либо об-
разом, моделирование потока сводится к моделированию случайного
вектора или многомерной СВ. Каждая реализация случайного вектора
будет отображать отрезок на оси t, соответствующий n случайным ин-
тервалам времени между соседними событиями в потоке. Для моделиро-
вания многомерной СВ можно использовать метод исключения. Но данный
метод практически применим только для очень коротких отрезков оси
t, так как резко возрастает трудоемкость моделирования МСВ и ухуд-
шаются стохастические свойства псевдослучайной последовательности
многомерной СВ.
Ситуация несколько упрощается, если моделируются потоки с ог-
раниченным последействием (в общем случае они нестационарны по t).
n
f(TAU1, TAU2, ..., TAUi, ..., TAUn) = П fi(TAUi)
i=1
- свойство потока с ограниченным последействием.
Задача в этом случае сводится к моделированию n одномерных СВ,
что позволяет использовать метод обратной функции. Обязательное ус-
ловие - возможность получения обратной функции для распределения
длины каждого из n интервалов в случайном потоке событий.
Для моделирования отрезка с n интервалами надо n раз обратить-
ся к датчику СВ и выполнить n обратных преобразований, использую-
щих, в общем случае, различные обратные операторы.
Для стационарных потоков с ограниченным последействием.
n
f(TAU1, TAU2, ..., TAUi, ..., TAUn) = П f(TAUi)
i=1
Для моделирования отрезка с n интервалами надо n раз обратить-
ся к датчику БСВ и выполнить n однотипных обратных преобразований.
Пример. Стационарный пуассоновский (простейший) поток событий ха-
рактеризуется плотностью вероятности длины интервала TAU в потоке:
f(TAU) = LA * e**(-LA*TAU), TAU >= 0.
TAU = - (1/LA) * LN(1-Z), где Z - отсчет БСВ in [0,1[.
Распространенной моделью потока событий, позволяющей менять
свойства в широком диапазоне, является поток Эрланга (ПЭ). Базовый
(производящий) поток -простейший. Моделирование ПЭ k-го порядка
сводится к выбору из простейшего потока k-го события, что эквива-
лентно образованию длины интервала в ПЭ в виде суммы k смежных ин-
тервалов. При k принадлежащем (1, бесконечность) свойства потока
меняются от потока без последствия до регулярного потока, его ин-
тервалы стремятся к детерминированным (случайным) величинам.
4.2 Планирование машинных экспериментов.
4.2.1. Цели планирования машинных экспериментов.
Машинный эксперимент (МЭ) предполагает наблюдение за поведени-
ем имитационной модели, причем каждому прогону модели соответствует
определенная комбинация значений параметров модели и длительность
интервала времени, обеспечивающая набор необходимой статистики, при
условии обеспечения заданной точности модели.
Целью планирования экспериментов является минимум затрат на
проведение всего комплекса экспериментов при ограничении на объем и
статистическое качество собираемой информации.
максимум информации
Цель: -------------------
минимум ресурсов
Теория планирования экспериментов (биология, физика)
Особенности МЭ.
"+"
1. простота повторения условий эксперимента;
2. возможность управления экспериментом;
3. легкость варьирования условий МЭ.
"-"
1. наличие корреляционных связей между результатами измерений
для различных условий, что снижает количество информации, приходя-
щейся на один эксперимент;
2. трудности определения длины интервалов моделирования.
Общей задачей ИМ является исследование объекта-оригинала как
"черного ящика".
+ +---------+ +
факторы вх.|х1 ---> |blaсk box| ---> y1| реакция,
воздействия|х2 ---> | | ---> y2| отклик
| . . . | (ЧЯ) | . . . |
|xn ---> +---------+ ---> yn|
+ +
----
yj = yj(x1, ..., xi, ..., xn) j = 1, n
Так как исследуемые объекты имеют стохастическую природу, то
реакцией является случайный вектор Y, отражающий влияние как учтен-
ных, так и неучтенных факторов.
Исследователь ставит задачу определения неизвестных функций yj
по результатам экспериментов.
--------------
| / y(x10,y10) /
| //////+///////- y(x1,x2)-поверхность
| ///////|////// отклика
| ////////|/////
|--------------
| |
| x1min| x10 x1max
+--------+|----+------+----> X1
/ / | / /
/ / | / /
x2min +------------|---------
/ / |/ /
x20 +--------/-----+ /
/ / /
/ / /
x2max +----------------------
/
Х2 /
(x1min, x1max),(x2min, x2max) - интервалы изменения управляемых уч-
тенных факторов;
(x10,x20) - точка факторного пространства, в окрестности которой
исследуется поведение функции отклика y.
Единичный эксперимент выполняется для некоторого набора факто-
ров(в одной точке факторного пространства), требует накопления зна-
чений отклика в течение определенного времени (накопление выборки
определенного объема с последующей статистической обработкой). Ре-
зультат усреднения выборки будет являться СВ с некоторым ЗР и будет
отклоняться от истинного значения функции отклика в данной точке
факторного пространства. Для построения некоторого приближения по-
верхности отклика надо решить вопрос о числе экспериментов и о на-
борах значений факторов в каждом из этих экспериментов.
4.2.2. Тактическое планирование машинных экспериментов.
Определяет условия проведения единичного эксперимента и чаще
всего сводится к определению объема выборки, обеспечивающего задан-
ную статистическую погрешность оценок числовых характеристик расп-
ределения функции отклика.
Оценки типа вероятностей событий.
N - число наблюдений (объём выборки);
А - наблюдаемое событие;
Р(А) = P - искомая характеристика.
m
Р~(А) = --- - выборочная оценка вероятности события,
N
m - число наступлений события А,
m / N - частота событий, являющаяся несмещенной оценкой веро-
ятности P(A) и распределенной по нормальному закону:
M[P~(A)] = P(A)= P; P(1-P)
D[P~(A)] = SIGMA**2[P~(A)]= -------- .
N
f (P*)
| _______
| ////|\\\\
| /////|\\\\\
| //////|\\+----- gamma - доверительная вероятность
| ///////|\\\\\\\
| ////////|\\\\\\\\
| /////////|\\\\\\\\\
|__//////////|\\\\\\\\\\___
+------------+----------------->
0 P P*
f(P~) - функция плотности распределения вероятностей
P[|1P*(A)-P(A)|<=Zgamma * SIGMA(P~(A))] = gamma
1 Zgamma gamma
Zgamma: ------ INTEGRAL е**(t**2/2)dt = -------
___ 0 2
\/2П
EPS = Zgamma*SIGMA(Р~(А))
Р(1-Р)
EPS**2 = Zgamma**2*SIGMA**2(Р*(А)) = Zgamma**2 --------
N
P(1-P)
N >= Zgamma**2 * ---------- .
EPS**2
Таким образом, можно определить объем выборки, обеспечивающий
достижение заданной абсолютной погрешности EPS оценки вероят-
ности.
Зададимся относительной погрешностью:
EPS
delta = -------- ; EPS**2 = delta**2*Р**2
Р
(1 - P)
N >= Zgamma**2* ------------- .
P * delta**2
Из данного неравенства видно, что объем выборки растет по ги-
перболическому закону при малых значениях Р, т. е. при оценивании
вероятностей редких событий.
Оценки типа математического ожидания
в ходе эксперимента накоплены х1, x2, ..., xn,
1 n
mx* = --- SUMMA xi
N i = 1
+ +
| Sx Sx |
P|mx* - tgamma------ <= mx <= mx* + tgamma------ | = gamma
| __ __ |
+ \/N \/N +
Sx - выборочный стандарт (статистическая оценка СКО)
tgamma - значение СВ, ЗР Стьюдента со степенью свободы
n - 1, соответствующее значению j - доверительной вероятности
N - объем выборки
mx - истинное значение
mx* - наблюдаемое значение
В нашем случае должна решаться обратная задача: определение
такого объема выборки, при котором обеспечивается заданная
программа статистической оценки эпсилон.
Sx Sx**2
EPS = tgamma ------ N = tgamma -------
__ EPS**2
\/N
EPS - погрешность оценки.
Использовать данную оценку N затруднительно, т. к. для
отыскания tgamma надо знать степень свободы, связанную с N.
Поэтому для начального приближения можно предположить, что
выборочный стандарт Sx совпадает с истинным стандартом
нормальной генеральной совокупности.
+ +
| Sx Sx |
P|mx* - Zgamma------ <= mx <= mx* + Zgamma------ | = gamma
| __ __ |
+ \/N \/N +
Zgamma - определяется по НЗР
Zgamma 1
INTEGRAL ------ е**(-t**2/2)dt = gamma/2
0 ___
\/2П
SIGMAx**2
N >= Zgamma**2 -----------
EPS**2
|
|__ gamma/2
|\\\
|\\\\
|\\\\\___
+------------------
Как для оценок типа вероятностей, так и для оценок МО,
предполагается знание истинных значений оцениваемых
количественных характеристик. В первом случае: знание Р, во
втором: Dx (SIGMAх). Поэтому объем выборки определяется
итеративно.
Задаются некоторые начальные значения N', определяются
оценки статистических характеристик, и приравнивая их истинным
значениям определяют новые значения N".
Выполнив эксперимент для N" уточняют значения оценок
(находят новое значение N'''), до тех пор, пока значения в цепи
N' -> N" -> N''' -> ... будут отличаться незначительно.
4.2.2. Стратегическое планирование эксперимента.
Существенно понимание цели, поставленной экспериментатором
при работе с ИМ. Если задача сводится к анализу, т. е. к
определению вектора характеристик для некоторого набора
параметров, то фактически можно ограничиться тактическим
планированием, рассматривая эту задачу как эксперимент в одной
точке ФП. Если решается задача синтеза, т. е. определения