Егоров Е. А. Организация модельного эксперимента

Вид материалаДокументы

Содержание


Z = SUMMA Xi
4.1.3. Моделирование потоков случайных событий
Подобный материал:
1   2   3

вательностей,

"-" - трудность получения высококачественных датчиков БСВ.


4.1.2.2. Моделирование непрерывных СВ с произвольным распределением.


На практике очень популярным для одномерных распределений явля-

ются так называемый метод обратной функции.

----------------------

Пусть f(x) - плотность распределения (желаемая) и существует

датчик БСВ Z [0, 1[.

Условие: возможность получения прямой и обратной функции f,f*(-1).


z x

F(z) = INTEGRAL fz(TAU)dTAU F(x) = INTEGRAL fx(f)df

-0-0 -0-0


Если допустить F(x) = F(z), то можно применить обратное

преобразование

Fx**(-1)(F(x)) = Fx**(-1)(F(z))


+

| 0, z < 0

x = Fx**(-1)(F(z)) F(z) = | z, z принадлежит [0, 1[

| 1, z > 1

+




| f(z) | F(z)

| |

+-----------+ | -------

| | | /

| | | /

| | | /

| | | /

+-----------+-----> ----+----------------------->

0 1 z 0 1 z


Пример. Пусть необходимо смоделировать СВ с экспоненциальным распре-

делением.

f(x) = LA * exp (- LA*x)



| \ f(x)

| \

| \

| \

| \

| \

| \

| \

| \

| \

+------------------------------>

x


x = Fx**(-1)(z), где z - БСВ


Пусть fх(х) = LA * е **(-LA * х), х >= 0

Найдем Fx(x) = 1 - е**(-LA * х)

Fx(x) = Fz(z) = z

1 - е**(-LA * х) = z

1 - z = е**(-LA * х)

ln(1 - z) = ln [е**(-LA * х)]

-LA * х * lne = ln(1 - z)

-LA * х = ln(1 - z)

+-----------------------------+

| 1 - ln(1 - z)|

|x = - --- * lnz = -----------|

| LA LA |

+-----------------------------+

т.к. СВ (1 - z) распределена по такому же ЗР как и СВ z. Рассмот-

ренный метод положен в основу формирования экспоненциально-распре-

деленной СВ в GPSS.


Второй метод - метод исключения.

----------------

Требует наличия какого - либо датчика БСВ. Предположим, что из-

вестен вид плотности распределения СВ, f(x) - плотность распределения

СВ х.


Ограничения.


f(x)

|

fmax _ _ _ _ _ _____

| / \

| / \

| |

| |

+-----+----------------->

a b


f(x) принимает ненулевые значения в диапазоне [a, b].


Можно получить СВ х по правилам:


1. Получить два отсчета БСВ Z1, Z2.

2. Расчет промежуточных значений


e1 = Z1*(b - a) + a e2 = Z2*fmax

| |

V V

масштабирование смещение


3. Если значения e2 <= f(e1), f - функция плотности, то значе-

ния е1 - новый элемент последовательности.


Метод исключения легко обобщается на случай многомерной СВ.


Пример. Пусть необходимо моделировать многомерную СВ с n - мерной

плотностью f(x1, x2, ..., xn) для системы n СВ, причем значения

всех переменных должны удовлетворять ограничениям ai <= xi <= bi.

В данном случае функция плотности - поверхность в n-мерном прост-

ранстве (строится по линиям равного уровня) и характеризуется мак-

симальным значением fmax.

Для получения нового элемента псевдослучайной последователь-

ности, которым является вектор из n компонент, используются следую-

щие шаги:


1. Генерируются n+1 отсчет БСВ: z1, z2, ..., zn, zn+1

2. Рассчитываются промежуточные значения

___

ei = zi*(bi - ai) + ai, i = 1,n;

где ai, bi - граничные значения для i координаты, и

en+1 = zn+1 * fmax

3. Если en+1 <= f(e1...en), то (e1...en) - новый отсчет слу-

чайного вектора, в противном случае этот вектор исключается из

рассмотрения.


Сравнительная оценка рассмотренных методов

Метод обратной функции.

"+" - сравнительно прост в реализации;

- пригоден для "хвостатых" распределений.

"-" - пригоден только для распределений, для которых существу-

ет обратная функция F**(-1);

- пригоден только для одномерных распределений.

Метод исключения.

"+" Метод исключения применим для моделирования как одномер-

ных, так и многомерных распределений;

"-" - пригоден только для распределений, удовлетворяющих

свойствам ограниченности по каждой из координат (непригоден для

"хвостатых" распределений.

- сравнительно низок коэффициент использования

исходной последовательности, формируемой датчиком БСВ, причем коэф-

фициент использования падает с ростом размерности случайной величи-

мы.


4.1.2.3. Моделирование нормально-распределенных СВ


Нормальный закон распределения (закон Гаусса):


(x - Mx) ** 2

- -------------

1 2 * SIGMAx**2

f(x) = ---------------- * e

SIGMAx*SQRT(2*PI)


Для моделирования непрерывных СВ с нормальным законом распре-

деления(НЗР) неприменимы рассмотренные выше метод обратной функции

(не существует прямая и соответственно обратная функция распределе-

ния) и метод исключения ("хвостатое" распределение).

Широко распространенным методом моделирования СВ с НЗР являет-

ся метод суммирования, основанный на одной из центральных предель-

ных теорем теории вероятностей.

Теорема Ляпунова: при широких предположениях относительно за-

конов распределения независимых случайных величин xi, i in Nn с

ростом n закон распределения суммы

n

Z = SUMMA Xi

i=1

неограниченно приближается к нормальному.

Пусть Xi - отсчеты равномерно-распределенной БСВ:

МО MXi = 0.5; Dzi = 1 / 12.

Для суммы Z: MZ = n * MXi = n * 0.5;

DZ = n * DXi = n / 12.

при n = 12 MZ = 6, DZ = 1.


Распределение СВ Z будет являться некоторым приближением к

нормально распределенной СВ. Для получения нормированного нормаль-

ного распределения СВ с MZ = 0 и SIGMAZ = SQRT(DZ) = 1 надо выпол-

нить преобразования


12

Z = SUMMA Xi - 6 (устранение смещения).

i = 1


Рассмотренные методы обратной функции, исключения, суммирова-

ния показывает возможность моделирования непрерывной псевдослучай-

ной величины с заданным ЗР на основании БСВ с равномерным ЗР.


4.1.2.4. Моделирование дискретных СВ с произвольным распределением.


Пусть задано произвольное распределение дискретной СВ (ДСВ):

xi - множество значений ДСВ X, P(x1) P(x3) P(xn)

P(xi) - вероятность xi, | | |

сумма P(xi) = 1 --+--+--+--+-------------+-

P(x2)


Множество вероятностей P(xi), i in Nn отображается на интервал

[0, 1[ согласно следующему рисунку.


P(x1) P(x2) P(xi) P(Xn)

+-----+-------+----------+---*---+-------+----------+------> Z

0 z 1


При обращении к датчику БСВ будет разыграно значение z, попа-

дающее на некоторый подинтервал интервала [0,1[. Надо определить

подинтервал, содержащий значение z, и принять в качестве отсчета

ДСВ значение хi, связанное с этим подинтервалом. Чем больше P(Xi),

тем чаще отсчет БСВ будет попадать на соответствующий подинтервал.

Время, необходимое для определения подинтервала, содержащего

z, уменьшается, если предварительно расположить возможные значения

СВ X x1,x2,.....,xn в порядке убывания их вероятностей, то есть

так, чтобы p(x1) >= p(x2) >= ......>= p(xi) >= ......>= p(xn).


4.1.3. МОДЕЛИРОВАНИЕ ПОТОКОВ СЛУЧАЙНЫХ СОБЫТИЙ


Рассмотрим вначале моделирование полной группы несовместных

событий:

----

{Ai} - множество событий Ai, i = 1, n;

----

P(Ai) - вероятность события Ai, i = 1, n;

n

SUMMA P(Ai)= 1 - полная группа событий.

i = 1

P(Ai, Aj) = 0 - несовместные события, i =/= j.


Моделирование полной группы сводится к рассмотренному

случаю моделирования дискретных СВ. В качестве значений

дискретных СВ можно рассматривать номера событий.


P(A1) P(A2). . . P(Ai) . . . P(An)

+-----+-------+---+-----+---+-+-+---+-+

0 1

| Z - отсчет датчика СВ


Последовательность шагов:

1. Разыграть значения БСВ, используя датчик.

2. Определить подинтервал, содержащий значение z.

3. Номер подинтервала принять в качестве номера наступающего

в опыте события Ai.


Очень важной является задача моделирования потока однородных

событий. В общем случае поток можно охарактеризовать многомерной

совместной плотностью распределения вероятностей. На оси каждой

вершины (+) соответствует однородное событие. Отметим интервалы Ti

между соседними событиями в потоке.


Т1 Т2 Т3 Ti

____ ___ _____ _ ___ ___

/ \ / \ / \ / \ / \ / \

--+-----+-----+-------+---+-----+-----+-- t


Полная характеристика: многомерная плотность распределения.

f(TAU1, TAU2, ..., TAUi, ..., TAUn)

Если многомерная плотность распределения задана каким-либо об-

разом, моделирование потока сводится к моделированию случайного

вектора или многомерной СВ. Каждая реализация случайного вектора

будет отображать отрезок на оси t, соответствующий n случайным ин-

тервалам времени между соседними событиями в потоке. Для моделиро-

вания многомерной СВ можно использовать метод исключения. Но данный

метод практически применим только для очень коротких отрезков оси

t, так как резко возрастает трудоемкость моделирования МСВ и ухуд-

шаются стохастические свойства псевдослучайной последовательности

многомерной СВ.

Ситуация несколько упрощается, если моделируются потоки с ог-

раниченным последействием (в общем случае они нестационарны по t).

n

f(TAU1, TAU2, ..., TAUi, ..., TAUn) = П fi(TAUi)

i=1

- свойство потока с ограниченным последействием.

Задача в этом случае сводится к моделированию n одномерных СВ,

что позволяет использовать метод обратной функции. Обязательное ус-

ловие - возможность получения обратной функции для распределения

длины каждого из n интервалов в случайном потоке событий.

Для моделирования отрезка с n интервалами надо n раз обратить-

ся к датчику СВ и выполнить n обратных преобразований, использую-

щих, в общем случае, различные обратные операторы.

Для стационарных потоков с ограниченным последействием.

n

f(TAU1, TAU2, ..., TAUi, ..., TAUn) = П f(TAUi)

i=1

Для моделирования отрезка с n интервалами надо n раз обратить-

ся к датчику БСВ и выполнить n однотипных обратных преобразований.

Пример. Стационарный пуассоновский (простейший) поток событий ха-

рактеризуется плотностью вероятности длины интервала TAU в потоке:


f(TAU) = LA * e**(-LA*TAU), TAU >= 0.

TAU = - (1/LA) * LN(1-Z), где Z - отсчет БСВ in [0,1[.


Распространенной моделью потока событий, позволяющей менять

свойства в широком диапазоне, является поток Эрланга (ПЭ). Базовый

(производящий) поток -простейший. Моделирование ПЭ k-го порядка

сводится к выбору из простейшего потока k-го события, что эквива-

лентно образованию длины интервала в ПЭ в виде суммы k смежных ин-

тервалов. При k принадлежащем (1, бесконечность) свойства потока

меняются от потока без последствия до регулярного потока, его ин-

тервалы стремятся к детерминированным (случайным) величинам.


4.2 Планирование машинных экспериментов.


4.2.1. Цели планирования машинных экспериментов.


Машинный эксперимент (МЭ) предполагает наблюдение за поведени-

ем имитационной модели, причем каждому прогону модели соответствует

определенная комбинация значений параметров модели и длительность

интервала времени, обеспечивающая набор необходимой статистики, при

условии обеспечения заданной точности модели.

Целью планирования экспериментов является минимум затрат на

проведение всего комплекса экспериментов при ограничении на объем и

статистическое качество собираемой информации.

максимум информации

Цель: -------------------

минимум ресурсов

Теория планирования экспериментов (биология, физика)

Особенности МЭ.

"+"

1. простота повторения условий эксперимента;

2. возможность управления экспериментом;

3. легкость варьирования условий МЭ.


"-"

1. наличие корреляционных связей между результатами измерений

для различных условий, что снижает количество информации, приходя-

щейся на один эксперимент;

2. трудности определения длины интервалов моделирования.


Общей задачей ИМ является исследование объекта-оригинала как

"черного ящика".

+ +---------+ +

факторы вх.|х1 ---> |blaсk box| ---> y1| реакция,

воздействия|х2 ---> | | ---> y2| отклик

| . . . | (ЧЯ) | . . . |

|xn ---> +---------+ ---> yn|

+ +

----

yj = yj(x1, ..., xi, ..., xn) j = 1, n


Так как исследуемые объекты имеют стохастическую природу, то

реакцией является случайный вектор Y, отражающий влияние как учтен-

ных, так и неучтенных факторов.

Исследователь ставит задачу определения неизвестных функций yj

по результатам экспериментов.


--------------

| / y(x10,y10) /

| //////+///////- y(x1,x2)-поверхность

| ///////|////// отклика

| ////////|/////

|--------------

| |

| x1min| x10 x1max

+--------+|----+------+----> X1

/ / | / /

/ / | / /

x2min +------------|---------

/ / |/ /

x20 +--------/-----+ /

/ / /

/ / /

x2max +----------------------

/

Х2 /

(x1min, x1max),(x2min, x2max) - интервалы изменения управляемых уч-

тенных факторов;

(x10,x20) - точка факторного пространства, в окрестности которой

исследуется поведение функции отклика y.

Единичный эксперимент выполняется для некоторого набора факто-

ров(в одной точке факторного пространства), требует накопления зна-

чений отклика в течение определенного времени (накопление выборки

определенного объема с последующей статистической обработкой). Ре-

зультат усреднения выборки будет являться СВ с некоторым ЗР и будет

отклоняться от истинного значения функции отклика в данной точке

факторного пространства. Для построения некоторого приближения по-

верхности отклика надо решить вопрос о числе экспериментов и о на-

борах значений факторов в каждом из этих экспериментов.


4.2.2. Тактическое планирование машинных экспериментов.


Определяет условия проведения единичного эксперимента и чаще

всего сводится к определению объема выборки, обеспечивающего задан-

ную статистическую погрешность оценок числовых характеристик расп-

ределения функции отклика.


Оценки типа вероятностей событий.


N - число наблюдений (объём выборки);

А - наблюдаемое событие;

Р(А) = P - искомая характеристика.

m

Р~(А) = --- - выборочная оценка вероятности события,

N

m - число наступлений события А,

m / N - частота событий, являющаяся несмещенной оценкой веро-

ятности P(A) и распределенной по нормальному закону:


M[P~(A)] = P(A)= P; P(1-P)

D[P~(A)] = SIGMA**2[P~(A)]= -------- .

N

f (P*)

| _______

| ////|\\\\

| /////|\\\\\

| //////|\\+----- gamma - доверительная вероятность

| ///////|\\\\\\\

| ////////|\\\\\\\\

| /////////|\\\\\\\\\

|__//////////|\\\\\\\\\\___

+------------+----------------->

0 P P*


f(P~) - функция плотности распределения вероятностей


P[|1P*(A)-P(A)|<=Zgamma * SIGMA(P~(A))] = gamma


1 Zgamma gamma

Zgamma: ------ INTEGRAL е**(t**2/2)dt = -------

___ 0 2

\/2П


EPS = Zgamma*SIGMA(Р~(А))

Р(1-Р)

EPS**2 = Zgamma**2*SIGMA**2(Р*(А)) = Zgamma**2 --------

N

P(1-P)

N >= Zgamma**2 * ---------- .

EPS**2


Таким образом, можно определить объем выборки, обеспечивающий

достижение заданной абсолютной погрешности EPS оценки вероят-

ности.

Зададимся относительной погрешностью:

EPS

delta = -------- ; EPS**2 = delta**2*Р**2

Р

(1 - P)

N >= Zgamma**2* ------------- .

P * delta**2


Из данного неравенства видно, что объем выборки растет по ги-

перболическому закону при малых значениях Р, т. е. при оценивании

вероятностей редких событий.


Оценки типа математического ожидания


в ходе эксперимента накоплены х1, x2, ..., xn,

1 n

mx* = --- SUMMA xi

N i = 1

+ +

| Sx Sx |

P|mx* - tgamma------ <= mx <= mx* + tgamma------ | = gamma

| __ __ |

+ \/N \/N +


Sx - выборочный стандарт (статистическая оценка СКО)

tgamma - значение СВ, ЗР Стьюдента со степенью свободы

n - 1, соответствующее значению j - доверительной вероятности

N - объем выборки

mx - истинное значение

mx* - наблюдаемое значение


В нашем случае должна решаться обратная задача: определение

такого объема выборки, при котором обеспечивается заданная

программа статистической оценки эпсилон.

Sx Sx**2

EPS = tgamma ------ N = tgamma -------

__ EPS**2

\/N

EPS - погрешность оценки.


Использовать данную оценку N затруднительно, т. к. для

отыскания tgamma надо знать степень свободы, связанную с N.

Поэтому для начального приближения можно предположить, что

выборочный стандарт Sx совпадает с истинным стандартом

нормальной генеральной совокупности.


+ +

| Sx Sx |

P|mx* - Zgamma------ <= mx <= mx* + Zgamma------ | = gamma

| __ __ |

+ \/N \/N +


Zgamma - определяется по НЗР


Zgamma 1

INTEGRAL ------ е**(-t**2/2)dt = gamma/2

0 ___

\/2П


SIGMAx**2

N >= Zgamma**2 -----------

EPS**2


|

|__ gamma/2

|\\\

|\\\\

|\\\\\___

+------------------


Как для оценок типа вероятностей, так и для оценок МО,

предполагается знание истинных значений оцениваемых

количественных характеристик. В первом случае: знание Р, во

втором: Dx (SIGMAх). Поэтому объем выборки определяется

итеративно.

Задаются некоторые начальные значения N', определяются

оценки статистических характеристик, и приравнивая их истинным

значениям определяют новые значения N".

Выполнив эксперимент для N" уточняют значения оценок

(находят новое значение N'''), до тех пор, пока значения в цепи

N' -> N" -> N''' -> ... будут отличаться незначительно.


4.2.2. Стратегическое планирование эксперимента.


Существенно понимание цели, поставленной экспериментатором

при работе с ИМ. Если задача сводится к анализу, т. е. к

определению вектора характеристик для некоторого набора

параметров, то фактически можно ограничиться тактическим

планированием, рассматривая эту задачу как эксперимент в одной

точке ФП. Если решается задача синтеза, т. е. определения