А. С. Гринберг О. Б. Плющ Б. В. Новыш Теория вероятностей и математическая статистика Курс лекций

Вид материалаКурс лекций

Содержание


Дисперсия случайной величины и ее свойства
Среднеквадратическое отклонение
Средним квадратичным отклонением
Начальные и центральные моменты
Начальным моментом порядка
Центральным моментом порядка
Основные примеры распределений дискретной случайной величины
Биномиальное распределение, его математическое ожидание, дисперсия
Распределение Пуассона
Геометрическое распределение
Непрерывные случайные величины
Плотностью распределения вероятностей
Числовые характеристики непрерывных случайных величин
Математическим ожиданием
Среднее квадратичное отклонение
Основные примеры распределений непрерывной случайной величины
Показательное распределение
Нормальное распределение
Свойства функции Гаусса
Центральная предельная теорема
...
Полное содержание
Подобный материал:
1   ...   13   14   15   16   17   18   19   20   ...   26

Дисперсия случайной величины и ее свойства


На практике часто требуется оценить рассеяние случайной величины вокруг ее среднего значения. Использовать в качестве такой характеристики отклонение случайной величины от ее математического ожидания не представляется возможным.

Теорема. Для любой случайной величины математическое ожидание ее отклонения равно нулю, т.е.

.

Доказательство. Действительно, учитывая, что – постоянная величина, имеем:



Такой характеристикой степени рассеяния случайной величины является дисперсия.

Дисперсией (рассеянием) случайной величины называют математическое ожидание квадрата отклонения этой величины от ее математического ожидания:

.

Очевидно, что дисперсия случайной величины постоянна, т.е. является числовой характеристикой этой величины.

Если случайная величина имеет закон распределения , то .

Так же как и для математического ожидания, свойства дисперсии можно сформулировать в виде теорем.

Теорема. Дисперсия постоянной величины равна нулю.

Доказательство. Если – постоянная величина, то и, следовательно, . Этот результат очевиден, поскольку постоянная величина изображается точкой на числовой оси и не имеет рассеяния.

Теорема. Постоянный множитель можно выносить за знак дисперсии, возводя его при этом в квадрат .

Доказательство. Если – постоянный множитель, а – случайная величина, то – тоже случайная величина, математическое ожидание которой . Применяя к случайной величине определение дисперсии, получаем:



.

Теорема. Дисперсия случайной величины равна разности математического ожидания ее квадрата и квадрата математического ожидания самой величины: .

Доказательство. Используя основные теоремы о математическом ожидании можно записать:





Теорема. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин:

.

Доказательство. Поскольку , следовательно:







,

где – так называемый корреляционный момент величин и . Если случайные величины и независимы, то случайные величины и , очевидно, также независимы, поэтому:



Следствие 1. Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме дисперсий этих величин.

Следствие 2. Если – постоянная величина, то .

Следствие 3. Дисперсия разности двух независимых случайных величин равна сумме дисперсий этих величин, т.е. если случайные величины и независимы, то .

Доказательство.

.

Математическое ожидание и дисперсия случайной величины являются ее основными числовыми характеристиками.

Среднеквадратическое отклонение


Для оценки рассеяния возможных значений случайной величины вокруг его среднего значения кроме дисперсии служат и некоторые другие характеристики. К их числу относится среднее квадратичное отклонение.

Средним квадратичным отклонением (или стандартом) случайной величины называется корень квадратный из дисперсии этой величины: .

Пример. Пусть закон распределения случайной величины задан таблицей:



4

10

20



0.25

0.5

0.25

Определить математическое ожидание , дисперсию и среднее квадратичное отклонение .

Решение:





.


Легко показать, что дисперсия имеет размерность, равную квадрату размерности случайной величины. Так как среднее квадратическое отклонение равно квадратному корню из дисперсии, то размерность совпадает с размерностью . Поэтому в тех случаях, когда желательно, чтобы оценка рассеяния имела размерность случайной величины, вычисляют среднее квадратичное отклонение, а не дисперсию.

Начальные и центральные моменты


Кроме математического ожидания и дисперсии, для оценки случайной величины используются начальные и центральные моменты случайной величины.

Начальным моментом порядка случайной величины называют математическое ожидание величины :

.

Центральным моментом порядка случайной величины называют математическое ожидание величины :

.

Начальный момент первого порядка равен математическому ожиданию самой случайной величины .

Центральный момент первого порядка равен нулю:

.

Центральный момент второго порядка представляет собой дисперсию случайной величины :

.

Для дискретных случайных величин:

;

.

Основные примеры распределений дискретной случайной величины


Случайную величину полностью задает закон ее распределения. Чтобы определить закон распределения дискретной случайной величины, необходимо установить соответствие между всеми возможными значениями данной случайной величины и их вероятностями.

К каноническим законам распределения дискретной случайной величины обычно относят биномиальный закон, закон распределения Пуассона и закон распределения по геометрической прогрессии.

Биномиальное распределение, его математическое ожидание, дисперсия


Рассмотрим серию независимых испытаний проведенных в условиях схемы Бернулли, в ходе которых появлялось событие с вероятностью , одинаковой для всех испытаний.

Необходимо определить закон распределения случайной величины числа появлений события . Для этого нужно определить возможные значения и их вероятности. Минимальное значение равно нулю, что соответствует ситуации, когда в серии испытаний событие не появилось; максимальное значение соответствует «успеху» во всех испытаниях серии и равно . Очевидно, что случайная величина числа появлений события в серии испытаний принимает значения . Остается найти соответствующие вероятности этих возможных значений, для чего достаточно воспользоваться формулой Бернулли:

,

где , .

Эта формула является аналитическим выражением искомого закона распределения. Эта формула еще называется биномиальной, так как ее правая часть представляет собой -й член бинома Ньютона:

.

Отсюда сразу видно, что для полученного закона биномиального распределения вероятностей числа появления события при независимых испытаниях выполняется условие нормировки, т.е. сумма всех вероятностей равна единице:

.

Теорема. Математическое ожидание числа появлений события в независимых испытаниях равно произведению числа испытаний на вероятность появления события в каждом испытании.

Доказательство. Случайная величина распределена по биномиальному закону:

(),

где .

Величину можно рассматривать, как сумму независимых случайных величин , где () – число появлений события в м испытании. Случайная величина принимает лишь два значения: 1, если событие появилось в м испытании, и 0, если в м испытании события не произошло.

Вероятности этих событий и , а математическое ожидание: ().

Следовательно, используя теорему о математическом ожидании суммы, получим:

.

Таким образом, математическое ожидание числа появлений события в условиях схемы Бернулли совпадает со средним числом появлений события в данной серии испытаний.

Теорема. Дисперсия числа появлений события в независимых испытаниях равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании: .

Доказательство. Пусть – число появлений события в независимых испытаниях. Оно равно сумме появлений события в каждом испытании: . Так как испытания независимы, то и случайные величины – независимы, поэтому .

Но , .

Как было показано выше, , а .

Тогда , а .

В этом случае, как уже упоминалось ранее, среднее квадратичное отклонение .

Пример. В пяти торговых точках проверяется годовой баланс. Вероятность правильного оформления баланса в каждой точке равна 0,7. Найти математическое ожидание и дисперсию правильно оформленных балансов.

Решение. Дано: , , .

Тогда

.

Биномиальный закон распределения часть приходится применять в условиях, когда число независимых испытаний велико. Вычисление вероятностей по формуле Бернулли при этом усложняется, поэтому представляет интерес асимптотическое приближение для биномиального закона, справедливое при больших . Возможны два случая:
  1. Когда при увеличении числа испытаний математическое ожидание рассматриваемой случайной величины тоже неограниченно возрастает (случай постоянного ); при этом биномиальное распределение сходится к нормальному закону, который будет рассмотрен позже.
  2. Когда при увеличении числа испытаний остается постоянным произведение , то есть математическое ожидание рассматриваемой случайной величины остается конечным. Это означает, что вероятность события стремится к нулю. В этом случае биномиальное распределение сходится к распределению Пуассона.

Распределение Пуассона


Рассмотрим второй случай асимптотического приближения биномиального распределения, когда , а – имеет конечное значение. Случайная величина называется распределенной по закону Пуассона с параметром , если эта случайная величина может принимать значения , соответствующая вероятность которых определяется по формуле Пуассона, когда :

.

В биномиальном распределении величина имеет смысл математического ожидания. Проведем вычисления математического ожидания для распределения Пуассона:

.

Таким образом, в распределении Пуассона величина также имеет смысл математического ожидания.

Проведем вычисления дисперсии для распределения Пуассона:





,

поскольку

,





Таким образом, в распределении Пуассона дисперсия также равна .

Геометрическое распределение


Рассмотрим серию независимых испытаний, в ходе которых появлялось событие с вероятностью , одинаковой для всех испытаний. Испытания в каждой серии проводились до появления события и заканчивались, как только событие происходило. Обозначим через число испытаний, которые нужно провести до появления «успеха». Очевидно, что возможными значениями дискретной случайной величины являются натуральные числа . Пусть событие наступило после безуспешных испытаний, т.е. . Вероятность этого события по теореме умножения вероятностей равна .

Полученный закон распределения дискретной случайной величины называют геометрическим, поскольку – формула расчета -го члена геометрической прогрессии, с первым членом и знаменателем (). Несложно убедиться в том, что выполняется условие нормировки:



Случайная величина называется распределенной по закону геометрической прогрессии с параметром , если может принимать значения , соответствующая вероятность которых определяется по формуле: , где .

Найдем математическое ожидание случайной величины, распределенной по геометрическому закону с параметром:





Примерно так же находится и дисперсия .

Непрерывные случайные величины

Функция и плотность распределения вероятностей


Непрерывная случайная величина в отличие от дискретной не может характеризоваться вероятностью ее конкретного значения, так как таких значений бесконечное множество.

Для характеристики непрерывной случайной величины используется функция распределения вероятностей, которая, так же как и для дискретной случайной величины, представляет собой вероятность события :



Однако, в отличие от дискретной случайной величины в данном случае пробегает все непрерывное множество значений, а сама функция возрастает монотонно.

В некоторых случаях на значения случайной величины могут быть наложены ограничения. Например, если случайная величина представляет собой время выполнения некоторой операции , то с учетом неравенства функция распределения вероятностей будет располагаться лишь в правой полуплоскости.

Если вероятность события равна , а вероятность события равна , то вероятность того, что случайная величина заключена между и равна разности соответствующих значений функции распределения:

.

Кроме функции распределения для непрерывных случайных величин вводится понятие плотности распределения вероятностей, или плотности вероятности.

Плотностью распределения вероятностей непрерывной случайной величины называется производная от ее функции распределения вероятностей:

.

Значит, можно найти функцию распределения вероятностей, интегрируя плотность вероятности в общем случае от до рассматриваемого значения , т.е.

.

Аналитические выражения для функций распределения вероятностей или плотности вероятности носят название законов распределения.

Для любого значения на основании функции распределения можно определит вероятность события .

В некоторых случаях по заданной вероятности требуется найти такие значения , для которых выполняется равенство . Значение , для которого это равенство выполняется, называют квантилью, отвечающей заданному уровню вероятности.

Числовые характеристики непрерывных случайных величин


Для непрерывных случайных величин, так же, как и для дискретных, используют понятия математического ожидания и дисперсии.

Математическим ожиданием непрерывной случайной величины называется значение интеграла:

,

где – плотность вероятности.

Дисперсией непрерывной случайной величины называется значение интеграла:

.

Среднее квадратичное отклонение непрерывной случайной величины вычисляется как корень квадратный из дисперсии:

.

Мода () непрерывной случайной величины – это такое ее значение, которому соответствует максимальное значение ее плотности вероятности.

Медианой () непрерывной случайной величины называется такое ее значение, которое определяется равенством:

.

Основные свойства математического ожидания и дисперсии непрерывных случайных величин остаются такими же, как и для дискретных случайных величин.

Начальные и центральные моменты для непрерывных случайных величин находятся по формулам:

,

.

Основные примеры распределений непрерывной случайной величины

Равномерное распределение


Непрерывная случайная величина считается равномерно распределенной, если ее плотность вероятности имеет вид:



Математическое ожидание случайной величины, имеющей равномерное распределение:



Дисперсия может быть вычислена следующим образом:





Среднее квадратичное отклонение будет иметь вид:

.

Показательное распределение


Показательным (экспоненциальным) распределением непрерывной случайной величины называется такое распределение, которое описывается следующим выражением для плотности вероятности:

,

где – постоянная положительная величина.

Функция распределения вероятности в этом случае имеет вид:



Математическое ожидание случайной величины, имеющей экспоненциальное распределение, получаем на основании общей формулы с учетом того, что при :

.

Интегрируя это выражение по частям, находим: .

Дисперсию для экспоненциального распределения можно получить, используя выражение:

.

Подставляя выражение для плотности вероятности, находим:



Вычисляя интеграл по частям, получаем: .

Нормальное распределение


Нормальным называется такое распределение случайной величины , плотность вероятности которого описывается функцией Гаусса:



где – среднее квадратичное отклонение;

– математическое ожидание случайной величины.

Свойства функции Гаусса


График плотности нормального распределения называют нормальной кривой Гаусса.

Проведем исследование функции:



методами дифференциального исчисления.
  1. Очевидно, что функция определена на всей оси .
  2. При всех значениях функция принимает положительные значения, т.е. нормальная кривая расположена над осью .
  3. Ось служит горизонтальной асимптотой графика, поскольку . Других асимптот у графика нет.
  4. При функция имеет максимум, равный .
  5. Функция четная: ее график симметричен относительно прямой .
  6. П
    ри график функции имеет точки перегиба.

Изменение величины математического ожидания, т.е. параметра , ведет к сдвигу кривой вдоль оси без изменения ее формы. График ведет себя иначе, если изменяется среднее квадратичное отклонение (параметр ): с возрастанием максимальная ордината нормальной кривой убывает, а сама кривая становится более пологой, т.е. сжимается к оси ; при убывании нормальная кривая становится более островершинной и растягивается в положительном направлении оси . Но при любых значениях параметров и , согласно условию нормировки функции плотности распределения, площадь, ограниченная нормальной кривой и осью остается равной единице.

Центральная предельная теорема


Многие непрерывные случайные величины имеют нормальное распределение. Это обстоятельство во многом определяется тем, что суммирование большого числа случайных величин с самыми разными законами распределения приводит к нормальному распределению этой суммы.

Указанное свойство подтверждается интегральной предельной теоремой, доказанной Ляпуновым.

Теорема. Если случайная величина представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то имеет распределение, близкое к нормальному.

Центральная предельная теорема имеет огромное значение для практики.

Допустим, определяется некоторый экономический показатель, например, потребление электроэнергии в городе за год. Величина суммарного потребления складывается из потребления энергии отдельными потребителями, которая имеет случайные значения с разными распределениями. Теорема утверждает, что в этом случае, какое бы распределение не имели отдельные составляющие, распределение результирующего потребления будет близко к нормальному.

Однако следует иметь в виду, что при усилении влияния отдельных факторов могут появляться отклонения от нормального распределения результирующего параметра, например, может возникнуть асимметрия или эксцесс. Поэтому большое значение на практике уделяется экспериментальной проверке выдвинутых гипотез, в том числе и гипотезы о нормальном распределении.

Поэтому, в некоторых случаях приходится рассматривать распределение случайной величины, имеющие определенные отличия от нормального. Для оценки этого отличия введены специальные характеристики. К ним относятся, в частности, асимметрия и эксцесс.

Асимметрией распределения случайной величины называется отношение центрального момента третьего порядка к кубу среднего квадратичного отклонения:

.

Эксцессом распределения случайной величины называют число, определяемое выражением:

.

Для нормального распределения , поэтому эксцесс равен нулю.

Вероятность попадания нормальной случайной величины в заданный интервал


Во многих практических задачах требуется определить вероятность попадания случайной величины в заданный интервал. Эта вероятность может быть выражена в виде разности функции распределения вероятности в граничных точках этого интервала:

.

В случае нормального распределения:



сделаем замену переменной: , , .

Тогда:

,

где , .

Разобьем полученный интеграл на два:

.

Следовательно, искомая вероятность может быть выражена через веденный ранее стандартный интеграл Лапласа:

.

Функция Лапласа и ее свойства


Функция Лапласа не выражается через элементарные функции .

Для ее вычисления используются специальные таблицы или методы приближенного вычисления.

Функция обладает следующими свойствами:
  1. ;
  2. ;
  3. функция – нечетная, т.е. = – , поэтому в таблицах обычно приводятся значения только для положительных ;
  4. ф
    ункция – монотонно возрастающая функция (это следует из того, что ). При , с точностью до тысячных можно принять .

Вычисление вероятности заданного отклонения. Правило «трех сигм»


Часто требуется вычислить вероятность того, что отклонение нормально распределенной случайной величины по абсолютной величине меньше заданного положительного числа , т.е. требуется найти вероятность того, что выполняется неравенство .

Заменим это неравенство равносильным ему двойным неравенством .

Воспользуемся формулой:

Получим:





.

Если выразить отклонение в средних квадратичных отклонениях: , получим:



Если и, следовательно, , получим:

,

т.е. такое отклонение является почти достоверным (правило «трех сигм»).

Другими словами, если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратичного отклонения. В этом и состоит сущность правила «трех сигм».

На практике правило «трех сигм» применяют так: если распределение изучаемой средней величины неизвестно, но правило «трех сигм» выполняется, то есть основания полагать, что изучаемая величина распределена нормально, и наоборот.