А. С. Гринберг О. Б. Плющ Б. В. Новыш Теория вероятностей и математическая статистика Курс лекций
Вид материала | Курс лекций |
- Рабочая программа дисциплины "теория вероятностей и математическая статистика", 112.61kb.
- Конспект лекций по курсу "Теория вероятностей и математическая статистика", 1417.24kb.
- Рабочая учебная программа дисциплины (модуля) Теория вероятностей и математическая, 217.23kb.
- Примерная программа наименование дисциплины «теория вероятностей и математическая статистика», 165.37kb.
- Рабочая программа учебной дисциплины теория вероятностей и математическая статистика, 830.1kb.
- Рабочая программа учебной дисциплины «Теория вероятностей и математическая статистика», 165.42kb.
- Программа курса лекций "Теория вероятностей и математическая статистика", 18.69kb.
- Примерная рабочая программа по дисциплине: «теория вероятностей, математическая статистика, 83.07kb.
- Программа по дисциплине «Теория вероятностей и математическая статистика» для студентов, 206.05kb.
- Программа дисциплины «теория вероятностей и математическая статистика» Для направления, 198.58kb.
Эмпирическая функция распределения и ее свойства
Пусть известно статистическое распределение частот количественного признака X. Обозначим через

Эмпирической функцией распределения (функцией распределения выборки) называют функцию


В отличие от эмпирической функции распределения выборки, функцию распределения


При росте n относительная частота события X


Свойства эмпирической функции распределения
Значения эмпирической функции принадлежат отрезку [0,1].

Если



если



Эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.
Пример. Построим эмпирическую функцию по распределению выборки:
-
Варианты
2
6
10
Частоты
12
18
30
Найдем объем выборки: 12+18+30=60. Наименьшая варианта равна 2, поэтому







Статистические оценки параметров распределения. Состоятельность и несмещенность статистических оценок
Пусть требуется изучить некоторый количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак и необходимо оценить параметры, которыми оно определяется. Например, если изучаемый признак распределен в генеральной совокупности нормально, то нужно оценить математическое ожидание и среднее квадратическое отклонение; если признак имеет распределение Пуассона – то необходимо оценить параметр .
Обычно имеются лишь данные выборки, например значения количественного признака




Для того чтобы статистические оценки давали корректные приближения оцениваемых параметров, они должны удовлетворять некоторым требованиям, среди которых важнейшими являются требования несмещенности и состоятельности оценки.
Пусть








Если оценка







Аналогично, если


Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим (одного знака) ошибкам. Если, напротив,

Несмещенной называют статистическую оценку



Смещенной называют оценку, не удовлетворяющую этому условию.
Несмещенность оценки еще не гарантирует получения хорошего приближения для оцениваемого параметра, так как возможные значения




Эффективной называют статистическую оценку, которая, при заданном объеме выборки n, имеет наименьшую возможную дисперсию.
При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называется статистическая оценка, которая при n стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n стремится к нулю, то такая оценка оказывается и состоятельной.
Выборочные среднее и дисперсия
Пусть для изучения генеральной совокупности относительно количественного признака X извлечена выборка объема n.
Выборочным средним



Если значения признака




Выборочное среднее, найденное по данным одной выборки, равно определенному числу. При извлечении других выборок того же объема выборочное среднее будет меняться от выборки к выборке. То есть выборочное среднее можно рассматривать, как случайную величину, и можно говорить о его распределениях (теоретическом и эмпирическом) и о числовых характеристиках этого распределения (например, о математическом ожидании и дисперсии).
Для охарактеризования рассеяния наблюдаемых значений количественного признака выборки вокруг среднего значения





Если значения признака




Аналогично выборочным среднему и дисперсии определяются генеральные среднее и дисперсия, характеризующие генеральную совокупность в целом. Для расчета этих характеристик достаточно в вышеприведенных соотношениях заменить объем выборки n на объем генеральной совокупности N.
Фундаментальное значение для практики имеет нахождение среднего и дисперсии признака генеральной совокупности по соответствующим известным выборочным параметрам. Можно показать, что выборочное среднее является несмещенной состоятельной оценкой генерального среднего. В то же время, несмещенной состоятельной оценкой генеральной дисперсии оказывается не выборочная дисперсия


Таким образом, в качестве оценок генерального среднего и дисперсии в математической статистике принимают выборочное среднее и исправленную выборочную дисперсию.
Надежность и доверительный интервал
До сих пор мы рассматривали точечные оценки, т.е. такие оценки, которые определяются одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. В связи с этим при небольшом объеме выборки пользуются интервальными оценками.
Интервальной называют оценку, определяющуюся двумя числами – концами интервала. Пусть найденная по данным выборки статистическая характеристика







Статистические методы не позволяют утверждать, что оценка


Надежностью (доверительной вероятностью) оценки



Пусть вероятность того, что


Заменим неравенство


Это соотношение следует понимать так: вероятность того, что интервал


Таким образом, доверительным называют интервал

