Закон больших чисел. Проверка статистических гипотез (критерий согласия w2 Мизеса: простая гипотеза)

Дипломная работа - Математика и статистика

Другие дипломы по предмету Математика и статистика

любой задачи математической статистики располагают двумя источниками информации. Первый и наиболее определенный (явный) - это результат наблюдений (эксперимента) в виде выборки из некоторой генеральной совокупности скалярной или векторной случайной величины. При этом объем выборки n может быть фиксирован, а может и увеличиваться в ходе эксперимента (т.е. могут использоваться так называемые последовательные процедуры статистического анализа).

Второй источник - это вся априорная информация об интересующих свойствах изучаемого объекта, которая накоплена к текущему моменту. Формально объем априорной информации отражается в той исходной статистической модели, которую выбирают при решении задачи. Однако и о приближенном в обычном смысле определении вероятности события по результатам опытов говорить не приходится. Под приближенным определением какой-либо величины обычно подразумевают, что можно указать пределы погрешностей, из которых ошибка не выйдет. Частота же события случайна при любом числе опытов из-за случайности результатов отдельных опытов. Из-за случайности результатов отдельных опытов частота может значительно отклоняться от вероятности события. Поэтому, определяя неизвестную вероятность события как частоту этого события при большом числе опытов, не можем указать пределы погрешности и гарантировать, что ошибка не выйдет из этих пределов. Поэтому в математической статистике обычно говорят не о приближенных значениях неизвестных величин, а об их подходящих значениях, оценках.

Задача оценивания неизвестных параметров возникает в тех случаях, когда функция распределения генеральной совокупности известна с точностью до параметра . В этом случае необходимо найти такую статистику , выборочное значение которой для рассматриваемой реализации xn случайной выборки можно было бы считать приближенным значением параметра . Статистику, выборочное значение которой для любой реализации xn принимают за приближенное значение неизвестного параметра , называют его точечной оценкой или просто оценкой, а - значением точечной оценки. Точечная оценка должна удовлетворять вполне определенным требованиям для того, чтобы её выборочное значение соответствовало истинному значению параметра .

Возможным является и иной подход к решению рассматриваемой задачи: найти такие статистики и , чтобы с вероятностью ? выполнялось неравенство:

{ } = ?.

 

В этом случае говорят об интервальной оценке для . Интервал

 

()

 

называют доверительным интервалом для с коэффициентом доверия ?.

Оценив по результатам опытов ту или иную статистическую характеристику, возникает вопрос: насколько согласуется с опытными данными предположение (гипотеза) о том, что неизвестная характеристика имеет именно то значение, которое получено в результате её оценивания? Так возникает второй важный класс задач математической статистики - задачи проверки гипотез.

В некотором смысле задача проверки статистической гипотезы является обратной к задаче оценивания параметра. При оценивании параметра мы ничего не знаем о его истинном значении. При проверке статистической гипотезы из каких-то соображений предполагается известным его значение и необходимо по результатам эксперимента проверить данное предположение.

Во многих задачах математической статистики рассматриваются последовательности случайных величин , сходящиеся в том или ином смысле к некоторому пределу (случайной величине или константе), когда .

Таким образом, основными задачами математической статистики являются разработка методов нахождения оценок и исследования точности их приближения к оцениваемым характеристикам и разработка методов проверки гипотез.

 

1.2.2 Проверка статистических гипотез: основные понятия

Задача разработки рациональных методов проверки статистических гипотез - одна из основных задач математической статистики. Статистической гипотезой (или просто гипотезой) называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин.

Пусть имеется выборка , являющаяся реализацией случайной выборки из генеральной совокупности , плотность распределения которой зависит от неизвестного параметра .

Статистические гипотезы относительно неизвестного истинного значения параметра называют параметрическими гипотезами. При этом если - скаляр, то речь идет об однопараметрических гипотезах, а если вектор - то о многопараметрических гипотезах.

Статистическую гипотезу называют простой, если она имеет вид

 

 

где - некоторое заданное значение параметра.

Статистическую гипотезу называют сложной, если она имеет вид

 

 

где - некоторое множество значений параметра , состоящее более чем из одного элемента.

В случае проверки двух простых статистических гипотез вида

 

 

где - два заданных (различных) значения параметра, первую гипотезу обычно называют основной, а вторую - альтернативной, или конкурирующей гипотезой.

Критерием, или статистическим критерием, проверки гипотез называют правило, по которому по данным выборки принимается решение о справедливости либо первой, либо второй гипотезы.

Критерий задают с помощью критического множества , являющегося подмножеством выборочного пространства случайной выборки . Решение принимают следующим образом:

)если выборка принадлежит критическому множеству