Изучение критерия Колмогорова–Смирнова и сравнение его с другими критериями согласия
Курсовой проект - Математика и статистика
Другие курсовые по предмету Математика и статистика
Введение
Критерий согласия - это критерий проверки гипотезы о предполагаемом законе распределения генеральной совокупности.
где - эмпирическая функция распределения вероятностей; - гипотетическая функция распределения вероятностей [1].
В статистике критерий согласия Колмогорова - Смирнова используется для того, чтобы определить, подчиняются ли два эмпирических распределения одному закону, либо определить, подчиняется ли полученное распределение предполагаемой модели [2].
Модифицированные статистики критерия Колмогорова-Смирнова позволяют применять их в некоторых частных случаях и для ситуации с неизвестными параметрами гипотетических распределений [3].
Критерий Колмогорова - Смирнова является одним из основных и наиболее широко используемых непараметрических методов, так как достаточно чувствителен к различиям в исследуемых выборках[4].
Целью данной курсовой работы является изучение критерия согласия типа Колмогорова-Смирнова, сравнение с другими критериями согласия: Пирсона и ; и исследование его асимптотических свойств.
1.Критерии согласия
1.1Критерий Колмогорова-Смирнова
Пусть -эмпирическая функция распределения случайной величины , представленной выборкой:
Для проверки нулевой гипотезы , где -полностью определенная (с точностью до параметров) теоретическая функция распределения, рассматривается расстояние между эмпирической и теоретической функциями распределения
Здесь -точные верхняя и нижняя границы соответствующих разностей.
Для практического применения используются формулы
Колмогорованашел предельное распределение статистики (при )[3]. Если верна гипотеза , то независимо от функции , случайная величина имеет распределение Колмогорова [5]:
Смирнов развил результаты Колмогорова на случай статистик .
Между критическими значениями существует соотношение .
В качестве первого приближения можно использовать соотношение
Если , гипотеза согласия () отклоняется на уровне значимости .
При полезна аппроксимация
распределениекоторой удовлетворительно описывается распределением хи-квадрат с степенями свободы.
При необходимо использовать более точное приближение
где для , при и . Наиболее просты в приложениях результаты Стефенса, который предложил преобразования статистик устанавливающие зависимость их процентных точек от объема выборки :
Первые две аппроксимации используются соответственно для нижних и верхних процентных точек. Критические значения статистик Стефенса приведены в таблице 1.1[3].
Таблица 1.1 - Процентные точки статистик
0,1500,1000,0500,0250,0100,9731,0731,2241,3581,5181,1381,2241,3581,4801,628
.2Критерий Пирсона
Критерий основан на сравнении эмпирической гистограммы распределения случайной величины с ее теоретической плотностью. Диапазон изменения экспериментальных данных разбивается наинтервалов, и подсчитывается статистика
где - количество значений случайной величины, попавших в -й интервал; - объем выборки; - гипотетический теоретический закон распределения вероятностей случайной величины; - теоретическая вероятность попадания случайной величины в -й интервал.
Дисперсия статистики критерия равна
Если , т.е. совпадает с дисперсией случайной величины, имеющей -распределение. На этом основании принято считать, что статистика имеет распределение, близкое к распределению хи-квадрат.
На мощность статистического критерия сильное влияние оказывает число интервалов разбиения гистограммыи порядок ее разбиения (т.е. выбор длин интервалов внутри диапазона изменения значений случайной величины). На практике принято считать, что статистику можно использовать, когда
Так или иначе, статистика имеет распределение хи-квадрат с степенями свободы в том случае, когда проверяется простая гипотеза , т.е., когда гипотетическое распределение, на соответствие которому проверяется эмпирический ряд данных, известно с точностью до значения своих параметров. Если гипотеза сложная и параметры гипотетического распределения оцениваются по самой выборке, то число степеней свободы уменьшается на число оцениваемых параметров .
Правило проверки гипотезы просто: если
то на уровне значимости , т.е. с достоверностью гипотеза отклоняется [3].
1.3Критерий Смирнова-Крамера-фон Мизеса
Статистика критерия имеет вид
где- теоретическая функция распределения.
Необходимо помнить, что теоретическая функция распределения должна быть известна с точностью до параметров. Распространенная ошибка - использование в качестве функции распределения с параметрами, оцениваемыми по выборке - приводит к уменьшению величины критического значения статистики, т.е. к увеличению количества ошибок второго рода[6]. При объеме выборки можно использовать приведенные в таблице 1.2 квантили распределения , которые следуют из его предельного распределения ( - уровень значимости, принятый для проверки ).
Таблица 1.2 - Квантили распределения
0,1000,0500,0100,0050,0010,34730,46140,74350,86941,1679
При таблицей можно пользоваться с заменой на