Критерий согласия Пирсона
Реферат - Математика и статистика
Другие рефераты по предмету Математика и статистика
>
Оценкой параметра называется его приближенное значение, построенное по выборке наблюдений.
Т.о. Хn= аn оценка для а
Замечание: можно показать, что оценка Хn обладает следующим свойством:
- Хn>a при n > ? (состоятельность оценки Хn)
- M[Xn]=a (несмещенность оценки)
Выборочной дисперсией называется величина
Sn2= (1/(n-1)) ?(xk Xn)2
Выборочная дисперсия является оценкой для дисперсии
Sn2=?2
?n = v Sn2 = Sn оценка среднего квадратичного отклонения.
Выборочная (эмпирическая) функция распределения.
Упорядочить элементы выборки по возрастанию
Мn(A) случайное число появлений события A в серии из n испытаний
Wn(A) = Мn(A)/n частота события А в серии из n испытаний
Рассмотрим выборку Zn, порожденную СВ Х с функцией распределения Fx(x). Определим для каждого х Є R1 событие Aх= {X ? x}, для каждого P(Aх) = Fx(x). Тогда Мn(Aх) случайное число элементов выборки Zn, не превосходящих х
Определение. Частота Мn(Aх) события Aх как функция х Є R1 , называется выборочной (эмпирической) функцией распределения СВ Х и обозначается
Fn(x) = Мn(Aх).
Для каждого фиксированного х Є R1 СВ Fn(x) является статистикой, реализациями которой являются числа 0, 1/n, 2/n,…,n/n, и при этом
P{Fn(x) = k/n}= P{Мn(Aх)=k}, k= 1,n.
Любая реализация Fn(x) выборочной функции Fn(x) является ступенчатой функцией. В точках х(1)<…< х(n), где х(k) реализация порядковой статистики X(k), функция Fn(x) имеет скачки величиной 1/n и является непрерывной справа.
Свойства.
- M [Fn(x)]= F(x), для любого х Є R1 и любого n ? 1
- Sup| Fn(x)- F(x)| > 0 при n > ?
- dn(x) = M[(Fn(x)- F(x))2] = F(x)(1-F(x))/n ? 1/4n
- (Fn(x)- F(x))/vdn(x) >U при n > ?, где СВ U имеет распределение
N(0; 1)
Гистограмма
- Построить вариационный ряд выборки, т.е. элементы выборки упорядочить по возрастанию {x1,…, xn} > {x1,…, xn}
х(1)<…< х(n)
Промежуток ?= [x1, xn] называется размахом выборки.
Все наблюдения принадлежат этому промежутку.
2)Группировки выборки.
Для этого размах выборки делится на k промежутков одинаковой длины.
|?i| - длина промежутка ?i
|?1|=|?2|=…=|?n|=|?|/k
nm число наблюдений попавших в интервал
Группировкой выборки называется набор следующего вида.
(?m; nm) , m=1,…,k статистический ряд
- Построение гистограммы
Для каждого промежутка ?m находится частота
Pm*= nm/n
Над каждым промежутком ?m строится прямоугольник, основанием которого является этот промежуток, а высота равна
hm= Pm*/ |?m|
Гистограммой называется кусочно-постоянная функция, образованная верхними основаниями построенных прямоугольников.
Гистограмма является оценкой плотности вероятности, построенной по выборке.
4.Понятие о точечном и интервальном оценивании. Свойства точечных оценок: несмещенность и состоятельность.
Оценкой параметра называется его приближенное значение, построенное по выборке наблюдений (?)
Точечной (выборкой) оценкой неизвестного параметра распределения
? Є ? называется произвольная статистика ?(Zn), построенная по выборке Zn и принимающая значение в множестве ?.
Свойства:
1) Оценка ?(Zn) параметра ? называется состоятельной, если она сходится по вероятности к ?, т.е. ?(Zn) > ? при n > ? для любого ? Є ?.
2) Оценка ?(Zn) параметра ? называется несмещенной, если ее МО равно ?, т.е. M[?(Zn)] = ? для любого ? Є ?.
5.Метод моментов. Метод максимального правдоподобия.
Оценкой максимального правдоподобия (МП-оценкой) параметра ? Є ? называется статистика ?(zn), максимизирующая для каждой реализации Zn
функцию правдоподобия, т.е.
?(zn) = arg max L(zn, ?)
Способ построения МП-оценки называется методом максимального правдоподобия.
Пусть vi, i=1,s, - выборочные начальные моменты. Рассмотрим систему уравнений
vi (?)= vi, i=1,s
и предположим, что ее можно решить относительно параметров ?1,…, ?s, т.е. найти функции ?i=?i(v1,…, vs), i=1,s
Решением полученной системы уравнений ?i=?i(v1,…, vs), i=1,s, называется оценкой параметра ?, найденной по методу моментов, или ММ-оценкой.
6. Выборочные моменты
Пусть имеется выборка Zn=col(x1,.., xn) которая порождена СВ Х с функцией распределения Fx(x).
Для выборки Zn объема n выборочными начальными и центральными моментами порядка r СВ Х называются следующие СВ:
vr(n) = 1/n?(xk)r, r =1,2,….;
? r(n) = 1/n?(xk- vr(n))r, r =2,3,….;
Выборочным средним и выборочной дисперсией СВ Х называются соответственно:
mX(n)= v1(n) = 1/n?xk
dX(n)= ? 2(n) = 1/n?(xk- mX(n))2
7.Проверка гипотезы о законе распределения выборки по критерию согласия К. Пирсона (?2 - хи-квадрат)
СВ Х имеет распределение ?2 с r степенями свободы. Если ее можно представить в следующем виде Х = ?Хi2 , где Хi~ N(0; 1)
Х= ?2(r)
Плотность вероятности этой СВ имеет следующий график:
Критическая и доверительная область
Х= ?2(r)
Критической областью значений СВ Х называется промежуток на вещественной оси, в которой СВ Х попадает с некоторой малой вероятностью ?.
Это число ? называется уровнем значимости критической области.
S критическая область
P(XЄS) = ?<<1
S=R- S доверительная область
P(XЄS) = 1-? близка к 1
Для задания критической области S распределения Пирсона поступают следующим образом:
P(X ? ?кр2(r)) = ?
S = [?кр2(r); +?)
P(XЄ