Критерий согласия Пирсона

Реферат - Математика и статистика

Другие рефераты по предмету Математика и статистика

Оценкой параметра называется его приближенное значение, построенное по выборке наблюдений.

Т.о. Хn= аn оценка для а

Замечание: можно показать, что оценка Хn обладает следующим свойством:

  1. Хn>a при n > ? (состоятельность оценки Хn)
  2. M[Xn]=a (несмещенность оценки)

Выборочной дисперсией называется величина

 

Sn2= (1/(n-1)) ?(xk Xn)2

 

Выборочная дисперсия является оценкой для дисперсии

Sn2=?2

?n = v Sn2 = Sn оценка среднего квадратичного отклонения.

 

Выборочная (эмпирическая) функция распределения.

Упорядочить элементы выборки по возрастанию

Мn(A) случайное число появлений события A в серии из n испытаний

Wn(A) = Мn(A)/n частота события А в серии из n испытаний

Рассмотрим выборку Zn, порожденную СВ Х с функцией распределения Fx(x). Определим для каждого х Є R1 событие Aх= {X ? x}, для каждого P(Aх) = Fx(x). Тогда Мn(Aх) случайное число элементов выборки Zn, не превосходящих х

Определение. Частота Мn(Aх) события Aх как функция х Є R1 , называется выборочной (эмпирической) функцией распределения СВ Х и обозначается

Fn(x) = Мn(Aх).

 

Для каждого фиксированного х Є R1 СВ Fn(x) является статистикой, реализациями которой являются числа 0, 1/n, 2/n,…,n/n, и при этом

P{Fn(x) = k/n}= P{Мn(Aх)=k}, k= 1,n.

Любая реализация Fn(x) выборочной функции Fn(x) является ступенчатой функцией. В точках х(1)<…< х(n), где х(k) реализация порядковой статистики X(k), функция Fn(x) имеет скачки величиной 1/n и является непрерывной справа.

Свойства.

  1. M [Fn(x)]= F(x), для любого х Є R1 и любого n ? 1
  2. Sup| Fn(x)- F(x)| > 0 при n > ?
  3. dn(x) = M[(Fn(x)- F(x))2] = F(x)(1-F(x))/n ? 1/4n
  4. (Fn(x)- F(x))/vdn(x) >U при n > ?, где СВ U имеет распределение

N(0; 1)

 

Гистограмма

  1. Построить вариационный ряд выборки, т.е. элементы выборки упорядочить по возрастанию {x1,…, xn} > {x1,…, xn}

х(1)<…< х(n)

Промежуток ?= [x1, xn] называется размахом выборки.

Все наблюдения принадлежат этому промежутку.

2)Группировки выборки.

Для этого размах выборки делится на k промежутков одинаковой длины.

|?i| - длина промежутка ?i

|?1|=|?2|=…=|?n|=|?|/k

nm число наблюдений попавших в интервал

Группировкой выборки называется набор следующего вида.

(?m; nm) , m=1,…,k статистический ряд

  1. Построение гистограммы

Для каждого промежутка ?m находится частота

Pm*= nm/n

Над каждым промежутком ?m строится прямоугольник, основанием которого является этот промежуток, а высота равна

hm= Pm*/ |?m|

Гистограммой называется кусочно-постоянная функция, образованная верхними основаниями построенных прямоугольников.

Гистограмма является оценкой плотности вероятности, построенной по выборке.

4.Понятие о точечном и интервальном оценивании. Свойства точечных оценок: несмещенность и состоятельность.

 

Оценкой параметра называется его приближенное значение, построенное по выборке наблюдений (?)

Точечной (выборкой) оценкой неизвестного параметра распределения

? Є ? называется произвольная статистика ?(Zn), построенная по выборке Zn и принимающая значение в множестве ?.

Свойства:

1) Оценка ?(Zn) параметра ? называется состоятельной, если она сходится по вероятности к ?, т.е. ?(Zn) > ? при n > ? для любого ? Є ?.

2) Оценка ?(Zn) параметра ? называется несмещенной, если ее МО равно ?, т.е. M[?(Zn)] = ? для любого ? Є ?.

 

5.Метод моментов. Метод максимального правдоподобия.

Оценкой максимального правдоподобия (МП-оценкой) параметра ? Є ? называется статистика ?(zn), максимизирующая для каждой реализации Zn

функцию правдоподобия, т.е.

?(zn) = arg max L(zn, ?)

 

Способ построения МП-оценки называется методом максимального правдоподобия.

 

Пусть vi, i=1,s, - выборочные начальные моменты. Рассмотрим систему уравнений

vi (?)= vi, i=1,s

и предположим, что ее можно решить относительно параметров ?1,…, ?s, т.е. найти функции ?i=?i(v1,…, vs), i=1,s

Решением полученной системы уравнений ?i=?i(v1,…, vs), i=1,s, называется оценкой параметра ?, найденной по методу моментов, или ММ-оценкой.

6. Выборочные моменты

Пусть имеется выборка Zn=col(x1,.., xn) которая порождена СВ Х с функцией распределения Fx(x).

Для выборки Zn объема n выборочными начальными и центральными моментами порядка r СВ Х называются следующие СВ:

 

vr(n) = 1/n?(xk)r, r =1,2,….;

 

? r(n) = 1/n?(xk- vr(n))r, r =2,3,….;

 

Выборочным средним и выборочной дисперсией СВ Х называются соответственно:

 

mX(n)= v1(n) = 1/n?xk

 

dX(n)= ? 2(n) = 1/n?(xk- mX(n))2

 

7.Проверка гипотезы о законе распределения выборки по критерию согласия К. Пирсона (?2 - хи-квадрат)

 

СВ Х имеет распределение ?2 с r степенями свободы. Если ее можно представить в следующем виде Х = ?Хi2 , где Хi~ N(0; 1)

Х= ?2(r)

Плотность вероятности этой СВ имеет следующий график:

 

Критическая и доверительная область

Х= ?2(r)

Критической областью значений СВ Х называется промежуток на вещественной оси, в которой СВ Х попадает с некоторой малой вероятностью ?.

Это число ? называется уровнем значимости критической области.

S критическая область

P(XЄS) = ?<<1

S=R- S доверительная область

P(XЄS) = 1-? близка к 1

Для задания критической области S распределения Пирсона поступают следующим образом:

P(X ? ?кр2(r)) = ?

S = [?кр2(r); +?)

P(XЄ