Оценивание параметров распределения. Сравнения средних. Критерий Хи-квадрат

Дипломная работа - Математика и статистика

Другие дипломы по предмету Математика и статистика

·ывается такое значение , при котором плотность достигает своего наибольшего значения. Мода может не существовать или определяться неоднозначно. Если мода существует и единственна, то соответствующее распределение называется унимодальным.

Нормальное распределение случайной величины

Наиболее часто встречающимся в теории вероятностей и приложениях является нормальное распределение. Основная особенность нормального распределения состоит в том, что оно является предельным распределением для многих другиъ распределений при выполнении некоторых условий, которые часто встречаются на пратике.

Нормальным распределением с параметрами (a,s), называется распределение вероятностей с плотностью распределения:

 

(1.1.21)

 

Если случайная величина имеет нормальное распределение с параметрами (a,s), то говорят что распределена . Математическое ожидание нормального распределения , дисперсия - . Кривая плотности распределения симметрична и унимодальна. Своего максимума она достигает в точке , так что является одновременно и математическим ожиданием, и модой, и медианой. При кривая имеет две точки перегиба.

В силу симметрии распределения все нечетные центральные моменты равны нулю, а четные

 

, (1.1.22)

 

где означает произведение всех нечетных чисел от 1 до .

Параметр а - центр нормального распределения. Он характеризует сдвиг кривой распределения вдоль оси Ох. Параметр (>0), называется стандартным отклонением, характеризует рассеяние случайной величины : с уменьшением кривая распределения сжимается вдоль оси Ох и выпячивается вверх вдоль вертикали х=а, что приводит к увеличению вероятности попадания случайной величины в любую фиксированную окрестность точки а.

2. Статистические оценки параметров распределения

 

Генеральной совокупностью называется множество возможных значений наблюдаемой случайной величины . Случайная выборка из генеральной совокупности - это совокупность независимых случайных величин , каждая из которых имеет то же самое распределения, что и генеральная совокупность.

Выборкой называется n-мерная случайная величина с независимыми одинаково распределенными компонентами xi, i=1,2,…, n. Число n называют объемом выборки.

Произвольная функция выборочных значений называется статистикой. Иными словами, статистика - это любая измеримая функция от случайной выборки.

Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.

Классификация оценок

  1. Статистика

    называется состоятельной оценкой параметров , если, при , она стремится по вероятности к оцениваемому параметру

  2.  

, при (1.2.1)

 

Состоятельность означает, что с увеличением объема выборки, качество оценки улучшается.

  1. Статистика

    является несмещенной оценкой параметра , если при любом фиксированном n математическое ожидание оценки равно оцениваемому параметру

  2.  

(*) (1.2.2)

Таким образом, оценка не дает систематичного завышения или занижения результатов. В другом случае оценка называется смещенной.

Соблюдение требования (*) не устранит ошибок, но гарантирует от получения систематических ошибок.

  1. Оценка

    является асимптотически несмещенной, если выполняется условие

  2.  

, при (1.2.3)

 

  1. Если в некотором классе несмещенных оценок параметра

    , имеющих конечную дисперсию существует такая оценка , что неравенство

  2.  

(1.2.4)

 

выполняется для всех оценок из этого класса, то говорят, что оценка является эффективной в данном классе. Иными словами, эффективная оценка - это оценка с минимальной дисперсией.

Для того, чтобы оценку можно было использовать вместо неизвестного параметра она должна быть состоятельной, несмещенной и эффективной.

Точечные оценки

Точечной оценкой неизвестного параметра называют функцию от выборочных значений случайной величины , реализация которой принимается в качестве неизвестного параметра .

Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя

, (1.2.5)

 

где ni - частота значения xi, - объем выборки.

Смещенной оценкой генеральной дисперсии служит выборочная средняя

 

. (1.2.6)

 

Более удобная формула

 

. (1.2.7)

 

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия

 

. (1.2.8)

 

Более удобная формула

 

. (1.2.9)

 

Точечные оценки и нормального распределения:

; (1.2.10)

(1.2.11)

 

Точечная оценка определяется одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальные оценки параметров

Под интервальной оценкой понимают интервал , который называют доверительным. Границы доверительного интервала зависят от выборочных значений случайной величины . С заданной вероятностью доверительный интервал содержит истинное значение оцениваемого параметра,

 

 

Число? g является доверительной вероятностью и характеризует надежность полученной оценки: чем ближе g к единице, тем надежнее оценка (обычно выбир?/p>