Оценивание параметров распределения. Сравнения средних. Критерий Хи-квадрат
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
·ывается такое значение , при котором плотность достигает своего наибольшего значения. Мода может не существовать или определяться неоднозначно. Если мода существует и единственна, то соответствующее распределение называется унимодальным.
Нормальное распределение случайной величины
Наиболее часто встречающимся в теории вероятностей и приложениях является нормальное распределение. Основная особенность нормального распределения состоит в том, что оно является предельным распределением для многих другиъ распределений при выполнении некоторых условий, которые часто встречаются на пратике.
Нормальным распределением с параметрами (a,s), называется распределение вероятностей с плотностью распределения:
(1.1.21)
Если случайная величина имеет нормальное распределение с параметрами (a,s), то говорят что распределена . Математическое ожидание нормального распределения , дисперсия - . Кривая плотности распределения симметрична и унимодальна. Своего максимума она достигает в точке , так что является одновременно и математическим ожиданием, и модой, и медианой. При кривая имеет две точки перегиба.
В силу симметрии распределения все нечетные центральные моменты равны нулю, а четные
, (1.1.22)
где означает произведение всех нечетных чисел от 1 до .
Параметр а - центр нормального распределения. Он характеризует сдвиг кривой распределения вдоль оси Ох. Параметр (>0), называется стандартным отклонением, характеризует рассеяние случайной величины : с уменьшением кривая распределения сжимается вдоль оси Ох и выпячивается вверх вдоль вертикали х=а, что приводит к увеличению вероятности попадания случайной величины в любую фиксированную окрестность точки а.
2. Статистические оценки параметров распределения
Генеральной совокупностью называется множество возможных значений наблюдаемой случайной величины . Случайная выборка из генеральной совокупности - это совокупность независимых случайных величин , каждая из которых имеет то же самое распределения, что и генеральная совокупность.
Выборкой называется n-мерная случайная величина с независимыми одинаково распределенными компонентами xi, i=1,2,…, n. Число n называют объемом выборки.
Произвольная функция выборочных значений называется статистикой. Иными словами, статистика - это любая измеримая функция от случайной выборки.
Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.
Классификация оценок
- Статистика
называется состоятельной оценкой параметров , если, при , она стремится по вероятности к оцениваемому параметру
, при (1.2.1)
Состоятельность означает, что с увеличением объема выборки, качество оценки улучшается.
- Статистика
является несмещенной оценкой параметра , если при любом фиксированном n математическое ожидание оценки равно оцениваемому параметру
(*) (1.2.2)
Таким образом, оценка не дает систематичного завышения или занижения результатов. В другом случае оценка называется смещенной.
Соблюдение требования (*) не устранит ошибок, но гарантирует от получения систематических ошибок.
- Оценка
является асимптотически несмещенной, если выполняется условие
, при (1.2.3)
- Если в некотором классе несмещенных оценок параметра
, имеющих конечную дисперсию существует такая оценка , что неравенство
(1.2.4)
выполняется для всех оценок из этого класса, то говорят, что оценка является эффективной в данном классе. Иными словами, эффективная оценка - это оценка с минимальной дисперсией.
Для того, чтобы оценку можно было использовать вместо неизвестного параметра она должна быть состоятельной, несмещенной и эффективной.
Точечные оценки
Точечной оценкой неизвестного параметра называют функцию от выборочных значений случайной величины , реализация которой принимается в качестве неизвестного параметра .
Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя
, (1.2.5)
где ni - частота значения xi, - объем выборки.
Смещенной оценкой генеральной дисперсии служит выборочная средняя
. (1.2.6)
Более удобная формула
. (1.2.7)
Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия
. (1.2.8)
Более удобная формула
. (1.2.9)
Точечные оценки и нормального распределения:
; (1.2.10)
(1.2.11)
Точечная оценка определяется одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальные оценки параметров
Под интервальной оценкой понимают интервал , который называют доверительным. Границы доверительного интервала зависят от выборочных значений случайной величины . С заданной вероятностью доверительный интервал содержит истинное значение оцениваемого параметра,
Число? g является доверительной вероятностью и характеризует надежность полученной оценки: чем ближе g к единице, тем надежнее оценка (обычно выбир?/p>