Оценивание параметров распределения. Сравнения средних. Критерий Хи-квадрат
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
инять разряды.
Замечание 2. Критерий согласия применим не только в случае, когда гипотетическая функция распределения случайной величины? x полностью определена. Если она зависит от k неизвестных параметров, т.е. имеет вид F (x,a1,…,ak), и параметры a1,…,ak оцениваются по выборке методом максимального правдоподобия, то критерий согласия остается в силе, только входом в таблиц. служит величина l= k- r -1, где r - число неизвестных параметров теоретической функции распределения. Для нормального распределения r=2.
Замечания
Замечание 1. Число выборочных значений , i=1,… r в каждом разряде должно быть не менее 5-10. Если это условие не выполняется, рекомендуется объединять разряды.
Замечание 2. Критерий согласия применим не только в случае, когда гипотетическая функция распределения случайной величины полностью определена. Если она зависит от k неизвестных параметров, т.е. имеет вид , и параметры оцениваются по выборке методом максимального правдоподобия, то критерий согласия остается в силе, только входом в таблицу служит величина l=r-k-1.
4. Сравнение средних
Постановка задачи
В исследовательской работе большое значение имеет воспроизводимость результатов. Серии экспериментов неоднократно повторяют. Иногда оказывается, что средний результат в одной серии экспериментов заметно отличается от среднего результата в другой серии. При этом возникает вопрос, можно ли объяснить обнаруженное расхождение средних случайными ошибками эксперимента или оно вызвано какими-либо незамеченными или даже неизвестными закономерностями.
В промышленности задача сравнения средних часто возникает при выборочном контроле качества изделий, изготовленных на разных установках или при различных технологичных режимах. Например, приходиться сравнивать средние для решения вопроса о преимуществе нового технологического режима перед старым.
В простейшем варианте задача ставиться так. Произведено две серии независимых измерений, которые дали результаты соответственно и со средними значениями и , .Предполагается, что в каждой серии производиться измерение вполне определенной величины, т.е. что
(i=1,2,…, n)
(j=1,2,…, n)
Кроме того, предполагается, что ошибки измерений следуют нормальным законам с параметрами соответственно (0;s) и (0;s). Ставится вопрос о том, можно ли считать, что истинные значения измеряемых величин и совпадают, несмотря на расхождение их эмпирических оценок и . Для решения этого вопроса выдвигается гипотеза о том, что = (нуль-гипотеза). При этой гипотезе находят распределение разности -, сравниваемых средних (или какой-либо подходящей функции от нее). Далее задаются желаемой надежностью вывода R и строят критическую область, попадание в которую имеет пренебрежимо малую вероятность 1-R.
Если обнаруженное в эксперименте значение разности - попадет в критическую область, то следует считать, что это не может быть объяснено случайными причинами. При этом нуль-гипотезу о равенстве и следует опровергнуть (с надежностью вывода). В противном случае обнаруженное значение разности может быть объяснено случайными причинами и потому нет оснований отвергать нуль-гипотезу. Заметим, что это ни в какой мере не может служить доказательством равенства = (и если у исследователя остались сомнения в справедливости этого равенства, то следует произвести новые эксперименты, улучшив их точность или увеличив число).
Сравнение средних при известной точности измерений
Начнем с более простого случая, когда точно известны значения средних квадратических ошибок s и s для обеих серий измерений. Здесь можно воспользоваться тем, что при нуль-гипотезе средние и имеют нормальные распределения с параметрами соответственно и . Так как эти средние независимы, то их разность тоже имеет нормальное распределение параметрами -=0 и _. Поэтому Нормированная разность, т.е. величина
(1.38)
имеет простейшее нормальное распределение N (0; 1). Это позволяет рассчитать критическую область с помощью интеграла вероятностей. А именно, исходя из соотношения
(1.39)
можно установить границы критической области для величины t в виде , где , т.е. : значение _ определяется таблицей значений функции Лапласса. Таким образом при надежности Р критической областью для нормированной разности служит .
(1.40)
Сравнение средних при неизвестной точности измерений
В общем случае мы имеем лишь два ряда результатов измерений: и . По этим результатам мы находим средние значения и , которые служат оценками для и . По ним же мы оцениваем точность измерений, которая заранее неизвестна. Мы будем предполагать, что точность измерений в обеих сериях одинакова. Тогда для оценки дисперсии в обеих сериях мы можем использовать несмещенные точечные оценки:
или еще лучше,
(1.41)
Как и в п. 1.6.2, при нуль-гипотезе о равенстве = разность - распределена нормально с параметрами 0 и . Но теперь для построения нельзя воспользоваться интегралом вероятностей, так как неизвестно точное значение s. Воспользуемся распределением Стьюдента. Нормированная разность имеет простейшее нормальное распределение, а независимая от нее величина
имеет -распределение с k=n+n-2 степенями свободы. Поэтому отношение