Теория статистики (Станкин)

Информация - Математика и статистика

Другие материалы по предмету Математика и статистика

Вµристик позволяет установить наивероятные границы нахождения соответствующих генеральных показателей:

для средней: ,

где - генеральная средняя;

- выборочная средняя;

- ошибка выборочной средней;

для доли: p = ,

где p - генеральная доля;

- выборочная доля (частость);

- ошибка выборочной доли.

Пример. С вероятностью 0,954 нужно определить границы среднего веса пачки чая для всей партии, поступившей в торговую сеть, если контрольная выборочная проверка дала следующие результаты (первые две графы табл. 10.1).

Таблица 10.1

Результаты взвешивания чая

Вес, г (x)Количество пачек (m)Раiетные графыxmxm(x)2m48 - 4920-12-2249 - 5050050050 - 5120+122251 - 5210+2124Итого:1001028

1. Средний вес пачки чая по выборке:

= K + x0 = 1 + 49,5 = 49,7 г.

2. Выборочная дисперсия веса пачки чая:

?2 = = = 0,76.

3. Средняя ошибка выборочной средней:

= = = 0,087 г.

4. Предел для ошибки с вероятностью 0,954:

= 2 = 0,174 г 0,2 г.

5. Границы генеральной средней:

= = 49,7 0,2 г.

Таким образом, с вероятностью 0,954 можно утверждать, что вес пачки чая в среднем для всей партии не более 49,9 г и не менее 49,5 г.

Определение объема выборки при заданной ее точности является проблемой, обратной рассмотренной нами - определению ошибки выборки при данном ее объеме. Формула объема выборки получается из соответствующей формулы предельной ошибки. Так, получаем для индивидуального бесповторного отбора:

n =;

группового бесповторного отбора:

r =.

При решении задач на определение необходимого объема выборки следует иметь в виду, что вместо генеральной дисперсии определенного вида берется ее оценка - примерное значение, полученное из того или иного источника. Рассмотрим следующий общий пример.

Пример. Нужно определить абсолютный и относительный объемы индивидуального отбора для исследования генеральной доли, чтобы ошибка частости с вероятностью 0,954 не превышала 0,02, если выборка производится из генеральной совокупности объема: а) 1000; б) 100000 единиц.

Используя формулу n =, в которой полагаем t = 2 (гарантийная вероятность равна 0,954), а pq = 0,25, имеем:

а) n = = 714, или 71,4%;

б) n = = 2439, или 2,44%.

Тема 11. Законы распределения

Конечной целью обработки информации методами математической статистика, если речь идет о больших выборках, является получение закона распределения исследуемой случайной величины. Это связано с тем, что закон распределения является фактически, тем аппаратом, который позволяет определить вероятность появления (или, наоборот, непоявления) случайной величины в тот или иной период времени или вероятность того, что случайная величина попадет в тот или иной интервал ее возможных значении. Этот этап статистической обработки является одним из наиболее важных, так как ошибка при выборе того или иного закона распределения приводит к ошибкам при дальнейшем решении практических задач.

Если проанализировать все этапы статистической обработки, то можно сделать вывод, что влекущими за собой наиболее существенные ошибки, а, следовательно, наиболее ответственными, являются этапы, на которых решаются следующие задачи:

1. Возможно ли объединение нескольких малых или средних выборок в одну.

2. Отбрасывать или учитывать резко отличающиеся результаты.

3. Справедливо ли сделанное предположение о законе распределения случайной величины.

Рассмотрим эти этапы более подробно.

1. Так как для установления закона распределения необходимы большие выборки, то на практике часто встает вопрос об объединении нескольких выборок, каждая из которых мала для решения поставленной задачи и получения одной общей выборки, удовлетворяющей предъявленным к ней требованиям. Поэтому, что вообще свойственно для статистической обработки, любое из неправильных решений (как положительное, так и отрицательное) по поводу объединения выборок приводит к нежелательным результатам, или к невозможности установить закон распределения, если выборки не объединяются, или к неправильному выводу о характере закона распределения.

Для решения этой задачи используют критерии, с помощью которых с разной формулировкой фактически дается ответ на один и тот же вопрос: принадлежат или не принадлежат исследуемые выборки одной генеральной совокупности, то есть автоматически решается задача о возможности или невозможности их объединения. Как правило, все эти критерии основаны на сравнении выборочных характеристик (выборочных дисперсий или средних величин) между собой или с соответствующими генеральными характеристиками. В большинстве случаев использование этих критериев предполагает нормальный или логарифмически-нормальный закон распределения для каждой выборки. При других же законах распределения эти критерии некорректны и их использование может привести к ошибочным результатам.

Наиболее используемыми являются следующие критерии:

а) критерии, основанные на сравнении дисперсий: критерий , критерий Фишера (F = ), критерий Хартлея (Fmax = ), критерий Кочрена (Gmax = ), критерий Бартлета (?2);

б) критерии, основанные на сравнениях средних величин: критерий Стьюдента (t), критерий Z и другие.

Для всех критериев в качестве нулевой гипотезы (H0) выдвигается предположение о принадлежности выборки генеральной совокупности или об однородности выборок между собой.

2. При наличии выборки, удовлетворяющей требованиям относительно ее пригодности для установления закона распределения перед тем, как приступить к определению статистичес