Задача №1
В таблице 1 содержатся данные о числе Y жителей N = 40 городов страны. Города разделены на два слоя: в первом слое – 10 наиболее крупных, во втором – все остальные города. С помощью таблицы случайных чисел сформировать следующие выборки, состоящие из n = 16 городов:
1. расслоенную выборку с пропорциональным размещением;
2. расслоенную выборку, содержащую одинаковое число единиц каждого слоя;
3. простую (нерасслоенную) случайную выборку.
Найти по каждой из этих выборок:
а) оценку среднего числа жителей всех 40 городов;
б) среднюю ошибку и 95% доверительный интервал для этой оценки;
в) оценку суммарного числа жителей всех 40 городов;
г) среднюю ошибку и 95% доверительный интервал для этой оценки.
Найти истинное значение среднего и суммарного значения по всем 40 городам. Какая выборка дала более точные результаты?
Таблица 1 (тыс. жит.):
№
1
2
3
4
5
6
7
8
9
10
Y
915
706
666
575
533
519
505
499
442
433
№
1
2
3
4
5
6
7
8
9
10
Y
432
414
376
374
356
353
334
326
310
298
11
12
13
14
15
16
17
18
19
20
290
281
279
277
271
256
254
250
248
1383
21
22
23
24
25
26
27
28
29
30
239
231
236
234
231
228
226
224
222
218
Решение:
1. Построим расслоенную выборку с пропорциональным размещением.
Наиболее широко применяемый способ заключается в том, что объемы выборок из групп устанавливаются пропорционально объемам соответствующих типических групп, т. е.
В итоге для расчетов получается такая формула:
где ni - объем выборки из i - й типической группы; n - общий объем выборки из генеральной совокупности; Ni - объем i - й типической группы; N - объем генеральной совокупности.
В нашем случае из первой группы мы должны выбрать:
из второй:
С помощью таблицы случайных величин отбираем числа:
Для первой группы – 1, 9, 2, 5
Для второй группы- 22,9,26,2,1,27,25,20,4,11,15,12
Среднее число жителей для первой группы:
Среднее число жителей для второй группы:
Тогда общая средняя равна:
Дисперсия среднего числа жителей первой группы равна:
Второй группы:
Средняя ошибка выборочной средней определяется по следующей формуле:
Предельная ошибка Д вычисляется на основе знания средней ошибки м по формуле:
где t - величина, вычисляемая по специальной таблице.
Пусть Р=0,95. Этому значению Р по табл. 1 приложения соответствует t=2. имеем Д=2*15,15=30,3 т. е. предельная ошибка выборки равна приблизительно 30,3.
Переходим к определению пределов. Чтобы вычислить нижний предел, нужно из выборочной средней вычесть предельную ошибку выборки:
453,56—30,3=423,26
Верхний предел получаем, прибавив к выборочной средней предельную ошибку:
453,56+30,3=483,86
Тогда имеем следующие пределы для генеральной средней :
2. Построим расслоенную выборку, содержащую одинаковое число единиц каждого слоя.
С помощью таблицы случайных величин отбираем числа:
Для первой группы – 1, 9, 2, 5, 6, 3, 7, 4;
Для второй группы- 9,26,2,27,25,4,11,12.
Среднее число жителей для первой группы:
Среднее число жителей для второй группы:
Тогда общая средняя равна:
Дисперсия среднего числа жителей первой группы равна:
Второй группы:
Средняя ошибка выборочной средней определяется по следующей формуле: