Задача №1

В таблице 1 содержатся данные о числе Y жителей N = 40 городов страны. Города разделены на два слоя: в первом слое – 10 наиболее крупных, во втором – все остальные города. С помощью таблицы случайных чисел сформировать следующие выборки, состоящие из n = 16 городов:

1. расслоенную выборку с пропорциональным размещением;

2. расслоенную выборку, содержащую одинаковое число единиц каждого слоя;

3. простую (нерасслоенную) случайную выборку.


Найти по каждой из этих выборок:

а) оценку среднего числа жителей всех 40 городов;

б) среднюю ошибку и 95% доверительный интервал для этой оценки;

в) оценку суммарного числа жителей всех 40 городов;

г) среднюю ошибку и 95% доверительный интервал для этой оценки.


Найти истинное значение среднего и суммарного значения по всем 40 городам. Какая выборка дала более точные результаты?

Таблица 1 (тыс. жит.):

1

2

3

4

5

6

7

8

9

10

Y

915

706

666

575

533

519

505

499

442

433

1

2

3

4

5

6

7

8

9

10

Y

432

414

376

374

356

353

334

326

310

298


11

12

13

14

15

16

17

18

19

20


290

281

279

277

271

256

254

250

248

1383


21

22

23

24

25

26

27

28

29

30


239

231

236

234

231

228

226

224

222

218


Решение:

1. Построим расслоенную выборку с пропорциональным размещением.

Наиболее широко применяемый способ заключается в том, что объемы выборок из групп устанавливаются пропорционально объемам соответствующих типических групп, т. е.


В итоге для расчетов получается такая формула:


где ni - объем выборки из i - й типической группы; n - общий объем выборки из генеральной совокупности; Ni - объем i - й типической группы; N - объем генеральной совокупности.

В нашем случае из первой группы мы должны выбрать:


из второй:


С помощью таблицы случайных величин отбираем числа:

Для первой группы – 1, 9, 2, 5

Для второй группы- 22,9,26,2,1,27,25,20,4,11,15,12


Среднее число жителей для первой группы:


Среднее число жителей для второй группы:


Тогда общая средняя равна:


Дисперсия среднего числа жителей первой группы равна:


Второй группы:


Средняя ошибка выборочной средней определяется по следующей формуле:


Предельная ошибка Д вычисляется на основе знания средней ошибки м по формуле:


где t - величина, вычисляемая по специальной таблице.

Пусть Р=0,95. Этому значению Р по табл. 1 приложения соответствует t=2. имеем Д=2*15,15=30,3 т. е. предельная ошибка выборки равна приблизительно 30,3.

Переходим к определению пределов. Чтобы вычислить нижний предел, нужно из выборочной средней вычесть предельную ошибку выборки:

453,56—30,3=423,26

Верхний предел получаем, прибавив к выборочной средней предельную ошибку:

453,56+30,3=483,86

Тогда имеем следующие пределы для генеральной средней :


2. Построим расслоенную выборку, содержащую одинаковое число единиц каждого слоя.

С помощью таблицы случайных величин отбираем числа:

Для первой группы – 1, 9, 2, 5, 6, 3, 7, 4;

Для второй группы- 9,26,2,27,25,4,11,12.

Среднее число жителей для первой группы:


Среднее число жителей для второй группы:


Тогда общая средняя равна:


Дисперсия среднего числа жителей первой группы равна:


Второй группы:


Средняя ошибка выборочной средней определяется по следующей формуле: