Систематичний відбір

Дипломная работа - Математика и статистика

Другие дипломы по предмету Математика и статистика

?юванні частки людей чоловічої статі дорівнює .

б) Оцінювання частки дітей

  • Систематична вибірка кожної пятої людини

Тоді розподіл середнього має вигляд:

.

Дисперсія середнього систематичної вибірки дорівнює .

  • 20%-ва проста випадкова вибірка

Якщо , тоді . Частка дітей дорівнює

Тоді дисперсія вибіркової частки простої випадкової вибірки дорівнює

Дисперсія простої випадкової вибірки при оцінюванні частки дітей дорівнює .

Відповідь: а) При оцінюванні частки людей чоловічої статі отримали, що . Дисперсія систематичної вибірки точніша за дисперсію 20%-ї простої випадкової вибірки. Але можна помітити, що вони майже рівні. б) При оцінюванні частки дітей отримали, що . В цьому випадку дисперсія 20%-ї простої випадкової вибірки є кращою ніж дисперсія систематичної вибірки.

 

РОЗДІЛ ІІ. ПОРІВНЯННЯ СИСТЕМАТИЧНОГО ВІДБОРУ, ПРОСТОГО ВИПАДКОВОГО ТА СТРАТИФІКОВАНОГО ВІДБОРІВ

 

2.1 Місто StatVillage

 

StatVillage це гіпотетичне місто, яке складається з окремих домогосподарств і використовується як база даних для студентів та аспірантів, що вивчають вибіркові методи.

Дані домогосподарств для StatVillage обирались навмання з результатів перепису сімей, що мешкали в домогосподарствах у місті Ванкувері, Британській Колумбії, Канаді у 1991 році. Сам перепис населення проходив шляхом анонімного анкетування. Бралися до уваги наступні характеристики:

  • демографічні показники розмір домогосподарства та його склад за віком та статтю;
  • показники доходу зайнятість, інвестиції, валові витрати, різні доходи домогосподарств та інші;
  • житлові характеристики тип житла, рік побудови, своє житло чи орендоване, оціночна вартість, щомісячні витрати на розміщення та інші;
  • характеристика двох головних членів сімї, які відповідають за добробут сімї вік, стать, професія, рідна мова, освіта, зайнятість і т.д;

Існують три конфігурації міста StatVillage:

  • Maximal village складається зі 128 блоків, кожен з яких містить 8 домогосподарств (загальна кількість домогосподарств - 1024).
  • Mini village складається з 60 блоків, кожен з яких містить 8 домогосподарств (загальна кількість домогосподарств 480).
  • Micro village складається з 36 блоків, кожен з яких містить 8 домогосподарств (загальна кількість домогосподарств 288).

Кожен блок домогосподарств нумерується в певному порядку, а саме

 

Рис. 2.1.1 Нумерування блоку домогосподарств

 

Для того, щоб отримати дані з міста StatVillage, необхідно спочатку відмітити домогосподарства позначкою як показано на рисунку 2.1.2 (відмічено кожне 8-ме домогосподарство)

 

Рис. 2.1.2 Систематичної вибірка кожного восьмого домогосподарства

 

Після цього натискаємо кнопку Get the sample units і отримуємо код, який представлений на рис. 2.1.3

 

Рис. 2.1.3 Код отриманої вибірки

 

Отриманий код містить 36 стовбців, кожен з яких відповідає за окрему характеристику домогосподарства. Розшифровка коду наведена в додатку А.

 

2.2 Порівняння відборів

 

В своїй роботі я використовую другу конфігурацією StatVillage, а саме Mini Village, яка складається з 60-ти блоків. Для того, щоб порівняти точності систематичного, простого випадкового та стратифікованого відборів, я буду використовувати вибірки, добуті з 11-го та 13-го стовпців коду. Ці стовпці називаються TOTINCH та BUILTH, що є загальним доходом домогосподарства (включає в себе заробітну плату, пенсії, дівіденти та відсотки за депозитами і т.д.) та періодом побудови домогосподарства відповідно.

В результаті дослідження виявилось, що домогосподарства в StatVillage впорядковані за загальним доходом, а саме загальний дохід зменшується зі зростанням номеру домогосподарства. Логарифмічна регресія значуща. На рисунку 2.2.1 представлена діаграма розсіювання та логарифмічна регресія.

 

 

Рис. 2.2.1 Діаграма розсіювання

 

Рівняння регресії: F-статистика: Логарифмічна регресія значуща.

 

Порівняємо дисперсії середнього доходу домогосподарств при систематичному відборі кожного восьмого домогосподарства, простому випадковому відборі та стратифікованому відборі. Після отримання коду з 11-го стовпця (див. рис 2.1.3) запишемо дані в таблицю 2.2.1, розділивши на 60 страт.

 

Таблиця 2.2.1 Дані по 8-ми систематичним вибіркам

СтратаНомер систематичної вибірки (k=8)1234567812145003060002911782742002500002242302243082154482499832173777200000194322175879175000173058163673162425177266,83143140156667150750148433151774155215147700144781149807,54127600142800140900140000145148137400132998137526138046,5522814812770612940012710912436512432412628012230013870461162001200001203931200211175611168761164001312531198387112000116000116000116000115000115400114497115936115104,18110300114766121294117000112100110000110000109600113132,59105000110830112144108481108000108601105493105000107943,610108953165544114427105200122916102865105664102900116058,611100800102400113340101800124400100702102567105400106426,1121024001004001013001010001003331084709907099800101596,61398433994009895710087198719105833104889101700101100,314968309810098000107589960509600013079796193102444,9159770094728946009454293929937281072759393396304,381693100100850950299300093626101800923129361095415,8817900009308210863210122194304921001011509080096411,131887000900008884688697925938840088000888008904219855009634887483886159272886028860008625788619,88208400087073853201055489750385800856918512089506,88218517012000087893835148413483201830808300088749228247493489827208253010261482800829868208086461,6323800008400081777805398675981200808008000081884,38247985480000804008000011340079350800509437585928,6325784007900081268794008080079800795328611780539,6326762287807577600779857765077359791227709677639,3827757337700076149760008606978974853519599081408,2528747007640075853750007698390305870227552878973,8829740007494674961990158659084569773007480080772,6330848187358777909752107919372400730007211076028,3831710507209372200728007280071856721747123872026,38327050971400710001217627164771397724587075077615,3833751297000070800704008740074915700007080073680,534699006973173282737926947083568698337430072984,535676816910579079767796855071178680337240071600,6336677006840071570744007884367400670007714171556,753765