Систематичний відбір
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
?юванні частки людей чоловічої статі дорівнює .
б) Оцінювання частки дітей
- Систематична вибірка кожної пятої людини
Тоді розподіл середнього має вигляд:
.
Дисперсія середнього систематичної вибірки дорівнює .
- 20%-ва проста випадкова вибірка
Якщо , тоді . Частка дітей дорівнює
Тоді дисперсія вибіркової частки простої випадкової вибірки дорівнює
Дисперсія простої випадкової вибірки при оцінюванні частки дітей дорівнює .
Відповідь: а) При оцінюванні частки людей чоловічої статі отримали, що . Дисперсія систематичної вибірки точніша за дисперсію 20%-ї простої випадкової вибірки. Але можна помітити, що вони майже рівні. б) При оцінюванні частки дітей отримали, що . В цьому випадку дисперсія 20%-ї простої випадкової вибірки є кращою ніж дисперсія систематичної вибірки.
РОЗДІЛ ІІ. ПОРІВНЯННЯ СИСТЕМАТИЧНОГО ВІДБОРУ, ПРОСТОГО ВИПАДКОВОГО ТА СТРАТИФІКОВАНОГО ВІДБОРІВ
2.1 Місто StatVillage
StatVillage це гіпотетичне місто, яке складається з окремих домогосподарств і використовується як база даних для студентів та аспірантів, що вивчають вибіркові методи.
Дані домогосподарств для StatVillage обирались навмання з результатів перепису сімей, що мешкали в домогосподарствах у місті Ванкувері, Британській Колумбії, Канаді у 1991 році. Сам перепис населення проходив шляхом анонімного анкетування. Бралися до уваги наступні характеристики:
- демографічні показники розмір домогосподарства та його склад за віком та статтю;
- показники доходу зайнятість, інвестиції, валові витрати, різні доходи домогосподарств та інші;
- житлові характеристики тип житла, рік побудови, своє житло чи орендоване, оціночна вартість, щомісячні витрати на розміщення та інші;
- характеристика двох головних членів сімї, які відповідають за добробут сімї вік, стать, професія, рідна мова, освіта, зайнятість і т.д;
Існують три конфігурації міста StatVillage:
- Maximal village складається зі 128 блоків, кожен з яких містить 8 домогосподарств (загальна кількість домогосподарств - 1024).
- Mini village складається з 60 блоків, кожен з яких містить 8 домогосподарств (загальна кількість домогосподарств 480).
- Micro village складається з 36 блоків, кожен з яких містить 8 домогосподарств (загальна кількість домогосподарств 288).
Кожен блок домогосподарств нумерується в певному порядку, а саме
Рис. 2.1.1 Нумерування блоку домогосподарств
Для того, щоб отримати дані з міста StatVillage, необхідно спочатку відмітити домогосподарства позначкою як показано на рисунку 2.1.2 (відмічено кожне 8-ме домогосподарство)
Рис. 2.1.2 Систематичної вибірка кожного восьмого домогосподарства
Після цього натискаємо кнопку Get the sample units і отримуємо код, який представлений на рис. 2.1.3
Рис. 2.1.3 Код отриманої вибірки
Отриманий код містить 36 стовбців, кожен з яких відповідає за окрему характеристику домогосподарства. Розшифровка коду наведена в додатку А.
2.2 Порівняння відборів
В своїй роботі я використовую другу конфігурацією StatVillage, а саме Mini Village, яка складається з 60-ти блоків. Для того, щоб порівняти точності систематичного, простого випадкового та стратифікованого відборів, я буду використовувати вибірки, добуті з 11-го та 13-го стовпців коду. Ці стовпці називаються TOTINCH та BUILTH, що є загальним доходом домогосподарства (включає в себе заробітну плату, пенсії, дівіденти та відсотки за депозитами і т.д.) та періодом побудови домогосподарства відповідно.
В результаті дослідження виявилось, що домогосподарства в StatVillage впорядковані за загальним доходом, а саме загальний дохід зменшується зі зростанням номеру домогосподарства. Логарифмічна регресія значуща. На рисунку 2.2.1 представлена діаграма розсіювання та логарифмічна регресія.
Рис. 2.2.1 Діаграма розсіювання
Рівняння регресії: F-статистика: Логарифмічна регресія значуща.
Порівняємо дисперсії середнього доходу домогосподарств при систематичному відборі кожного восьмого домогосподарства, простому випадковому відборі та стратифікованому відборі. Після отримання коду з 11-го стовпця (див. рис 2.1.3) запишемо дані в таблицю 2.2.1, розділивши на 60 страт.
Таблиця 2.2.1 Дані по 8-ми систематичним вибіркам
СтратаНомер систематичної вибірки (k=8)1234567812145003060002911782742002500002242302243082154482499832173777200000194322175879175000173058163673162425177266,83143140156667150750148433151774155215147700144781149807,54127600142800140900140000145148137400132998137526138046,5522814812770612940012710912436512432412628012230013870461162001200001203931200211175611168761164001312531198387112000116000116000116000115000115400114497115936115104,18110300114766121294117000112100110000110000109600113132,59105000110830112144108481108000108601105493105000107943,610108953165544114427105200122916102865105664102900116058,611100800102400113340101800124400100702102567105400106426,1121024001004001013001010001003331084709907099800101596,61398433994009895710087198719105833104889101700101100,314968309810098000107589960509600013079796193102444,9159770094728946009454293929937281072759393396304,381693100100850950299300093626101800923129361095415,8817900009308210863210122194304921001011509080096411,131887000900008884688697925938840088000888008904219855009634887483886159272886028860008625788619,88208400087073853201055489750385800856918512089506,88218517012000087893835148413483201830808300088749228247493489827208253010261482800829868208086461,6323800008400081777805398675981200808008000081884,38247985480000804008000011340079350800509437585928,6325784007900081268794008080079800795328611780539,6326762287807577600779857765077359791227709677639,3827757337700076149760008606978974853519599081408,2528747007640075853750007698390305870227552878973,8829740007494674961990158659084569773007480080772,6330848187358777909752107919372400730007211076028,3831710507209372200728007280071856721747123872026,38327050971400710001217627164771397724587075077615,3833751297000070800704008740074915700007080073680,534699006973173282737926947083568698337430072984,535676816910579079767796855071178680337240071600,6336677006840071570744007884367400670007714171556,753765