Систематичний відбір

Дипломная работа - Математика и статистика

Другие дипломы по предмету Математика и статистика

6596670367217668007500072439654006613268168,753865000693206500071800650007689066154655006808339696006530073111650656845769200644006522967545,2540630006720071943636526602064400639937074066368,541629006380063800628936320063200626976330663224,542635196250062763836436240062095659006972566568,1343623646161171443613046130061200619086500063266,2544922406140068700613556162360468611517953468308,8845712336161260800618006200060800609106000062394,3846589886037463684780656073359000594005940062455,5475840011195162227582247676158975580005845067873,548578005850062910669817150057400576005780061311,3849583545780058871585446021756358627635706058745,8850559005680057467751965547978122696995752763273,7551553505668562369550006530059148584007100060406,552616719151661052652775655056850735125600065303,55356467540006570073998597815578853530530005903354521915870057219554415353353300521635387954553,2555593915262158086558005550052475558185233555253,255651000517135927755347513335160053465518575319957505275456051000518575085950800545405070051855,3858534755050050460534269366950000550005080057166,2559495177185349400490004921475349485944958255313,6360479005749948000489924836048400506494910549863,1383852,8888407,386154,5886896,5387045,6783855,9883469,1883002,8512013750311735304438516927552137925222740503135950081514980168

У кожній страті міститься 1 блок, тобто 8 домогосподарств.

Знайдемо середнє та дисперсію для всієї популяції:

Тоді дисперсія оцінки середнього для простої випадкової вибірки має вид:

.

Середнє значення систематичної вибірки має розподіл

~

Оцінка є незміщеною оцінкою для , дійсно .

Дисперсія систематичної вибірки дорівнює

Тепер знайдемо дисперсію одиниць, що належать до однієї і тієї самої страти:

Дисперсія оцінки середнього для стратифікованої випадкової вибірки

.

Отже, ми отримали такі результати:

.

Це означає, що

.

 

При наявності логарифмічної залежності між загальним доходом та номером домогосподарства систематичний відбір виявився точнішим за простий випадковий та стратифікований відбори.

Тепер розглянемо дані, в яких відсутній тренд. Використовуємо вибірки, добуті з 13-го стовпця коду. Цей стовбець має назву BUILTH і відповідає за період побудови домогосподарства.

В результаті дослідження даної вибірки, виявилось, що залежність між періодом побудови та номером домогосподарства відсутня. Лінійна регресія не значуща. На рисунку 2.2.2 представлена діаграма розсіювання та відсутність лінійної регресії.

 

 

Рис. 2.2.2 Діаграма розсіювання

 

Рівняння регресії: F-статистика: Лінійна регресія не значуща

 

 

Порівняємо дисперсії середнього періоду побудови домогосподарства при систематичному відборі кожного восьмого домогосподарства, простому випадковому відборі та стратифікованому відборі. Після отримання коду з 13-го стовпця (див. рис 2.1.3) запишемо дані в таблицю 2.2.2, розділивши на 60 страт.

 

Таблиця 2.2.2 Дані по 8-ми систематичним вибіркам

СтратаНомер систематичної вибірки (k=8)123456781575275424,6252671571564,753726332754,3754627824334,3755457556485,56464577324,7573555474758545557665,3759444443523,751077575126511165272623,87512537673775,62513525617454,37514476556755,62515245454274,12516575557345,12517552556374,7518773275524,7519575523474,7520157854324,37521374575755,37522457526554,87523435556554,7524725414523,7525777754425,37526655254344,2527254725714,12528556274444,62529446576424,7530444536574,7531427655544,7532477275575,533577675425,37534265526554,535434251353,37536854563735,1253753552776538646534244,253917761657540427751354,2541766223454,37542535472544,37543552465344,254473545556545567556545,37546727737555,3754734455461448366451243,87549673723464,7550757524324,37551212645333,255237557544553777445414,87554316776585,37555475337534,6255633535517457464265554,6255835247632459535555344,37560437335764,754,554,755,184,74,634,624,44,4279,25273285311282278277264264

Знайдемо середнє та дисперсію для всієї популяції:

Тоді дисперсія оцінки середнього для простої випадкової вибірки має вид:

.

Середнє значення систематичної вибірки має розподіл

~

Також отримали, що .

Дисперсія систематичної вибірки дорівнює

Тепер знайдемо дисперсію одиниць, що належать до однієї і тієї самої страти:

Дисперсія оцінки середнього для стратифікованої випадкової вибірки

.

Отже, ми отримали такі результати:

.

Це означає, що

 

.

 

При відсутності тренду систематичний відбір виявився ефективнішим ніж стратифікований відбір, але менш точним ніж простий випадковий відбір. Якщо порівняти дисперсії систематичної та простої випадкової вибірок, то виявиться що вони дуже мало відрізняються. При випадковому порядку розміщення одиниць систематичний відбір в середньому рівносильний простому випадковому відбору (останнє підтверджує теоретичні положення підрозділу 1.3).

Для підвищення точності систематичного відбору, при дослідженні періоду побудови домогосподарства, застосуємо стратифікований систематичний відбір. Основна його ідея розглядалась у підрозділі 1.9. Отже, всю популяцію, яка складається з 60-ти блоків (по 8 домогосподарств у кожному), ділимо на 2 страти. В першій страті розміщуються з 1-го по 32-й блоки (тобто 256 домогосподарств), а в другій з 33-го по 60-й блоки (224 домогосподарства). З кожної страти здобуваємо систематичні вибірки кожної 8-ї одиниці. Всього комбінацій здобуття таких систематичних вибірок з двох страт 64 (8 комбінацій з першої страти та 8 з другої страти). Середнє значення стратифікованої систематичної вибірки рахується за формулою

 

,

 

де - це вага страти , а - середнє значення систематичної вибірки у страті .

Так як я буду розглядати 2 страти, то середнє значення стратифікованої систематичної вибірки має вигляд:

 

 

а для кожної систематичної вибірки у першій або другій страті своє.

Після розглядання всіх стратифікованих систематичних вибірок кожної 8-ї одиниці запишемо розподіл :

Також має місце рівність .

Дисперсія середнього стратифікованої систематичної вибірки дорівнює:

.

При застосуванні стратифікованого систематичного відбору для періоду побудови домогосподарства маємо наступні результати:

.

Це означає, що

 

.

 

При відсутності тренду страти