Систематичний відбір
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
°зити у вигляді
Отже,
Якщо
,
то неважко показати, що кожний член всередині дужок додатний. Теорема доведена.
Середня відстань між одиницями дорівнює як для систематичної вибірки, так і для стратифікованої вибірки, але завдяки умові випуклості стратифікована вибірка більш програє у точності, коли відстань між одиницями менше , ніж виграє, коли ця відстань більше .
В 1949 році Кенуй показав, що нерівності, які містяться у твердженні теореми 1.6.1, залишаються справедливими, якщо зробити менш жорсткими дві умови (1.6.1), а саме
.
В цьому випадку кожна з трьох середніх дисперсій для надпопуляції збільшується в однаковому ступені.
1.7 Реальні популяції
Дослідження були проведені для різних реальних популяцій. Деякі з цих досліджень наведені в таблиці 1.7.1. Перші три дослідження проводилися за допомогою географічних мап. У першому з них популяція складається з 288 значень висот точок, які знаходяться на відстані 0,1 милі одна від одної у гірській місцевості.
У двох наступних популяціях даними є долі довжин відрізків прямих, які проведені на мапі з розфарбуванням, що приходяться на області з визначеним покриттям (під травою, лісом і т.п.). Ці приклади можна вважати найбільш близькими до моделей з неперервною у строгому сенсі варіацією.
Наступні три дослідження засновані на показах температури на протязі 192 послідовних днів у наступних точках: (а) 12 дюймів під поверхнею трави, (б) 4 дюйма під поверхнею землі, (в) у повітрі. Ці три дослідження відображають три різних ступені впливу (у напрямку збільшення) на характеристику, що вивчаються, а саме - нестійкі щоденні зміни погоди та повільні сезонні зміни.
У останніх дослідженнях спостерігались рослини або дерева, що ростуть у послідовних точках, які розташовані вздовж деякої лінії. При обстеженні картоплі, типовою для цієї групи, скінчена популяція складається зі значень врожаю на 96 грядках деякого поля.
У деяких обстеженнях порівнювали з для стратифікованої випадкової вибірки з обємом страт і двома одиницями у кожній страті. Таке порівняння є цікавим, оскільки за даними вибірки можна дістати незміщену оцінку . Для (з обємом страти і однією одиницею у кожній страті) або для її отримати неможна. У більшості джерел безпосереднє порівняння з у явному вигляді не проводиться, але взагалі дає виграш у точності у порівнянні з .
У роботах Йетса та Фінні порівняння проводиться відносно цілої низки значень та для кожної скінченої популяції.
Таблиця 1.7.1 Реальні популяції, що вивчені при аналізі систематичного відбору
АвторОбсяг популяції
Вид данихYates (1948)288Значення висот у точках, що знаходяться на відстані 0,1 милі одна від одної, отримані за мапою англійського державного картографічного управлінняOsborne (1942)*Відсоток площі під (а) оброблюваною землею, (б) чагарником, (в) травою, (г) лісом на паралельних прямих, які проведені на мапі з розфарбуваннямOsborne (1942)*Відсоток площі під ялиною Дугласа, який підрахований за допомогою паралельних прямих, що проведені на мапі з розфарбуваннямYates (1948)192Температура ґрунту (12 дюймів під поверхнею трави) на протязі 192 послідовних днівYates (1948)192Температура ґрунту (4 дюймів під поверхнею землі) на протязі 192 послідовних днівYates (1948)192Температура повітря на протязі 192 послідовних днівYates (1948)96Врожай картоплі на 96 грядкахFinney (1948)160Обєм лісу, придатного до продажу, у розрахунку на ділянку шириною у 3 ряди та змінної довжини (Mt. Stuart forest)Finney (1948)288Обєм підростаючого лісу на ділянку шириною у 2,5 ряди та довжиною у 80 рядів (Blacks Mountain forest)Finney (1950)292Обєм лісу на ділянку шириною в 2 ряди та змінної довжини (Dehra Dun forest)Johnson (1943)400**Число саджанців на 1 фут довжини гряди для 4 гряд саджанців листяних порідJohnson (1943)400**Число саджанців на 1 фут довжини гряди для 3 гряд саджанців хвойних порідJohnson (1943)400**Число пересаджених дерев хвойних порід на 1 фут довжини гряди для 6 гряд
* Теоретично нескінчене, якщо вважати, що товщина прямих нескінченно мала
** Наближено. Насправді це число змінювалось від гряди до гряди.
Для цих випадків дані таблиці 1.7.2 є геометричним середнім відношень дисперсій для окремих значень . Інші автори проводили порівняння тільки для одного значення у кожній популяції, але іноді приводили данні для різних ознак або декількох реальних популяцій одного і того ж характеру. При цьому знову бралось геометричне середнє з відношень дисперсій.
Таблиця 1.7.2 Відносна точність систематичного та стратифікованого випадкового відбору
ДанніРозмах значень
Відносна точність систематичного відбору в порівнянні зі стратифікованим відборомВисоти2 ? 202,995,68Відсоток площі
(4 типів покриття)??4,42Відсоток площі під ялиною Дугласа??1,83Температура ґрунту (12 дюймів)2 ? 242,424,23Температура ґрунту (4 дюйма)4 ? 241,452,07Температура повітря4 ? 241,261,65Картопля3 ? 161,371,90Обєм лісу (Mt. Stuart)2 ? 321,071,35Обєм лісу
(Blacks Mt)2 ? 241,191,44Обєм лісу
(Dehra Dun)2 ? 321,391,89Листяні саджанці14?1,89Хвойні саджанці14 ? 24?2,22Пересадженні хвойні дерева12 ? 22?0,93
Хоча ці данні обмежені за масштабами, результати справляють враження. В тих дослідженнях, де можливе порівняння з , систематична вибірка незмінно дає, хоча і помірний, але цілком відчутний виграш у точності. Медіанне значення відношень дорівнює 1,4. Виграш у точності у порівнянні з суттєвіший, тут медіанне значення відношень дорівнює 1,9. Характер знайдених результатів взагалі відповідає очікуваному, хоча зважаючи на невелику кількість обстеж