Дніпропетровська академія управління, бізнесу та права

Вид материалаДокументы

Содержание


Простий випадковий відбір
Типовий (районований) відбір
Критерій Пірсона
Критерій Романовського
Критерій Вілкоксона
Подобный материал:
1   2   3   4   5   6   7   8
8.1. Суть і теоретичні основи

Вибірковим називають таке спостереження, в ході якого на основі обстеження певної частини генеральної сукупності одержують дані для характеристики всієї сукупності. Щоб одержати об’єктивні характеристики всієї сукупності, слід забезпечити відбір її одиниць згідно з певними науково обгрунтованими правилами. Одне з правил полягає в дотриманні діалектичної єдності одиничного, особливого та загального, а в загальному — одиничного й особливого. Отже, за одиничним та особливим можна судити про загальне, за частиною — про ціле.

Об’єктивність вивчення забезпечується рівними можливостями попадання у вибіркову сукупність з генеральної сукупності певного числа її одиниць на основі використання рекомендацій математичної статистики. Теоретичні основи вибіркового методу розглянуті в роботах видатних математиків Я. Бернуллі (1654—1705), П. Лапласа (1749—1827), К. Гаусса (1777—1855), С. Пуассона (1781—1840). Вивчення цього методу знайшло продовження у працях вітчизняних математиків і статистиків радянського періоду.

Науковий підхід до вивчення сукупності забезпечує об’єктивність, дозволяє встановити межі можливих помилок і на цій основі — межі значень досліджуваних показників генеральної сукупності.

Вибіркове спостереження, порівняно із суцільним, має ряд переваг:

1) оперативніше за суцільне, скорочує терміни одержання кінцевих результатів обстеження, забезпечуючи дійовий контроль на базі одержаних матеріалів;

2) сприяє економії усіх видів ресурсів (матеріальних, трудових, грошових тощо), оскільки зменшує обсяг статистичної роботи на стадії збирання та узагальнення інформації;

3) дає можливість більш детального вивчення вибіркової сукупності та її поглибленої характеристики;

4) дозволяє підібрати більш кваліфікованих фахівців для проведення спостереження і забезпечити якісну інформацію;

5) забезпечує мінімум пошкоджень і втрат при вивченні якості товарів і продуктів відповідно до державних стандартів (вміст поживних і шкідливих речовин, міцність і т. ін.).

Цей метод знайшов широке розповсюдження, наприклад, у такому важливому розділі статистики, як вивчення сімейного бюджету.

В окремих випадках суцільне і вибіркове спостереження поєднують з метою додаткового вивчення певного кола питань. Так, при проведенні перепису населення вибірково вивчались житлові умови громадян (період спорудження будинку, тип житлового приміщення, число кімнат, розмір площі і т. ін.). Прикладом вибіркового спостереження можуть служити результати екзамену з будь-якої навчальної дисцип­ліни, статистики в тому числі.

На основі 2—5 питань або тестування виставляється оцінка за курс в цілому. Об’єктивність оцінки досягається добором питань різної складності, з різних тем.

Реформування сфери державної статистики, підвищення вимог до неї зумовлюють одержання більш якісної інформації у коротші терміни та при менших витратах коштів на її одержання. Практика статистичних органів свідчить, що науково обгрунтовані вибіркові обстеження, як це не парадоксально, дають більш надійну інформацію, ніж суцільні спостереження. Це стосується таких важливих питань, як економічна активність населення, діяльність суб’єктів малого бізнесу, сімейні бюджети тощо.

Головне у забезпеченні статистично достовірних характеристик —проведення попередньої типізації одиниць спостереження. Це повною мірою обумовлює типовість характеристик і практичну цінність одержаної інформації.

Як приклад — забезпечення всебічного статистичного спостереження за діяльністю різних типів підприємств, за процесами виробництва та продажу продукції, вивчення фінансово-майнового становища підприємств, витрат на виробництво і реалізацію товарів та послуг, стану розрахунків, інвестицій, чисельності персоналу та особливостей його використання.

Вибіркова і генеральна сукупності не зовсім адекватні. Вони мають розбіжності між характеристиками середнього рівня, частини і дисперсії щодо кожної з них.

8.2. Види та схеми відбору

Точність характеристик генеральної сукупності залежить певною мірою від схеми відбору одиниць вибіркового спостереження. У практиці використовують найчастіше чотири види відбору: простий випадковий, механічний, типовий і серійний.

Простий випадковий відбір передбачає формування вибіркової сукупності у випадковому порядку (наприклад, методом жеребкування). Попередня робота зводиться до заготовлення жетонів, білетів з порядковими номерами, із сукупностей яких вибирається об’єктивно необ­хідна для спостереження кількість одиниць. Класичним прикладом такого відбору є розігрування лотерейних білетів.

Суть механічного відбору полягає в тому, що генеральну сукупність попередньо формують у певному порядку (наприклад, за алфавітом, розміщенням тощо), а потім механічно, через відповідний інтервал, відбирають одиниці вибіркової сукупності. Скажімо, якщо необхідно провести певне дослідження у студентських групах 2-го курсу (10% вибірки), то відбирається за алфавітом, залежно від початку рахунку, кожний 5, 15, 25-й і т. д. студент.

Типовий (районований) відбір базується на розподілі генеральної сукупності на якісно однорідні групи. З кожної такої групи простим випадковим або механічним способом відбирається певна кількість одиниць (пропорційно питомій вазі групи в генеральній сукупності).

Припустімо, необхідно дослідити бюджет часу студентів вузу. Перш за все виділимо однорідні групи — за факультетами, спеціальностями, курсами, щодо кожного курсу — за рівнем оцінок («відмінно» і «добре»; змішані показники, «задовільно» та «незадовільно»). При такому підході за основу беремо диференціацію за середнім балом або рейтинговою оцінкою. Безумовно, такий вид відбору забезпечує більш об’єктивні характеристики, точніші результати з меншою часткою помилок, оскільки спостереженням охоплено представників усіх типових груп.

При серійному (гніздовому) відборі вибіркова сукупність складається не з окремих одиниць, а цілих груп, серій, гнізд, відібраних простим випадковим механічним способом. Щодо відібраних серій проводиться суцільне спостереження з подальшим узагальненням результатів.

Прикладом такого роду спостережень може бути вивчення якості знань студентів (або залишкового рівня) на основі дослідження цілих груп, відібраних у випадковому порядку. Основою вибірки можуть бути територіальні одиниці (місто, селище, село), організаційні форми (державні підприємства, акціонерні товариства тощо).

У ряді випадків проводять моментні спостереження, суть яких полягає у періодичній фіксації стану процесу на певні моменти часу. Результатом такого роду спостережень є аналітична інформація, одержана в ході вивчення технологічних процесів. Її використовують для прийняття управлінських рішень.

Вибір способу формування вибіркової сукупності залежить від мети дослідження і таких факторів, як терміни виконання, фінансові ресурси тощо.

Для забезпечення якості вихідної інформації, одержуваної на основі вибіркового спостереження, поєднують вищенаведені способи відбору,— це спосіб багатоступеневої вибірки. Ступенями на першому етапі виступають природні зони, області, райони, на другому — конкретні населені пункти, на третьому — частина домогосподарств у населених пунктах.

Точність вибірки залежить також від схеми відбору: вона може бути повторною і безповторною.

При повторному відборі кожна відібрана одиниця (або серія) повертається в сукупність і, отже, може знову потрапити у вибіркову сукупність. Цей метод використовується в тих випадках, коли неможливо провести більш точний безповторний відбір (при обстеженні пасажиропотоків, вивченні попиту на товари, дослідженні флори й фауни тощо).

За безповторного відбору кожна досліджувана одиниця не може вивчатися ще раз,— цим самим охоплюється більша кількість різних одиниць, зменшується помилка, збільшується точність характеристик.

При проведенні вибіркового спостереження вирішуються такі завдання: визначається середній розмір досліджуваної ознаки та встановлюється частка одиниць, яким властива дана ознака.

Об’єктивність вибіркових даних залежить від оптимальної величини вибіркової сукупності.

8.3. Визначення помилок вибіркового спостереження

Як уже зазначалося, статистичні характеристики вибіркової сукупності використовують з метою оцінки параметрів генеральної сукупності. Але оскільки вибіркова сукупність не точно моделює генеральну, можливі розбіжності в рівні значень досліджуваних параметрів.

Вони мають назву похибок репрезентативності і бувають систематичними та випадковими. Систематичні похибки трапляються через необ’єктивний відбір з генеральної сукупності, порушення правил відбору. Випадкові похибки виникають тоді, коли вибіркова сукупність недостатньо точно моделює (репрезентує, представляє) генеральну сукупність.

Оскільки випадкових похибок уникнути неможливо, то в процесі використання вибіркового методу, визначивши їхній розмір, коригують характеристики генеральної сукупності. Для визначення похибок вибірки використовують такі розрахункові елементи:
  • — обсяг генеральної сукупності;
  • — обсяг вибіркової сукупності;

— частка вибіркової сукупності;

— частка необстеженої (недослідженої) сукупності;

W — частка сукупності, яка має певну ознаку;
  • — частка сукупності, яка не має певної ознаки;
  • — середня величина ознаки в генеральній сукупності;
  • — середня величина ознаки у вибірковій сукупності;

— середня похибка вибірки.

Для визначення середніх або стандартних похибок вибірки використовують систему розрахункових формул.

Таблиця 8.1

Формули розрахунку середніх похибок при простому випадковому відборі





Розглянемо методику розрахунку вибіркових характеристик на конкретному прикладі.

Для визначення середньої частки браку взято 5000 проб продукції, що складає 5% генеральної сукупності. Результати проб наведені в таблиці:

Таблиця 8.2

Дані для розрахунку середньої і дисперсії




Визначимо середній процент браку у вибірковій сукупності за середньою арифметичною зваженою:




Величина дисперсії становить:




На основі вихідної інформації та розрахункових даних визначимо середню похибку вибірки:




Установимо частку браку (наприклад, 10% і більше). У даній ви­бірковій сукупності , або 32%.

Знайдемо середню похибку за цією ознакою:


або 2%.

Одержані параметри похибок називають точковими оцінками. У практичній роботі часто необхідною є більша вірогідність результатів із заданою імовірністю. При вимогах більш високої гарантії даних допускається більша величина похибки (t-кратність похибки), але й більша довіра.

Співвідношення між імовірністю й кратністю помилки такі:

Імовірність

0,683

0,866

0,954

0,988

0,997

0,999


З урахуванням вимог імовірності результатів визначається максимально можлива, або гранична, похибка вибірки за формулою:
  • .

У нашому прикладі необхідно гарантувати характеристики з імовірністю 0,997. Звідси гранична помилка вибірки складатиме:

а) для середньої

 = 3 0,12 = 0,36%;

б) для частки

 = 3 0,02 = 0,06, або 6%.

На основі даних щодо кінцевої оцінки і граничної помилки вибірки визначають інтервальну оцінку, тобто межу коливань ознаки в генеральній сукупності:

для середньої ;

для частки .

З урахуванням одержаних граничних помилок вибірки межі коливань параметрів при ймовірності 0,997 отримаємо такі:

а) для середньої 9,0% ± 0,36%, тобто від 8,74 до 9,46%;

б) для частки 32% ± 6 % , тобто від 26 до 38%.

При типовому відборі значення розрахункових параметрів приймається за середнє, тобто

.

Наприклад, у сільськогосподарському підприємстві досліджуються втрати зерна озимої пшениці, пов’язані з несвоєчасним його збиранням. Число ділянок обрано пропорційно площі, засіяній зерном певного сорту (сорт розглядається як тип явища). Одержані результати зведені у таблицю (табл. 8.3):

Таблиця 8.3

Вихідна інформація про результати сортових випробувань





Проведемо розрахунки:

1) середні витрати зерна


ц/га;


2) середня дисперсія


;


3) гранична помилка вибірки з імовірністю 0,954


.

Отже, з імовірністю 0,954 можна стверджувати, що на всій площі через несвоєчасне збирання урожаю втрати з розрахунку на 1 га становлять від 2,7 (3,3 — 0,6) до 3,9 ц/га (3,3 + 0,6).

У ряді випадків вибіркове спостереження використовують як метод контролю суцільного спостереження. До речі, у такий спосіб проводять 10%-ний вибірковий контроль результатів обліку худоби у господарствах. Якщо, наприклад, за результатами контрольної перевірки виявлено 156 корів (при 150 за даними обліку), то коефіцієнт недоліку становитиме:

Цей коефіцієнт використовують як помилку при вибірці з метою коригування.

8.4. Визначення обсягу вибірки

Обсяг вибірки диктується вимогами достовірності вибіркових даних та економічності витрат на її проведення. Як видно з формул (див. табл. 8.11), він пов’язаний з величиною граничної похибки. Значення 2 за відсутності інформації беруть з даних попередніх (чи аналогічних) обстежень.

Для альтернативної ознаки, якщо інформація щодо досліджуваної частки (w) відсутня, її приймають такою, що дорівнює 0,5. Звідси 2 = 0,5  0,5 = 0,25.

Для визначення чисельності простої випадкової вибірки використовують такі формули (табл. 8.4):

Таблиця 8.4

Формули для визначення обсягу вибірки




Приклад 1. Визначити необхідний обсяг вибірки деталей при безповторному відборі, при якому з імовірністю 0,954 можна було б гарантувати, що практична помилка вибірки не перевищить 0,9 мм при середньому квадратичному відхиленні ознаки у 8 мм.

Обсяг генеральної сукупності — 1000 деталей. Згідно з умовами завдання визначимо обсяг вибіркової сукупності:

деталей.

Приклад 2. Визначити необхідний обсяг вибірки з імовірністю 0,683 для визначення частки бракованих виробів у генеральній сукупності.

Досліджувана партія виробів — 5000 деталей, обсяг вибірки — 8%, гранична помилка — 10%.

Вибіркова сукупність має бути такою:


деталі.


У статистико-економічних дослідженнях часто використовують невеликі за обсягом сукупності. Це малі вибірки, необхідність застосування яких зростає у період переходу до ринкової економіки.

8.5. Мала вибірка

Під малою вибіркою розуміють різновид вибіркового спостереження, чисельність одиниць якого не перевищує 30. Таке спостереження часто використовують, обстежуючи діяльність малих і середніх підприємств, комерційних банків, фермерських господарств. Застосовують його і при визначенні якості продукції, яка підлягає знищенню через псування.

Розробка теорії малої вибірки започаткована у 1908 р. англійським статистиком В.С. Госсетом (псевдонім Стьюдент). Він математично довів, що оцінка розбіжностей між коливаннями середньої малої вибірки відбувається за законом розподілу. Згідно з цим законом необхідні елементи для розрахунку граничної помилки вибірки розраховують так:

а) середню помилку відбіркової сукупності, яка показує міру випадкових коливань вибіркової середньої в малій вибірці,— за формулою:

;

б) граничну помилку малої вибірки:



и виявлено, що на підвищення професійного рівня вони витрачають: 5, 9, 8, 9, 5, 6, 7, 6, 8, 10, 6, 7, 4, 7, 8 годин на місяць.

Розрахуємо середній рівень витрат часу за сукупністю:

годин,

або годин.

Для розрахунку дисперсії в малій вибірці складаємо табл. 8.5.

Таблиця 8.5

Дані для розрахунку дисперсії



Обчислюємо значення дисперсії: ;

значення середньої помилки малої вибірки:


.

За додатком 3 визначаємо, що для коефіцієнта довіри t = 3 і обсягу малої вибірки n =15 вірогідність дорівнює 0,990.

Отже, з вірогідністю 0,920 можемо стверджувати, що розбіжність між вибіркою і генеральною середньою знаходиться у межах від – 3 до + 3 , тобто її різниця є не більшою за 1,29 години (0,43  3).

Характеризуючи генеральну сукупність, слід мати на увазі, що її межі становитимуть від 5,31 години (7,00 – 1,29) до 8,29 години (7,000+
+ 1,290). Але 0,8% (99,20 – 100,02) й межі середньої в генеральній сукупності можуть бути більшими.

Вибір ступеня вірогідності залежить від характеру економічних задач, для яких використовують оцінки.

Таблиці Стьюдента часто використовують для перевірки достовірності результатів досліджень. При цьому оперують даними дослідної і контрольної груп. Наприклад, у дослідах (15 варіантів) щодо впливу мікродобавок на продуктивність тварин зафіксовано збільшення добового приросту ваги на 100 г (середня помилка — 40 г).

Проведемо перевірку достовірності:

а) визначимо величину критерію t: ,

б) знайдемо табличне значення (додаток 2) при 14 ступенях свободи (15 – 1) і вірогідності 0,05. Воно дорівнює 2,145; а при вірогідності 0,10 — 1,761. Фактичне значення знаходиться в межах табличних значень, а результати досліду слід вважати достовірними.

При порівнянні двох незалежних вибірок, наприклад урожайності двох сортів однієї сільськогосподарської культури, значення t визначається шляхом визначення різниці двох вибіркових і ділення її на середню похибку:




Надалі визначимо середню похибку різниці двох вибіркових середніх:

Одержане значення t треба порівняти з табличним при відповідному числі ступенів свободи і заданій вірогідності і зробити висновок про достовірність результатів досліду.

8.6. Використання статистичних гіпотез
в економічних дослідженнях

При дослідженні соціально-економічних явищ статистика, як нами показано раніше, спирається на загальнонаукові методи. Особливе місце займають закони протиріччя: виключення третього, аналогії та гіпотези. Суть закону виключення третього полягає в тому, що з двох думок, що заперечуючують одна одну, про один і той же предмет, взятий в один і той же час, одна є істинною, а інша помилковою (третього не дано!) При цьому базуються на аналогії (перенесенні властивостей одного предмета на інший); гіпотезі (науковому передбаченні щодо можливих причинних зв’язків, співвідношення явищ.) Прикладом можуть бути вибіркові характеристики, які на основі аналогії та гіпотези дослідник розповсюджує на загальну сукупність.

Як правило, статистична гіпотеза є припущенням щодо параметрів і форми розподілу генеральної сукупності, яке перевіряють на основі вибірки. При перевірці статистичної гіпотези визначають, як узгоджуються з нею дані спостереження, на основі чого її приймають або відкидають. При цьому розрізнюють основні або нульові й альтернативні (конкуруючі) гіпотези. Основна (Но) — це така, яка підлягає перевірці. Її суть полягає в тому, що виключено розбіжність між фактичними і теоретично очікуваними показниками (тобто вона нульова). Альтернативна гіпотеза (На) її заперечує. Слід відзначити, що альтернативних гіпотез може бути декілька. Скажімо, в разі проведення дослідження напрямків розвитку ринкової економіки методом анкетного опитування альтернативних гіпотез може виявитися більше 100 варіантів. Якщо вибіркові дані суперечать гіпотезі (Но), вона відхиляється, а якщо узгоджуються з нею,— приймається. При перевірці гіпотез можливі два варіанти помилок:

а) відхилення правильної нульової гіпотези;

б) прийняття (Но), хоча насправді правильною є альтернативна.

Правило, за яким гіпотеза Но приймається або відхиляється, називають статистичним критерієм.

Основні критерії, що їх використовують у науковій роботі, такі:
t-критерій нормального розподілу; t-критерій розподілу Стьюдента, К. Пірсона (2), А.Н. Колмогорова (), Б.С. Ястремського (L), В.І. Романовського (R), Вілкоксона (U) та ін.

Критерій t нормального розподілу використовують при вивченні характеру розподілу сукупності. Згідно із законом нормального розподілу варіація індивідуальних значень досліджуваних показників знаходиться в межах х + 3 Числове його значення визначають за допомогою спеціальних таблиць, враховуючи при цьому рівень імовірності (додаток 1).

Рівень істотності (а) — ймовірність ризику відхилення правильної нульової гіпотези, а значення статистичної характеристики для ймо­вірності 1-а — критичним значенням Zі-a. Якщо вибіркове значення
Z > Z1-a, гіпотеза Но відхиляється, при Z < Z1-a — приймається.

Критерій t Стьюдента використовують для перевірки статистичних гіпотез стосовно середніх при малих вибірках. Для визначення числового значення використовують дані про кількість ступенів свободи варіації і рівня ймовірності (додаток 2).

Критерій F Фішера використовують з метою оцінки співвідношення дисперсій при малих вибірках, а також перевірки міри впливу факторів на результативний показник при вивченні зв’язку між ними (додаток ).

Критерій Пірсона (2) використовують для перевірки гіпотези про закон розподілу.

Критерій Колмогорова () оцінює близькість фактичного розподілу до теоретичного. Його також застосовують для визначення належ

ності двох вибіркових об’ємів n1 і n2 до однієї генеральної сукупності, а також для перевірки незалежності двох і більше ознак сукупності.

Критерій Романовського (R) використовується для оцінки наближення фактичного розподілу до теоретичного.

Критерій Ястремського (L) використовують для відповіді на питання про міру розбіжності між фактичним і теоретичним розподілом.

Критерій Вілкоксона (U) дає змогу перевірити гіпотезу про однорідність розподілів двох генеральних сукупностей.

Вищенаведені критерії поділяють на параметричні і непараметричні.

Параметричні критерії (t, F, 2) потребують оцінок параметрів розподілу. Непараметричні критерії можна використовувати і при відхиленні розподілу від нормального.

Процедура перевірки статистичних гіпотез включає такі етапи:

1) оцінка вихідної інформації і статистичне моделювання вибіркової сукупності;

2) формулювання нульової та альтернативної гіпотез;

3) встановлення рівня ймовірності, який достатній для висновків про правдоподібність гіпотези;

4) вибір критерію для перевірки нульової гіпотези і розрахунок його фактичного значення;

5) встановлення критичного значення критерію;

6) порівняння фактичного і табличного значень для висновку про достовірність гіпотези. Розглянемо методику використання деяких критеріїв на конкретних прикладах. Для перевірки гіпотези про відповідність емпіричного розподілу нормальному використаємо дані табл. 8.6.

Відповідно до цієї гіпотези емпіричний розподіл вважаємо нормальним. Для перевірки гіпотези слід визначити фактичне значення критерію Пірсона ( хі-квадрат) і порівняти його з табличним.

Для визначення теоретичних частот нормального розподілу критерію 2 складемо робочу таблицю.

Середнє значення показника, визначеного за середньою арифметичною зваженою, дорівнює 30,65, а середнє квадратичне відхилення — 3,1.

Для визначення теоретичних частот знайдемо :



На основі цієї величини визначимо теоретичні частоти для кожного інтервалу:

для першого

97  0,0562 = 5,5;

Таблиця 8.6

Розрахунок теоретичних частот нормального розподілу



для другого

97  0,2371 = 23,0 і т. ін.

На основі проведених рахунків одержуємо фактичне значення 2:

2 = ((ft-fф)2)/fm = 30,629.

Табличне значення 2 визначаємо з врахуванням ступенів віль­ності:

к = 5 – 2 – 1 = 2.

При F = 0,05 і к = 2 2 табл. = 5,99.

Оскільки фактичне значення критерію (30,629) більше табличного (5,99), розподіл сукупності не узгоджується з нульовою гіпотезою і вона не приймається.

Критерій Колмогорова визначається за формулою  =D , де D — абсолютна максимальна різниця між накопиченими частотами або частками емпіричного і теоретичного розподілів. У табл. 8.7. наведено необхідну інформацію для розрахунку цього показника.

Таблиця 8.7

Матеріали для розрахунку критерію 





Критерій Романовського (R) визначається за формулою:



Нагадаємо, що k — число ступенів вільності. Проведемо розрахунок на основі тієї ж вихідної бази:



При значенні критерію R менше 3 розподіл сукупності вважається нормальним — і навпаки.

Критерій Ястремського (L) визначають за формулою:



де — при кількості груп менше 20 дорівнює 0,6.

За даними попередніх розрахунків його значення буде таким:

.

Одержане значення співвідносять з величиною 3 і роблять аналогічні висновки.

Ряд критеріїв розглянуто раніше. Відзначимо, що в підручниках і навчальних посібниках, як правило, ефектно подано цифрові дані, які підтверджують статистичні гіпотези. Але в реальному житті є багато прикладів, коли гіпотеза виявляється неправильною.


Питання для самоконтролю

1. Дайте визначення вибіркового спостереження, назвіть його види.

2. Наведіть визначення помилки вибірки, її використання для характеристики генеральної сукупності.

3. Що означає поняття «репрезантативність вибірки»?

4. Яка різниця між вибірковою та генеральною сукупностями?

5. Які існують види відбору і в чому їхня суть?

6. Охарактеризуйте особливості вибірок.

7. У чому суть багатоступеневої вибірки?

8. Назвіть особливості граничної і середньої похибок вибірки.

9. Які існують статистичні критерії? З якою метою вони використовуються?

9. Статистичне вивчення динаміки
економічних показників