Организация и методика статистического исследования

Вид материалаЗакон

Содержание


Viii. непараметрические критерии
Критерий итераций (флуктуаций).
При альтернативном распределении
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   17

VIII. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

Непараметрические критерии используются преимущественно в тех случаях, когда изучаемое явление отличается от нормального рас­пределения. С одной стороны, они позволяют оценить характер, тен­денцию явления (увеличение, уменьшение, без перемен), хотя, с дру­гой, большинство из них обладает достаточно высокой статистиче­ской мощностью (чувствительностью). Особенно эффективно приме­нение непараметрических критериев при малых выборках (« < 30), при изучении качественных признаков. Преимуществом большинства не­параметрических критериев является сравнительная простота расче­тов.

Основные направления применения непараметрических критери­ев:

1. Для характеристики одной совокупности:

- критерий итераций (флуктуаций);

- медиана,квартели.

2. Для оценки связи между явлениями:

- коэффициент ранговой корреляции (Спирмена);

- коэффициент корреляции рангов (Кэндела);

- показатель соответствия у} (хи-квадрат).

3. Для оценки различий двух сравниваемых совокупи остей. При этом следует выделять несколько вариантов:

1. Для сравнения количественных признаков:

2.

Две выборки

Несколько выборок

А

Б

В

Г

независимые

зависимые

независимые

зависимые

Критерий Лорда (U)

Критерий Вилконсона-Манна-Уитни (U)

Критерий Мостселлера

Ранговый крите­рий Вилконсона (Т)

Критерий знаков (Z)

Сравнение вы­борок по Немени

Критерий Фридмана

Критерий Вил-консона-Вилконс

Критерий Розенбаума (Q)

Максимум кри­







Критерий Уайта (К)

Серийный критерий Вальда-Вольровича (S)

терий для разно­сти пар







Критерий Колмогорова-Смирнова











2. Для сравнения качественных признаков:

————- Дв< выбо

———А-—

рки

Нескольк

Ж:

о выборок

независимые Критерий Стьюдента с поправками Йетса

Критерий согласия <2)

Точный метод Фишера (X2)

Критерий Ван-дер-Вардена. (X)

Е зависимые Критерии Макни-Мара

независимые Критерий ()с2) по Р.Руниони

3

зависимые Критерий Кокрена (Q)


Характеристика одной совокупности

Критерий итераций (флуктуаций). Применяется когда п>10.

Схема вычисления критерия итераций.

Допустим, необходимо проверить у одного больного содержание альбуминов в плазме крови, для чего было сделано последовательно 10 исследований:



'• - - + - - +

Приведенные данные указывают на колеблемость содержания альбуминов. Необходимо определить характер этих колебаний - су­щественны или несущественны. Для этого: 1. принимается нулевая гипотеза - колебания содержания альбуминов в плазме крови у боль­ного носят случайный характер.

2. Данные изменения альбумина вновь выписываются по степени возрастания для того, чтобы определить срединное значение резуль­татов исследования (Me).

Определяем место Me -- n\- = 10+1 = 5.6

49.8; 50.9; 51.1; 51.2; 51.3; 51.3; 51.5; 51.5; 52.2; 52.4. Место Me оказалось между величинами 51.3 и 51.3. Чтобы опреде­лить размер Me надо получить полусумму измерений, между которы­ми находится ее место. Me = =(5].3+5].3)/2 = 51.3.

3. В ряду фактически приведенных исследований разность между значением Me и каждым измерением обозначается знаком «+» или «-» Если встречаются величины, равные Me, и допустим первой уже

г •'\

поставлен «+», то второй ставится «-», третьей «+» и т.д. или наобо­рот.

4. Подсчитываются серии одинаковых знаков. В нашем пример( их 6 (R = 6). Полученный результат сравниваем с табличным. Есл величина R в пределах табличного значения (от-до) - нулевая гипоте­за принимается. Если R меньше или больше табличной - нулевая ги­потеза отвергается (приложение № 4). Табличное значение R находит­ся на пересечении строки / - число вариант больших по величине чем Me (в нашем примере их 5) и графы Пу - число вариант меньшие чем Me (их тоже 5). Табличное значение R на пересечении чисел 5 рав но 3/9. Рассчитанное значение R = 6 находится в пределах табличного значения R. Следовательно, нулевая гипотеза принимается. Колеба ния измерений альбуминов в плазме крови носят случайный характер и их различия несущественны.

Медиана применяется в случаях, когда неизвестен тип распределе ния либо оно отличается от нормального (а также в случаях, когдг нельзя вычислить среднюю арифметическую). При нечетном числе наблюдений медианой будет являться варианта, расположенная точнс в середине ряда; при четном - ее величина определяется как полусум­ма двух вариант, расположенных в середине ряда. Порядковый номе]:

медианы в ряду определяется по формуле "±1 (п - общее число на-

2 блюдений).

После определения местоположения медианы каждая из двух по­ловин ряда также может быть разделена пополам путем нахождение квартилей Q (нижней Q„ и верхней (?„). Порядковый номер квартиле? определяется по формулам:

. п+\ 3(п+\) ---' «а——4

При получении дробного числа его округляют до целого.

№ п/п

варианта

№п/п

варианта

№ п/п

варианта

1

171

11

210

21

250

2

174

12

212

22

252

3

180

13

216

23

270

4

180

14

216

24

276

5

180

15

220

25

288

6

183

16

224

26

294

7

189

17

225

27

294

8

194

18

225

28

300

9

204

19

230

29'

330

10

206

20

240

30

355


Вычисляем порядковые номера и значения медианы и квартилей-

п., =-i-зo±l ,сс „. 5+.6 220+224

2 - 2 =15-5 мe= 2 ——2——=222Л"

я+1 30+1

"а = = " = 7-75 « 8 б"» У» «4мг%

(я+1)3 (30+1)3

"а = —4— = --Т— = 23.25 » 23 fi, e 23 » 270мг%

больх003""6 xoлecтePинa в KPOBИ половины обследованных больных находилось в пределах 194-240 мг%, при медиане 222 мг% и амплитуде ряда 171-355 мг%. нс мг/о и

формул"""1'0""0'1 раду медиана и Р™™ определяются по ."'.где

V

Л1 - начальная граница интервала, содержащего медиану (квартиль);

nMv{Q} - порядковый номер медианы (квартили);

(квартиль) накопленная частота) W"

Р- частота интервала, содержащего медиану (квартиль).

Непараметрические методы изучения связи

Коэффициент корреляции рангов Спирмена - р. Рассмотрим методи-

г0 Ф"™ на "РР6 -зи меу коТичест-вом эритроцитов и процентом гемоглобина в крови у 8 человек (табл.

Вычисление коэффициента корреляции рангов Спирмена между количеством эоци8 и процентом гемоглобина в крови

Обсле­дован­ные 1 А. К. Б.

Кол-во эри­троцитов, х 2 1.98 2.50 2.94

Гемогло­бин,

в %, у 3 40 47 60

Ранги вариант

Разности ран­гов,

Квадраты разно­стей рангов, (р 7 0 0

Гх

4

2 3

гу

5

2

d 6

о

0

3. С. И. Ж. Н.

3.25 3.64 3.70 3.86 4.29 n=8

62 74 65 78 74

4 5 6 7 8

3 4 6.5 5 8 6.5

0

о

-1.5 +1 -1 +1.5

0 0

2.25 1

2.25



















£d2-6.5


54

1. Располагаем данные обследованных в порядке возрастания ва­риант первого признака (в нашем примере - количества эритроцитов) - графы 1,2 и 3 (таблица 18).

2. Заменяем значения вариант в каждом ряду их рангами (графы 4 и 5). Если встречаются одинаковые варианты, то каждой из них при­сваивается средний ранг. В нашем примере варианта 74% гемоглобина встречается 2 раза, она занимает порядковые места 6 и 7, следователь­но, средний ранг равен:



3. Находим разности между смежными рангами сравниваемых ря­дов (графа 6). Сумма этих разностей должна равняться нулю.

4. Возводим разности в квадрат и суммируем их (графа 7).

5. Вычисляем коэффициент корреляции рангов Спирмена по фор­муле:

б2>2 - ScP - сумма квадратов разностей рангов;

п - число сравниваемых пар. В нашем примере:

---S————23

Таким образом, между числом эритроцитов и содержанием гемо­глобина в крови существует сильная прямая корреляционная связь. Величина коэффициента корреляции рангов Спирмена оценивается также, как величина параметрического коэффициента корреляции.

Оценка надежности коэффициента корреляции рангов Спирмена при числе наблюдений 10 и более производится с помощью критерия / по формуле:

\п-г t=p

Вероятность, соответствующую полученному /, определяем по таблице Стьюдента при числе степеней свободы (п - 2). В тех случаях, когда число наблюдений меньше десяти, оценка значимости произво­дится по таблице 5. Если вычисленный коэффициент корреляции р больше табличного pos, то он значим с вероятностью 95%, если р > poi, то он значим с вероятностью 99%. В нашем примере при п = 8 р > poi (0.92 > 0.833); следовательно, полученный нами коэффициент корре­ляции значим с высокой вероятностью (р < 0.01).

Показатель соответствия (2) - занимает промежуточное положе­ние: с одной стороны он характеризует наличие связи между явления-

55

ми, с другой - значимость различий между ними. Показатель соответ­ствия 2 вычисляется с помощью абсолютных величин и указывает на существенную или несущественную разницу между эмпирическими числами, полученными в процессе исследования, и теоретическими ожидаемыми", полученными на основе предположения об отсутствии связи между исследуемыми явлениями, то есть на основе принятия ну­левой гипотезы. Хи-квадрат Ос2) подтверждает наличие связи, но не устанавливает степень связи. Чем больше величина ?с2, тем больше . полученный результат отличается от теоретического. Оценка у2 про­изводится по специальной таблице (см. приложение № 6). Число сте­пеней свободы равно произведению числа граф (без итоговой) минус единица на число строк (без итоговой) минус единица:

n'=(S-\)-(r-l). Если значение /2 равно или больше табличного, то

нулевая гипотеза отвергается, чем доказана связь, влияние изучаемого явления (фактора). При влиянии большого числа факторов на резуль­тативный признак, вычисляется по формуле:

. (Р-РУ~ ;T-Z р -где

Р - фактически.; величины, Pi - «ожидаемые» величины.

Методику вычисления разберем на следующем примере. Пример расчета критерия у1:

Изучение влияния сроков операции от момента поступления больных в стационарно поводу ocTDoro япп»ипигм-г.. ..« ,,„„.... „„..„.,.„-„. ...„...." __ г

Исходы после ' операции

Сроки оп до 24

ерации от

24-48

момента п (час) 48-72

оступлени» более 72

я больных

Умерло (чел.)

фактически «ожидаемые»

12

12

8

14

всего 46

Выздоровело (чел.)

фактически ~ «ожидаемые»

22 1203 1193

15 832 829

5 273 276

4 209 219

46

2517 2517

Всего ——— В том числе % учерших (летальность) Выздоровело в %

1215 0.9

99.1

844 1.4

281 2.8

97.2

223 6.3

2563 1.8







70.0




93.7

98.2


Из данных таблицы 19 видно, чем позднее сделана операция, тем выше будет послеоперационная летальность. Достоверность такой связи следует доказать критерием х2. Для этого: 1) принимаем нуле­вую гипотезу (теоретически отвергаем влияние сроков операции от момента госпитализации больных на частоту летальных исходов) и вычисляем «ожидаемые» (Р,) числа умерших и выздоровевших среди оперированных и выписываем их во второй ряд каждой строки таб-

56

лицы. Вычисление «ожидаемых» чисел (при гипотезе отсутствия влия­ния сроков операции на летальность среди всех групп больных пока­затель летальности был бы равным и составлял «среднюю» величину 1.8%, а % выздоровлений соответственно - 98.2). Умерло:

до 24 час 24-48 час 24-72 час позднее 72 час

на 100-1.8 на 100-1.8 на 100-1.8 на 100-1.8

на 1215-х на 844-х на 281-х на 223 - х

х = 22 х = 15 х = 5 х = 4

Выздоровело:

на 100-98.2 на 100-98.2 на 100-98.2 на 100-98.2

1215-х на 844-х на 281-х на 223-х

х=1193 х=829 х276 х = 219

2) Вычисление:

, -.(Р-Р,)2 (12-22)2 (12-15)2 (8-5)2 (14-4)'

у = 7 ——————— = ——————— + ——————— + —————— + ————— +

х ZJ />, 22 15 5 4

(1203-1193)2 (832-829)2 (273-276)2 (209 - 219)2 + 1193 + 829 + 276 + 219 = 4.5 + 0.6 +1.8 + 25.0 + 0.08 + 0.01 + 0.03 + 0.46 = 32.48 Табличное значение 2, при числе степеней свободы

т/ = (4 -1) • (2 -1) = 3, равно 7.8-10.3 . Вычисленный f1 больше табличного.

Р - Р

'(15 'Ol

Следовательно, нулевая гипотеза отвергается, что позволяет сделать вывод о влиянии на уровни послеоперационной летальности при ост­ром аппендиците сроков операции от момента госпитализации боль­ных.

При альтернативном распределении у} вычисляется при помощи четырехпольной таблицы, при этом общее число наблюдений должно быть не менее 20, а в каждой клетке таблицы не менее 5. Клетки таб­лицы условно обозначаются буквами.

Пример расчета '/! при альтернативном распределении:

Изучение побочных явлений при лечении антибиотиками с применением и без поименения витаминов

Действие антибиотиков

Побочные явления

Процент побочных яв­лении

есть

нет

всего

С применением витаминов

а 9

b

57

a+b 66

13.0

Без применения витаминов

с 16

d 29

c+d 45

35.5

Итого

25 а + с

86 b+d

111 a + b + с + d

22.5


57

Из данных таблицы видно, что процент побочных явлений в группе, где применялись витамины, меньше, чем в группе, где они не применялись. Условно отвергая влияние витаминов на снижение по­бочных явлений от действия антибиотиков, у2 вычисляется по (ьорму-ле: т ' -

2 ____(ad-cb-n____ (9-29-16-57)2

(a+c)-(b+d)-(a+b)-(c+d) 25-86-66.45 ~ 7'3 Рассчитанный y2 больше табличного, который при числе степеней

свободы г!'= (2-1)(2-1) = 1, равен 3-8"6-6 . Это дает право отвергнуть

"OS ~ -Ч)!

нулевую гипотезу и считать доказанным влияние витаминов на сни­жение побочных явлений при применении антибиотиков.

Когда общее число наблюдений более 20, а в клетках может быть число менее 5, 2 вычисляется по формуле с поправкой Иейтса:

2 _ [ad -cb- 0.5(a 4- b + с + dN / ~ (a+c)-(b+cf)-(a+b)-(c+d)

Оценкарезультата производится по той же таблице (приложение 6). Если y2 = то52 - нулевая гипотеза отвергается, если у2 < уто52 - ну­левая гипотеза принимается.