Организация и методика статистического исследования
Вид материала | Закон |
- И. И. Мечникова Кафедра общественного здоровья и здравоохранения утверждаю зав кафедрой,, 128.92kb.
- Семинарских/ практических занятий Тема Статистическое наблюдение Методология организации, 113.64kb.
- Задачи статистики и ее организация в РФ и в зарубежных странах Этапы статистического, 26.55kb.
- Методика использования дисперсионного анализа в оргпроектировании. 23. Методика и организация, 29.83kb.
- Курс. Предмет статистики. Изучение количественной стороны общественных явлений и процессов, 14.22kb.
- План статистического исследования, его содержание, 81.37kb.
- Темы лекционных занятий: Предмет, метод и задачи статистического исследования Современная, 25.16kb.
- Методология статистического исследования влияния уровня и качества жизни населения, 657.92kb.
- Методика исследования с применением качественной методологии 15 Методика количественного, 5301.04kb.
- Инструкция : Бланк исследования: все без бланков исследования Отчет испытуемого, 39.61kb.
Если число наблюдений меньше 20, а в клетках таблицы может
встретиться число меньше 3, у2(Р) рассчитывается по формуле Фишера:
(a+b)l(c+d)\(a+c)\(b+d)[
' ~ N\a\b\c\d\
Знак восклицания (!) называется факториалом и означает произведение чисел от единицы до конца числа N, а и т.д., то есть - 1 • 2 • 3 • 4... и последнее значение N. Оценка критерия Р производится аналогично критерию у2, рассчитанному по предыдущей методике.
Коэффициент корреляции рангов Кэндела - может быть рекомендован для применения в углубленных исследованиях, так как критерии оценки значимости этого коэффициента теоретически более обоснованы. Вычисление коэффициента Кэндела более сложно, чем вычисление р, однако в отдельных случаях этот критерий имеет определенные преимущества. В частности, после добавления к уже ранжиро-ванным Рядам новой пары наблюдений проще вычислить именно коэффициент корреляции Кэндела, так как это не потребует переранжировки рядов.
Для вычисления коэффициента Кэндела необходимо получить два ряда рангов. Степень соответствия между этими рядами характеризуется величиной S, представляющей собой сумму двух компонентов R и
58
Чтобы вычислить величину R, необходимо для второго ряда (когда первый ряд ранжирован строго в порядке возрастания вариант) определить число последующих рангов, больших по своей величине, чем взятый ранг. Величина R является суммой этих чисел и представляет собой положительный показатель соответствия между сравниваемыми рядами рангов.
Чтобы вычислить величину Q, необходимо для каждого ранга второго ряда определить число последующих рангов, меньших по своей величине, чем взятый ранг. Величина Q - сумма этих чисел -является отрицательным показателем соответствия между рядами рангов и берется со знаком минус.
Когда имеется значительное число объединенных рангов, коэффициент Кэндела вычисляется по формуле:
, где
\nl~n П"- П~\ у(_-_)(--_)
// //у \ .4-' \ —• , a t - численность группы объединенных рангов.
Л'~ У ')
Рассмотрим определение коэффициента корреляции рангов (т) с учетом объединенных рангов на следующем примере (табл. 20).
Таблица 20
Определение силы связи между количеством эритроцитов (млн.) и гликолитическим методом (ранжирование по ряду х)
Эритроциты | Гликолитичес- | Ранг | Разность | Разность в | ||
| кий индекс | | | квадрате | ||
(X) | (У) | X | У | (У-Х) | (У-х)2 | |
2.90 | 7.2 | 1 | 3 | +2 | 4 | |
2.27 | 6.6 | 2 | 4 | +2 | 4 | |
| .98 | 13.4 | 3 | 1 | -2 | 4 |
| .81 | 7.4 | 4 | 2 | -2 | 4 |
| .80 | 5.8 | 5 | 6 | +1 | 1 |
| .38 | 6.4 | 6 | 5 | j | 1 |
| .27 . | 2.8 | 7 | 8.5 | +1.5 | 2.25 |
| .20 | 5.0 | 8 | 7 | -1 | 1 |
0.83 | 2.8 | 9 | 8.5 | -0.5 | 0.25 |
По данным, приведенным в таблице, вычисляем:
R=6+5+6+5+3+3+0+1=29 Q=(-2)+(-2)+(0)+(-1)+(0)+(-1)+0=-6 S=29+(-6)=23 U.=0
59
U 2-(2-1) Uy- 2 -«
23 -О 81-9 81-9 . V36-35 -2——0).(-——1)
Полученное значение гпри n=9nS=23 можно признать существенным с вероятностью ошибки Р < 0.012 (приложение № 7).
« 4 *
А. Оценка достоверности различий
Рассмотрим некоторые, наиболее часто применяемые непараметрические критерии, для оценки достоверности различий.
1. Критерий Лорда (U).
Применим при любых видах распределения. Ограничения: выборки должны быть равны по объему и не превышать 20 единиц (п, = п-, 5; 20).
- М,-М U = —-——т •где (2?,+)2
Mi u М: - средние арифметические сравниваемых совокупностеи.
R/ u rs - амплитуды первого и второго ряда (,„„у - V„„„).
Полученные значения сравниваются с табличными (приложение № 8). Различия
л л
считаются достоверными при U > U табл.
2. Критерий Вилконсона-Манни-Уитни (И).
Алгоритм расчета:
1) Два сравниваемых ряда объединяют и упорядочивают значения общего ряда.
2) Присваивают всем значениям ранги.
3) Отмечают, к какому из сравниваемых рядов относится ранг.
4) В каждом из рангов определяют сумму рангов (27?/м27?,).
5) Вычисляют критерий И по формуле: .
гт «.(i4-1) V» U, ==«,.+————-R,
пЛп, +1) у_
•—i—s
6) Наименьшее из полученных значений сравнивают с табличным (приложение № 9). Полученное U должно быть Щ,,- При наличии одинаковых значений им присваивается средний ранг.
Пример расчета критерия U.
Измерялась СОЭ у неболевших детей (А) и реконвалесцентов вирусного гепатита (В).
Получены следующие данные:
А: 3; 5; 7; 4 (п,=4) В: 8; 10; 12; 6 (я, =4)
1) Ранжируем полученные данные:
3; 4; 5; 6; 7; 8; 10; 12.
2) Ранг: 12345678
3)Ряд: АААВАВВВ
4) Суммы рангов:
ZR, =1+2+3+5=11 27 = 4 + 5 + 7 + 8 = 24
5) Расчет критерия U:
-n , .,-и-г
6) Сравниваем минимальный критерий (Jf,) с табличным. Полученный нами критерий (2) больше табличного (1), поэтому достоверность различий двух сравниваемых совокупностей не доказана.
3. Критерий Мостеллера.
Используется при п, = п.
Различия между выборками можно считать достоверными с вероятностью ошибки не более 5% (р = 0.05), если одна из сравниваемых выборок содержит пять наибольших или наименьших значений.
4. Критерий Розенбаума (Q).
Применяется при п > 10.
При сопоставлении двух рядов в первом из них подсчитывается величина S (количество наблюдений, варианты в которых превышают значения вариант второго ряда); во втором - величина Т (количество наблюдений, варианты в которых меньше минимальных значений первого ряда).
Величина Q = S + Т. Полученный критерий сравнивается с табличным значением (приложение № 10).
Пример.
Определялась величина СОЭ у двух групп больных:
1-ая группа:29,30,22,16,19,17,23,25, 26, 24, 19, 21;m == 12;
2-ая группа: 8, 4, 12, 14, 10, 5, 16, 17, 19, 6, 20, 18;П2= 12.
Упорядочиваем полученные значения:
1 ряд: 16, 17, 18, 19,20,
21.22.23.25.26.29.30 S=7
2 ряд: 4.5.6.8. 10. 12. 14,
Т=7 16,17,18,19,20
Q=7+7= 14.
Сравнивая с табличным значением, определяем, что различия между сравниваемыми группами неслучайны со степенью надежности более 99%.
5. Критерий Уайта (К).
Этот критерий еще называют критерием Вилкоксона для независимых совокупностей (Т), поэтому его часто обозначают двумя буквами К(Т). Обязательным условием для применения этого критерия является наличие контрольной совокупности (У) с числом наблюдений не более 15 и опытной (X) с числом наблюдений не более 20. Схему вычисления критерия Т(К) разберем на примере изучения содержания норадренали-на у опытной (X) и контрольной (У) групп животных:
1) Выписываются значения изучаемого признака:
Группа Х - 1.6; 2.8; 6.4; 4.2; 4.1; 3.6; 3.0; 2.3; 1.2 - Nx = 9. Группа У - 6.7; 7.2; 11.6; 12.0; 5.1; 3.4; 2.9; 4.7 - Ny = 8.
2) Полученные значения располагаются в единый возрастающий
ПД,, U JV Гр. х | А 1 V/1V 1.2 | > оаупа. 1.6 [2.3 | nib ч о | 1 Jd | МСН 3.0 | MtUI | tM yani | 1 ИМ 4.2 | | | 6.4 | | | | | ||
Гр.у | | 1 | | 2.9 | | 3.4 | т | | 4.7 | 5.1 | | 6.7 | 7.2 | 11.6 | 12.0 | ||
rk | 1 | 2 | 3 | 4 | | 6 | | | 9 | 10 | | | 13 | | | | |
Ry | | | | | 5 | | 7 | | | | 11 | 12 | | 14 | 15 | 16 | 17 |
I I I I |5 1|7T | | 111 |12
3) Вычисляется сумма рангов каждого ряда:
2К, = 1 + 2 + 3 + 4 + 6 + 8 + 9 + 10 + 13 = 56 27= 5+7 + 11 + 12 + 14 + 15 + 16 + 17=97
4) Меньшая -сумма рангов и есть критерий Уайта - К(Т). Если его величина равна или больше табличного К(Т)о5 - нулевая гипотеза принимается, если меньше К(Т)о5 - нулевая гипотеза отвергается (приложение № 11). Рассчитанный критерий К(Т) = 56 больше табличного, который на пересечении строки Пх = 9 и колонки Пу = 8 равен 51. Таким образом, существенных различий уровней измеряемого признака в сравниваемых группах не установлено.
6. Оценка достоверности разности двух зависимых рядов (сопряженных совокупностей)
1. Критерий Т (парный критерий Вилкоксона).
Порядок вычисления критерия Т:
62
1) Вычисляется разность значений вариант «до» и «после» какого-либо воздействия.
2) Проставляется ранг (место) абсолютного значения разности, начиная с меньших чисел, то есть без учета алгебраического знака.
3) Суммируются ранги положительных и отрицательных значений разности;
4) Оценивается по специальной таблице меньшая сумма рангов (приложение № 12).
Если Т >: То5табл - нулевая гипотеза принимается, если Т < Тозтабл -нулевая гипотеза отвергается.
Рассмотрим методику расчета критерия Т на следующем примере (табл.21). £ рангов отрицательных значений =1+5+2+7=15.
S рангов положительных значений =6+4+8+9+3= 30.
Таблица 21 Измерение общего белка сыворотки крови «до» и «после» паллиативной операции
исследуемые | Общий белок сыворотки крови в | разность значе | Ранг абсолют | |
больные | г/л | ний | ного | |
| до операции, Vi | после операции, V2 | (V2-Vl) | значения разности |
) | 2 | 3 | 4 | 5 |
1 | 84,0 | V) Ч fH-,J | -1,7 | |
2 | 00 "7 00, / | QQ 7 70, / | 10,0 | 6 |
3 | 00 Л об,и | 94,0 | 6,0 | 4 |
4 | QC f\ 6J,U | 107,2 | 22,2 | 8 |
5 | У) •3 Oi., J | 75,2 | -7,1 | 5 |
6 | 76,3 | 106,0 | 29,7 | 9 |
7 | 98,7 | 94,4 | -4,3 | 2 |
| ОТ ( о/,6 | 93,1 | 5,5 | 3 |
9 | 88,2 | 70,5 | -17,7 r\ | 7 |
В нашем примере число наблюдений равно 9, которому соответствует табличное значение Tos = 7. Вычисленный нами критерий Т = 15 больше табличного, следовательно нулевая гипотеза принимается. Это указывает на случайный характер отмеченных колебаний количества общего белка в плазме крови, то есть колебания не зависят от паллиативного хирургического вмешательства.
2. Критерий знаков (Z).
В данном случае учитывается только направленность изменений:
«до» и «после» (при снижении значения величины ставится знак «-», при увеличении - «+»). Затем определяется сумма полученных знаков (Е(«->>) и £(+)). Меньшая величина сравнивается с табличным значением (приложение № 13). Если рассчитанное значение Z 2табл, нулевая гипотеза принимается; если меньше - отвергается (то есть различия признаются неслучайными).
Рассмотрим это на конкретном примере (табл. 22).
63
Таблица 22 Измерение лейкоцитов крови до и после приема 100 мл 0.5% раствора новокаина
Больные | Количество лейкоцитов в крови | разность величин | ||||||
до приема новокаина | после приема новокаина | |||||||
через 30 мин | через 1 ч | через 30 мин | через 1 ч | |||||
1 | 2 | 3 | 4 | 5 | 6 | |||
1 2 3 4 5 6 8 | 7600 Й600 7600 «800 <ЮОО 0000 :)200 10600 | 6800 7400 9200 8200 6400 5800 5800 10250 | 10200 10200 9200 10600 7800 7200 6600 14450 | | '+ '+ '+ | | | '+" '+" '+" '+" '+" •+" '+" •+" |
| £("-") = 5 £("+") = 3 | S("-") = 0 £("+") = 8 |
При числе наблюдений равном 8 7табл=1. Критерий знаков через 30 мин после приема новокаина равен 3-м, то есть больше 7табл, следовательно, можно считать, что отмеченная разность лейкоцитов несущественна. Критерий Z через 1 час после приема новокаина равен О, он меньше Zra6n, что дает основание с достоверностью более чем на 95% утверждать о существенном различии числа лейкоцитов, то есть о влиянии новокаина на повышение количества лейкоцитов крови.
В. Оценка нескольких независимых выборок
Оценка нескольких независимых выборок производится по методу Немени. Полученные данные записываются в виде следующей таблицы.
Каждому из полученных значений присваивают ранг (независимо от того, к какой из выборок относится то или иное значение). В каждой группе ранги суммируются.