Организация и методика статистического исследования

Вид материалаЗакон

Содержание


Значение среднего квадратического отклонения - ст.
Рис. 1. Теоретическая кривая нормального распределения.
Выборочный) метод. Оценка достоверности средних арифметических и относительных величин
Оценка полученного результата по средней
Достоверность показателей и разности показателей
Vi. методы измерения связи между явлениями
Сила связи
Т абли ца 12 Схема оценки тесноты корреляционной связи по коэффициенту корреляции
Корреляция между среднемесячной температурой воздуха и числом умерших детей до 1 года от кишечных заболеваний
Средняя ошибка коэффициента корреляции.
R мы узнаем, на сколько изменится явление х
Vii. дисперсионный анализ
Методика проведения дисперсионного анализа.
Дисперсия остаточная (случайная)
Дисперсионный анализ изучения влияния шока на окислительный процесс изолированной ткани
Изучение частоты летальных исходов при различных видах экстренной хирургической патологии
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   17

Значение среднего квадратического отклонения - ст.

1. ст характеризует однородность вариационного ряда. Если ст ма­ла, значит ряд однородный, и рассчитанная М достаточно верно ха­рактеризует данный вариационный ряд. Если ст велика, то ряд неод­нородный, наблюдается большая колеблемость вариационного ряда, и полученная М характеризует не весь ряд, а только какую-то его часть.

2. В медицине, здравоохранении интервал М ± 1ст обычно прини­мают за пределы нормы.

3. С помощью ст оценивается «выскакивающий» результат по

формуле: •<"•" ~ м . Если отношение разности между выделяющейся

<7

(«выскакивающей») вариантой и средней арифметической, рассчитан­ной без нее, к среднему квадратическому отклонению, рассчитанному также без выделяющейся варианты, будет равно 3 и более, то такую варианту лучше не включать в исследование.

4. Теоретическое распределение вариант в однородном вариаци­онном ряду подчиняется правилу трех сигм, которое графически изо­бражается кривой Гаусса* (см. рис. 1).



-36 -26 -16 'x +16 +26 +36

М ± 1ст = 68,3% М ± 2ст = 95,5% М ± Зет = 99,7%

Рис. 1. Теоретическая кривая нормального распределения.

В природе возможны и другие виды распределения, отличающиеся от нормаль­ного: альтернативное, асимметричное (правостороннее, левостороннее), бимодальное.

33

Если к средней арифметической величине прибавить и отнять от нее одну сигму (М ± 1ст), то при нормальном распределении в этих пределах будет находиться не менее 68,3% всех вариант (наблюдений), что считается нормой для изучаемого явления. Если к М ± 2ст, то в этих пределах будет находиться 95,5% всех наблюдений, а если к М ± За, то в этих пределах будет находиться 99,7% всех наблюдений. Та­ким образом, среднее квадратическое отклонение является стандарт­ным отклонением, позволяющим предвидеть вероятность появления такого значения изучаемого признака, которое находится в пределах заданных границ.

Выборочный) метод. Оценка достоверности средних арифметических и относительных величин

При изучении сплошной (генеральной) совокупности для ее чи­словой характеристики достаточно рассчитать М и ст.

На практике, как правило, мы имеем дело не с генеральной, а с выборочной совокупностью.

Для выборочного метода очень важен способ отбора части от це­лого, так как отобранная часть, как уже упоминалось ранее, должна быть репрезентативной.

При выборке возможны ошибки смещения, то есть такие события, появление которых не может быть точно предсказуемым. Вместе с тем они являются закономерными, объективными, как и необходимые. При определении степени точности выборочного исследования оце­нивается величина ошибки, которая может произойти в процессе вы­борки. Такие ошибки носят название случайных ошибок репрезента­тивности (т) и являются фактической разностью между средними или относительными величинами, полученными при выборочном иссле­довании, и аналогичными величинами, которые были бы получены при изучении всей совокупности.

Средняя ошибка среднего арифметического числа определяется по формуле:

СГ

т= ±~г= Vn

Среднюю ошибку средней арифметической величины можно вы­числить как и сигму, по амплитуде вариационного ряда:

V -V .

+_S22———а-.где

В - коэффициент для определения ошибки, соответствующий числу наблюдений (приложение 1).

В приведенном примере средняя ошибка составила ±0.16 дней.

о- 1.63 1.63

Тпж-

А при расчете по амплитуде вариационного ряда:

24-16 " г- - /• _— +о\-/р,неи, что достаточно близко к средней ошибке,

46.9 рассчитанной по обычной формуле.

При оценке полученного результата по размеру средней ошибки, пользуются доверительным коэффициентом (t), который дает возмож­ность определить вероятность правильного ответа, то есть он указы­вает на то, что полученная величина ошибки выборки будет не боль­ше действительной ошибки, допущенной вследствие сплошного на­блюдения. Так, если принять t = 2.6, то вероятность правильного от­вета составит 99.0%, а это означает, что из 100 выборочных наблюде­ний только один раз выборочная средняя может оказаться вне преде­лов генеральной средней. При t = 1 вероятность правильного ответа составит лишь 68.3%, а 31.7% средних могут оказаться вне вычислен­ных пределов. Следовательно, увеличением доверительной вероят­ности увеличивается ширина доверительного интервала, что в свою очередь повышает достоверность суждения, спорность полученного результата (табл. 10).

Таблица 10 Оценка полученного результата по средней ошибке

Доверительный коэффици­ент (критерий точности)

Опорность результата (достоверность) Pi

Риск ошибки

р

ti = М ± 1т t2 = М ± 2т t2,6 = М ± 2,6т t3 = М ± Зт 1з,з = М ± 3,3т

68,3% (Pi - 0,683) 95,5% (Pi - 0,955) 99,0% (Pi - 0,990) 99,7% (Pi - 0,997) 99,9% (Pi - 0,999)

0,317 0,05 0.010 0,003 0,001


В медико-статистических исследованиях обычно используют до­верительную вероятность (надежность), равную 95,5-99,0%, а- в наи­более ответственных случаях - 99,7%.

Таким образом, если ст является доверительной вероятностью по­явления необходимых данных в заданных границах, то m является доверительным интервалом, с помощью которого определяются гра­ницы возможного размера изучаемого явления.

Зная размер ошибки, можно, как отмечалось выше, правильно оп­ределить требуемое число наблюдений для выборочного исследования при помощи преобразования формулы предельной оши(жи выборки

/(дельта) = t-m -=• —г=- » в которую входит величина п - число наблю-

\ V/2

дений.

Решая приведенное равенство относительно п, получим формулу для определения числа наблюдений:

t2- п=--

Для примера воспользуемся данными изучения средней длительно­сти пребывания больных в специализированном отделении. Здесь М = 20 дн., о- = ±1,63 дн., т = ±0,16 дн. Сколько же нужно дополнительно исследовать больных, заведомо оперируя ошибкой выборки больше полученной (А = ±0,5 дн.), при доверительной вероятности t = З?

[Определяем требуемое число наблюдений:

З.бЗ2 9-2.66 n="~0~~~025~=951 Вывод: для того, чтобы оперировать в использованном нами при­мере с указанной точностью (99,7%), следует подвергнуть изучению 95-96 больных. Нами исследовано 95 больных, что соответствует ис­комой величине.

<;' Достоверность разности средних величин

На практике нередко приходится иметь дело не с одной, а с двумя средними: надо сравнить среднюю длительность пребывания больных в 2-х стационарах или за отчетный год и предыдущий, результаты, полученные при исследовании 2-х групп больных, лечившихся разны­ми методами, исследуемую группу и контрольную и т.д. Целью срав­нения двух средних является оценка существенности их различий, ус-гановление их достоверности.

Достоверность разности между двумя средними величинами опре­деляется по формуле:

М, - М, , , t= ' --.где

ггг+т

М, н М - две средних арифметических величины, полученные в двух самостоя­тельных независимых группах наблюдении;

т, и w, - их средние ошибки (выражение -Jm,2 + т называют средней ошибкой

)азности двух средних),

/ - доверительный коэффициент для разности средних.

При / >2 разность средних арифметических может быть признана существенной и неслучайной, то есть достоверной. Это значит, что и в •енеральной совокупности средние величины отличаются, и что при ювторении подобных наблюдений будут получены аналогичные раз-1ичия. При / = 2 надежность такого вывода будет не меньше 95%. С увеличением / степень надежности также увеличивается, а риск ошиб-'<;

ки уменьшается. При t < 2 достоверность разности средних величин считается недоказанной. Например, в больнице «А» средняя длитель­ность пребывания больного на койке равна 16,2 дн., m = ±1,5 дн.; в больнице «В» - 14,8 и 1,0 соответственно. 16.2-14.8 1.4

"таг-иг0-8

Различие средних арифметических недостоверно, статистически незначительно. Но нельзя в таких случаях говорить о том, что «нет разницы»!. Различие есть, но оно может быть случайным, недостовер­ным.

В сопряженных совокупностях (зависимых рядах) оценка досто­верности разности средних проводится про формуле:

рад»

/ = —————

pa'Jit

Алгоритм расчета.

1. Составляем два вариационных ряда (например, по уровню ар­териального давления у больных до и после введения гипотензивного препарата).

V,

V:

paw

dV,-M,

"I

190 180 170 170 165

170 150 165 160 150

20 30 15 10 15

2 12 -3 -8 -3

4 144 9 64 9


Z;"'

2. Составляется вариационный ряд из разности вариант (Уразн = Vi

-V2).

3. Для нового ряда рассчитываются все его характеристики: Мразн,

Оразн, ГПразн.

1>,5 20+30+15+10+15 М = ——— = —————-————— = 18(лш)

П J

f~4~л I—————

тгТ5'7 "'-у1

1 О

4. Определяем / - -!°. 59-" " 2.6

5. Так как п < 30, полученное значение t сравниваем с табличным (приложение № 2).

Полученное нами t > 1табл о.99, следовательно полученная средняя разность в уровнях АД (18 мм рт. ст.) существенна и неслучайна, то есть достоверна.

Достоверность показателей и разности показателей

Достоверность показателя определяется с помощью его средней

ошибки по формуле: / = ± \- •> гae Р ~ РзэР показателя, выраженный в

V п

долях единицы, в процентах, в промилле; q - равно 7 или 100 - р или 1000 -р (величина, дополняющая показатель до основания); п - число наблюдений.

Например; обследовано 1800 больных, из них выявлено 90 боль­ных гипертонической болезнью I ст. Процент выявленных больных по

данным проведенного осмотра равен: ————=5 случаев на 100 ос-1800

мотренных. „, = + )5'95 п 5 • Следовательно, с вероятностью 95.5%

~Vl800

показатель выявляемости больных с ГБ-1 в аналогичных условиях будет колебаться в пределах Р ±2т = 5 ±2 • 0.5 = 5 ± 1.0, то есть от 4 до 6 случаев на 100 обследованных.

Достоверность различий между сравниваемыми показателями вы­числяется по формуле, аналогичной для средних величин:

t--

/W)2 + т}

Оценивается критерий различия показателей также, как и средних величин.

Для примера сопоставим уровни общей летальности в двух боль­ницах'




Больница №1

Больница №2

Число лечившихся

4350

6760

Из них умерло

196

236

Летальность

4.5% (Pi)

3.5% (Р2)


q = 100% или когда показатель равен 100% = ]00%) или близок к 100%, а q = 0, следует узнать, а каким бы мог быть показатель изучае­мого явления при других условиях отбора (другое число наблюдений, другой состав больных по полу, возрасту и т.д.)? Для этого пользуются специальной формулой, по которой можно вычислить «ожидаемый»

д+1 уровень показателя: р, = ——. 100%, где

' п+2

а - результативный показатель (Р).

Допустим, что в больнице лечилось экспериментальным методом 60 больных (п), среди которых летальных исходов не было (Р = 0%). Вы­числяем «ожидаемый» показатель летальности:

/',=. юо«/. =1.6%.

Ошибка такого показателя определяется по формуле:

[~pq~ /1.6-98.4 /158.2 , w- - 43 = 43- = 4~W = L58%-При t = 2 возможны колебания ожидаемого показателя в пределах от 0% до 4.76% (1.6 ± 3.16).

Малая выборка

В клинических и экспериментальных работах довольно часто при­ходится пользоваться малой выборкой, когда число наблюдений меньше 30. При малой выборке средние величины и показатели вычисляются по тем же формулам, что и при большой. При вычислении среднего квад-ратического отклонения и средней ошибки показателя число наблюде­ний уменьшается на единицу:

„.,Ж; „,=J

V п-\ \п-\

Достоверность результатов (t) оценивается по таблице Стьюдента. Обращаться с таблицей Стьюдента следует по графе 1-й, в которой ука­зано число степеней свободы (п'), равное п - I, то есть числу проведен­ных наблюдений уменьшенному на единицу. Данные 2, 3 и 4-й граф ис­числены для вероятности правильного заключения, равной: 95% - графа 2, при риске ошибки 5% (Роз); 99% - графа 3, при риске ошибки 1% (Poi) и 99.9% - графа 4, при риске ошибки 0.01% (Pool).

VI. МЕТОДЫ ИЗМЕРЕНИЯ СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ

Корреляционный анализ.

Одной из важных задач исследовательской работы является выяв­ление и измерение связи между признаками, характеризующими изу­чаемые явления или процессы. Различают функциональную и корре­ляционную связи.

При наличии функциональной связи изменение величины одного признака неизбежно вызывает совершенно определенные изменения величины другого признака. Примером такой связи может служить зависимость площади круга от его радиуса. Функциональная связь между явлениями присуща неживой природе. В биологических науках чаще приходится иметь дело с иной связью между явлениями, когда одной и той же величине одного признака соответствует ряд варьи­рующих значений другого признака, что обусловлено чрезвычайным многообразием взаимодействия различных явлений живой природы. Такого рода связь носит название корреляционной (correlation - соот­ветствие, соотносительность). В то время как функциональная связь имеет место в каждом отдельном наблюдении, корреляционная связь проявляется только при многочисленном сопоставлении признаков.

Рассмотрим, например, связь между возрастом детей-дошкольников и их ростом. Из приведенных данных видно, что с воз­растом рост детей увеличивается, и поэтому можно предположить на­личие связи между указанными признаками.

Табл и ца

Возраст

3 года

4 года

5 лет

6 лет

7 лет

Рост в см

100,3

102,9

108,1

113,7

118,3

92,6

100,1

106,8

113,8

119,2

93,8

101,6

107,8

113,3

119,4

93,7

98,4

104,6

111,8

116,1

"94,2

99,4

107,4

112,1





Вместе с тем, следует отметить, что одному и тому же возрасту со­ответствует различный рост детей. Это происходит потому, что рост детей определяется не только возрастом, на него влияют многие дру­гие факторы, в том числе условия жизни, питание, занятия физкульту­рой и др. Таким образом, можно прийти к выводу, что связь между возрастом и ростом детей является корреляционной.

Исследователю следует помнить, что обнаружение корреляции между сопоставляемыми явлениями не говорит еще о существовании причинной связи между ними. Для установления последней необходим всесторонний логический и специальный анализ существа изучаемых процессов. Статистический же метод позволяет обосновать получен-

40

ные в результате научного исследования выводы о наличии тех или иных связей между явлениями, выделить самые главные из них.

Сила связи между явлениями, ее теснота и направленность опреде­ляются величиной коэффициента корреляции, который колеблется в пределах от 0 до ±1. При г == О связь отсутствует, при г = ±1 - связь полная, функциональная.

, 1л

rs\'~~г.

По направленности связь между явлениями может быть прямой (положительной), когда с увеличением (уменьшением) значений одно­го признака увеличиваются (уменьшаются) значения другого (то есть когда признаки меняются в одном направлении), и обратной (отрицательной), когда с увеличением значений одного признака зна­чения другого уменьшаются и наоборот (то есть изменения признаков - разнонаправленны).

Т абли ца 12 Схема оценки тесноты корреляционной связи по коэффициенту корреляции

Теснота связи

Величина коэффициента корреляции при наличии

прямой связи (+)

обратной связи (-)

Связь отсутствует

0

0

Связь слабая

от 0 до +0,3

от 0 до -0,3

Связь умеренная

от+0,3 до+0,7

от-0,3 до-0,7

Связь сильная

от +0,7 до + 1,0

от--0,7 до-1,0

Связь полная (функциональная

+1,0

-1,0


Приведем пример вычисления коэффициента корреляции по при­веденной формуле (таблица 13).

Ход вычислений здесь чрезвычайно прост. Суммируя ряды х и у, получаем zjc = 119 и 1.у = 105.2. Деля суммы на число членов ряда (п), получаем средние арифметические этих рядов: М, = 779; 72 = 9.9 и My = 705 ; 72 = 8.8. Ряды d„ и dy, то есть отклонение чисел рядов х и у представляют собой разность между соответствующими значениями х и у и средними арифметическими этих рядов. Так, для рядов х, d рав­но для января: х - М = 5 - 9.9 = -4.9; для февраля: х-М=2-9.9=-7.9 и т.д. Возводя поочередно числа рядов d и dy в квадрат, получаем ряды d2 и dy2, а перемножая попарно числа рядов d. и dy между собой, получаем ряд • dy. Подставляем значения сумм этих рядов в форму­лу:

, ., >

"""л-к

41

Таблица 13

Корреляция между среднемесячной температурой воздуха и числом умерших детей до 1 года от кишечных заболеваний

Месяц

х

У



















года

средняя тем­пература воз­духа (в °С)

среднедневные числа умерших от острых ки­шечных ин­фекций

d

X

dy

dx2

dy2

dxdy

январь

5

5,0

-4

9

-3,8

24,01

14,44

18,62

февраль

2

5,5

-7

9

-3,3

62,41

10,89

26,07

март

4

6,2

-5

9

-2,6

34,81

6,76

15,34

апрель

8

5,4

-1

9

-3,4

3,61

11,56

6,46

май

15

6,5

5,




-2,3

26,01

5,29

-11,73

июнь

17

9,6

7,




0,8

50,41

0,64

5,68

июль

18

11.2

8,




2,4

65,61

5,76

19,44

август

17

15,3

7,




6,5

50,41

42,25

46,15

сентябрь

15

14,9

5,




6,1

26,01

37,21

31,11

октябрь

9

13,0

-0,

9

4,2

0,81

17,64

-3,78

ноябрь

6

7,0

-3,

9

-1,8

15,21

3,24

7,02

декабрь

3

6,2

-6,

9

-2,6

47,61

6,76

17,94

п= 12

Sx=119

-.о

£y= 105.2

105.2 Л/„=-"8.8










= 406.92

Zdy 162.44

Sddy = 178.32


•• , получим: у 178-32 =0.686 «0.7 ; w V406.92.162.44

и То есть между среднемесячной температурой воздуха и числом умерших от острых кишечных инфекций существует прямая корреля­ционная связь.

Это чрезвычайно простое для понимания вычисление требует до­вольно кропотливой, хотя и несложной математической работы. Вы­числительная работа особенно затрудняется тогда, когда члены кор-релирумых рядов имеют большие числовые значения, особенно если варианты коррелируемых рядов приведены в виде сгруппированных интервалов и, следовательно, приходится вычислять не простую, а взвешенную среднюю.

Средняя ошибка коэффициента корреляции. Поскольку коэффици­ент корреляции в клинических исследованиях рассчитывается обычно для ограниченного числа наблюдений, нередко возникает вопрос о надежности полученного коэффициента. С этой целью определяют среднюю ошибку коэффициента корреляции. При достаточно боль­шом числе наблюдений (больше 100) средняя ошибка коэффициента корреляции (mr) вычисляется по формуле:

1- т, = —J— . где

П

n - число парных наблюдений.

В том случае, если число наблюдений меньше 100, но больше 3( точнее определять среднюю ошибку коэффициента корреляции, поль зуясь формулой:

i-. "TirT

С достаточной для медицинских исследований надежностью о на личии той или иной степени связи можно утверждать только тогда когда величина коэффициента корреляции превышает или равняется

величине трех своих ошибок (г > Зт,.). Обычно это отношение ко

эффициента корреляции (гху) к его средней ошибке (mr) обозначай буквой / и называют критерием достоверности:



т,

Если > 3, то коэффициент корреляции достоверен. Допустим, что число наблюдений 142, а коэффициент корреляции

068 Тпгпя- ~г 1 - (0.68)2 .- „ г 0.68 ,. тп рпч. и.об. 1 огда. yyi = —/=— = ——/====— = 0.045 » а / = — — —— —15° естъ

г VT42 ' w, 0.045 коэффициент корреляции вполне достоверен.

В случае малой выборки (число наблюдений меньше 30) для оцен­ки достоверности коэффициента корреляции, то есть для определения соответствия коэффициента корреляции, вычисленного по выбороч­ным данным, действительным размерам связи в генеральной совокуп­ности, средняя ошибка коэффициента корреляции (mr), определяется

ю формуле: = v " , где значения критерия / = J— оцениваются r V/i-2 г т,

ю таблице t Стьюдента при числе степеней свободы v = п - 2. Если »еличина tr больше табличного значения to5, то коэффициент призна-'тся надежным с доверительной вероятностью больше 95%. Напри­мер, имеется коэффициент, равный +0.72 при числе наблюдений 28.

-2=-19 -

Полученное tr = 35.9 значительно больше табличного toi=2.779, ледовательно, полученному коэффициенту корреляции можно дове­ять с высокой степенью вероятности (> 99%).,

Для того, чтобы установить, на сколько может измениться одно явление при изменении другого на единицу, вычисляется коэффициент регрессии (R):

. А.-.?-

При вычислении Ry мы узнаем, на сколько изменится явление у при изменении на 1 единицу измерения х.

При вычислении R мы узнаем, на сколько изменится явление х при изменении на 1 единицу измерения у.

Например, при изменении роста (х) и массы тела {у) у семилетних мальчиков были получены следующие данные:

гху = 0.69

<Тх = 5.8 см ' cry = 2.6 кг

Вычислим коэффициенты регрессии:

R„.=0.69•5-s=\.5кг R = 0.69= 0.3 \см. 2.6 э.о

Вывод: при увеличении роста мальчиков в среднем на 1 см масса тела увеличивается в среднем на 1.5 кг; при увеличении массы тела в среднем на 1 кг рост увеличивается в среднем на 0.31 см.

Ошибки коэффициентов регрессии вычисляются по формулам:

=a-. | '"rv1' ; _ flr' | ч' , а достоверность коэффициента R\y а, V п . й" о-, V п

регрессии - по формуле: / = —. т

При п > 30 результат считается достоверным, когда t>.3, при п < 30 критерий / оценивается по таблице Стьюдента.

Для оценки степени связи качественных признаков рассчитывается коэффициент сопряженности (при числе групп не менее 5):

г"

С) "

=J, ,7

\\+ф~ Методика расчета приведена в таблице 14. Алгоритм расчета.

1. Вносим в таблицу данные о количестве случаев различных по гистологической структуре и типу опухолей (Vi-Vu), которые называ­ются частотами.

2. Возводим частоты в квадрат (V2).

3. Полученные числа делим на общее число больных с разными типами опухолей (п): уз/п.

Таблица 14

Гистоло­гическая структура опухоли

Типы роста опухоли

частости

ЕГ2

——:ЪУ




ЭКЗО-

фит-

НЫЙ

язвенно-инфиль-тратив-ный

диффуз-но-инфи-льтра-тивный

пере­ход­ный

всего,

£V

п

1

2

3

4

5

6

7

8

аденокар-цинома

V, V,2 Vin

11

121 6,05

6 36 1,09

2 4 0.29

2 4 0,67

21 8,10

8,10/2,1 =0,39

Cr simplex

V2

V22

V22/»!

3 9 0,45

10 100 3,03

1 0,07

1 1

0,17

15

3,72

3,72/15=0,25

солидный рак

Уз Уз2 Узп

3 9 0,45

5 25 0,76

3 9 0,64

1 1

0,17

12

2,02

2,02/ 12=0,17

слизистый рак

V4 V42 V42/n

0,05

7 49 1,40

3 9 0,64



11 2,17

2,17/ 11 =0,20

фиброзный рак

V5 V52 V52/n

-

1 1 0,03

5 25 1,78

-

6 1,81

1,81/6=0,30

смешанный рак

V6 V„2 Ve'/n

2 4 0/20

4 16 0,48

~

2 4 0,67

8 1,35

1,35/8=0,17

n=£(Vi-V6)




20

33

14

6

73

£:= 1,48 Коэффициент сопричастия


4. Находим суммы частот и суммы полученных в р. 3 частных, вносим их в колонку 7.

'LV1

5. Находим частости (колонка 8) следующим образом: ——:S)/

п (для каждой структуры опухолей).

6. Суммируя частости, получаем коэффициент сопричастия.

7. Рассчитываема: у~=- коэф.сопричастия - 1 =1.48-1=0.48

8. Рассчитываем коэффициент сопряженности:

ДИг324-0-57

9. Оценка коэффициента сопряженности производится аналогично коэффициенту корреляции.

В данном случае связь между гистологической структурой опухо­ли и типом роста носит прямой характер и умеренно выражена.

45

VII. ДИСПЕРСИОННЫЙ АНАЛИЗ

Дисперсионный анализ позволяет дать обобщенную характери­стику трем и более средним величинам или показателям и позволяет:

- измерить силу влияния;

оценить разность частных средних или показателей;

определить достоверность разности частных средних или пока­зателей.

Дисперсионный анализ показывает степень рассеивания, вариации (дисперсии) измеряемых признаков вокруг среднего типичного уров­ня, поэтому он дает возможность изучить действие на конечный ре­зультат исследования нескольких факторов вместе, роль каждого из них и сравнить действие отдельных факторов между собой.

Изучение действия факторов производится путем сравнения сред­них значений наблюдаемого признака, полученных в результате воз­действия каждого из этих факторов при разном их сочетании.

Различают следующие виды дисперсионного анализа: однофак-торныи, двухфакторный и многофакторный.

Методика проведения дисперсионного анализа.

Факторами принято называть любые воздействия или состояния определяющие ту или иную величину наблюдаемого (результативного) признака. Отдельные значения результативного признака именуются датами.

Вариация изучаемого признака зависит как от организованных (запрограммированных), так и от случайных (неизвестных) факторов. Поэтому общая вариация (дисперсия) слагается из вариации, вызван­ной организованными факторами - факториальной вариации и ва­риацией, вызванной остаточными, неизвестными, случайными факто­рами - случайной вариации.

Таким образом, общая дисперсия (Соб) равна сумме дисперсий факториальной (Сф) и случайной (Сел).

v-об = Сф ' Сел

В своюочередь, общая дисперсия признака равна сумме квадратов

отклонений каждой даты результативного признака (V) от общей средней (Моб):

Соб = £(V - Моб)2

Факториальыая дисперсия (межгрупповая) измеряется суммой квадратов отклонений групповой средней (Мгр) от общей средней

(Моб):

Сф = ЦМгр - Моб)2

Дисперсия остаточная (случайная) - внутригрупповая - определя­ется суммой квадратов отклонений каждого значения результативно­го признака (V) в группе от средней этой группы (Мгр):

Ссл=2:(У-Мгр)2

Доля (сила) участия отдельных факторов в формировании резуль­тативного признака определяется отношением групповых дисперсий к общей. Вычислением отношения факториальной дисперсии к общей определяется сила влияния организованного фактора, а отношением случайной дисперсии к общей определяется сила влияния неорганизо-

С С

ванных факторов: _J-.ioo%> n2 = -sn- • 100% • При определении с с1

'-,16 'Об

достоверности влияния факторов применяется критерий Фишера, ко­торый вычисляется по следующей формуле: р = ф-, где ст2 (так пазы-

ваемая девиата) обозначает дисперсию (вариацию), приходящуюся на один элемент свободного варьирования или на одну степень свободы. Вычисление девиат производится по следующим формулам:

- с ; . ___.с!————; , ..———__.._ " п - \ ''' кол - во групп -1 " п - кол - во групп

Оценивается критерий F по специальной таблице (приложение №3). Табличное значение F находится на пересечении граф: вертикальной, где значится число степеней свободы для меньшей дисперсии. Если величина F равна или больше табличной - влияние фактора доказано. Рассмотрим следующий пример (табл. 15).

В приведенном примере шок - организованный фактор, уровни поглощения кислорода - результативный признак. Чтобы судить о влиянии видов шока на окислительный процесс, необходимо опреде­лить средние уровни поглощения кислорода в каждой группе и всей совокупности. Мы видим (см. графу 3 табл. 15), что вычисленные средние арифметические в разных группах колеблются и отличаются от общей средней. Следует доказать силу влияния вида шока на уров­ни поглощения кислорода и достоверность его воздействия. Для этого определяются размеры дисперсий (см. графы 4, 5 и 6 табл. 15);, затем сила влияния организованного фактора г|2 и критерий F, после предварительного вычисления ст2:

rf = — .100% = -100% = 87.7%

—————--4967.5 ' кол - во групп -1 3-1

Изучение окислении (степени поглощения кислорода) изолированной ткани при разных видах шока

Вид шока (основной фактор)

Степень поглоще­ния кисло­рода (результа­тивный признак), V

Средние Уровни окисле­ния

ЕГ

м =—-

w




Дисперсия

Общая,

С,=ЦУ-М,)1

Факториальная,

CUM,-M--N

Случайная (остаточная

C,,=£(-A,)2

'

2

3

4

5

6

анафила­ктический

228 206 217

М,-р=217

(228-239)2= =121 =1089 -489

(239-217)2.3= =222.3=1452

(228-217)2= =121 121 0

гетеро-трансфу-зионный

240 223 213 201 238

М,р=223

(240-239)2= =1 =256 =676

=1444

(239-223)2.5= =162.5=1280

(240-223)2= =289 =0 =100 =484 =225

травма­тический

291 295' 278

N-1:!

Мгр=288

(291-239)2= =2704 =3136 -1521

(239-288)23= =492.3=7203

(291-288)2= =9 =49 -100







Мо=239

Со=11433

Сф-9935

Сел-1498


_ С, 1498 , °tA ~ „, —————————-~-=1о/.2

N - кол - во групп 11-3

4967.5 F=-JI=5

Табличное значение F находится в данном случае на пересечении вертикальной 2-й графы (так как число степеней свободы для большей дисперсии равно: кол-во групп - 1 = =3-1 = 2 и горизонтальной 8-й строки (так как число степеней свободы для меньшей дисперсии рав­но: N - кол-во групп =11-3=8). Итак, рассчитанный критерий т]2 говорит о большой силе влияния вида шока на степень поглощения кислорода, а величина F, превышающая табличное значение

4.46-865,

\F "рТр" позволяет считать полученные результаты досто-г '»}

верными. Результаты дисперсионного анализа можно выразить в виде таблицы (табл. 16).

Таблица 16

Дисперсионный анализ изучения влияния шока на окислительный процесс изолированной ткани

Виды факторов

Диспе­рсия,

С

Сила влия-ния в

%, ц2

Число степе­ней свобо-ды

Девиа­та,

(J2

Fp

'о;

Табличное значение F

Pos

Poi

Шок (основной фактор) Остаточные факторы (случайные)

9935 1498

87.7 12.3

2 8

4967.5 187.2

26.5

4.46

8.65

Всего

11433

100.0

10














При сравнении трех и более показателей дисперсионный анализ проводится по следующей схеме (табл. 17).

Таблица 17

Изучение частоты летальных исходов при различных видах экстренной хирургической патологии




Число опериро­ванных, N

Из них умерло, m

Частота ле­тальных ИСХО­ДОВ

Р

N

Квадрат колеба­ний результатив­ного признака, т~

А=-

1

2

3

4

5

1. Аппендицит

120

1

1/120=0.01

12/120=0.01

2. 0. Кишечная непро­ходимость

60

3

3/60=0.05

y/6Q=OA5

3. Ущемленная грыжа

80

2

2/80=0.03

2•!/80=0.05

4. Прободная язва

30

5

5/300=0.02

52/300=0.08

5. 0. Холецистит

50

3

3/50=0.06

У/50=0.\»

6. 0. Панкреатит

30

6

6/30=0.20

W30=l.20

7.ВСЕГО

ZN = 370

£m = 20

20/370 = =0.05

£h= 1.67


Определяются частота летальных исходов (Р) и квадрат колебаний (h) результативного признака при каждом заболевании (см. графы 4 и 5 табл.17).

Расчеты показали, что частота летальных исходов колеблется от 0.01 при аппендиците до 0.20 при остром панкреатите. Следует уста­новить достоверность и силу влияния вида патологии на частоту ле­тальных исходов, то есть определить критерии F и ст2. Для этого вы­числяются дисперсии по приведенным ниже формулам, где величина Н определяется отношением квадрата суммы результативного при­знака (в нашем примере - число летальных исходов) к общему числу наблюдений.

-¥-

С„=т-Н= 20-1.08 =18.92 Сф =h-H= 1.67 -1.08 =0.59 --l 8.92 -0.59 =18.33 или £„,-£/,=20 -1.67 =18.33 Затем вычисляются <т , <т и критерий F.

-——сф——г

кол - во групп -1 6-1

° „——са——— = = 0.05

Л'-кол-во групп 370-6

"-Л-°——-г

0-05

Полученный критерий F больше табличного (р<0.05) (приложение № 3), что подтверждает влияние характера патологии на частоту ле­тальных исходов. Однако, доля влияния учтенного фактора

(патологии) на уровень частоты летальных исходов равна лишь 7.08/0

171 S10-3

Полученные данные свидетельствуют о том, что на частоту ле­тальных исходов влияют и другие факторы (возраст больных, сроки доставки от начала заболевания, степень тяжести при поступлении, сопутствующие заболевания, качество лечения и ухода и т.д.)