Регрессионный анализ корелляции субъективного ВАШ и лабораторных признаков активности реактивного артрита
Курсовой проект - Математика и статистика
Другие курсовые по предмету Математика и статистика
/b> исходя из полученного уравнения, можно сделать вывод о том, что наилучшим предсказывающим фактором для ВАШСП является фибриноген.
Зависимость ВАШБП и ВАШСП от показателей активности в динамике
Разобьем наши данные на три группы. В первую группу войдут данные полученные до лечения. во вторую данные после 2 месяцев лечения а в третью после трех месяцев.
Так как ранее мы уже проводили исследование на проверку распределения выборок то мы можем воспользоваться параметрическим методом дисперсионного анализа для проверки различий средних. Проверка необходима для подтверждения целесообразности разделения данных, если это подтвердится, то затем мы рассчитаем для каждой группы уравнение зависимости ВАШСП и ВАШБП от показателей активности заболевания.
3 Дисперсионный анализ
Таблица 2.1.1. Зависимость Hb от стадии лечения
1 группа2 группа3 группа124125134124115104110118130931171361331141501291231361491501051221251461451031461241421389915015812514015413794141156129134148156150138141150144148114133141109145135157121150161126150133128127166120158168150131136123162142150121118160144126139160140152140101146110123142135117137106151148126142130154144152140120126110107118116114140136124166122120128150115165112143124132137130130126160166150168128126114142156170119128163135120120106130156114137142121140121136125138150154127153120171128124130127130138122160104121131127109158132134164
После вычислений получаем:
p =0.7913
Запишем выходные данные в таблицу дисперсионного анализа
Таблица №2.1.2. Дисперсионный анализ по одному признаку.
Компонента дисперсииСумма квадратов
Степень свободы
Средний квадратМежду выборками136,7268,326Остаточная51587,5177291,455Полная51724,2179-----
p>pкр
Вывод:
Следовательно мы принимаем нулевую гипотезу, т.е. можно предположить что при 5% уровне значимости уровень гемоглобина в крови не зависит от стадии лечения.
Таблица 2.2.1. Зависимость СОЭ от стадии лечения
1 группа2 группа3 группа181451941042121566173251431053813249284053303266192832382632869101255523348355266161435125448141951028512574661511322610102210512102412341337386182510582210103041721015323846125565103123511123941043024241140721279203442413516136223450281464309321021372226126118121026641225440521862407538
После вычислений получаем:
p = 0.0219
Запишем выходные данные в таблицу дисперсионного анализа
Таблица №2.2.2. Дисперсионный анализ по одному признаку.
Компонента дисперсииСумма квадратов
Степень свободы
Средний квадратМежду выборками136,7268,326Остаточная51587,5177291,455Полная51724,2179-----
p<pкр
Вывод:
Следовательно мы отвергаем нулевую гипотезу, т.е. можно предположить что при 5% уровне значимости СОЭ зависит от стадии лечения. Используя функцию multcompare, целесообразно определить для какой пары выборок средние арифметические значения имеют статистически значимое различие. Для проверки такой параметрической гипотезы используется процедура множественного сравнения. При проверке простой параметрической гипотезы (нулевой гипотезы) о равенстве средних одной группы выборок по отношению к другой по статистике t необходимо задать уровень значимости , определяющий критическое значение статистики. Примем равным 0,05. Это означает, что в 5% случаев будет неверно отвергнута нулевая гипотеза.
При увеличении групп выборок, увеличивается число проверяемых гипотез.
При использовании простой параметрической гипотезы по статистике t, уровень значимости будет применяться к каждой гипотезе отдельно, что повлечет к росту вероятности неверно отвергнуть нулевую гипотезу пропорционально количеству выполненных проверок. Т.е., неверно определить значимое отличие выборочных средних. Процедура множественного сравнения обеспечивает заданный уровень значимости для каждой проверки.
Выходной параметр с представляет результаты множественного сравнения в виде матрицы из 5 столбцов. Срока матрицы с соответствуют результатам проверки одной параметрической гипотезы. Таким образом, каждая строка с соответствует одной паре выборок. Первые два значения в строке с показывают номера сравниваемых выборок, пятый - величину разности средних арифметических сравниваемых выборок, четвертый и третий столбцы - 95% доверительный интервал полученной разности средних арифметических.
Таблица 2.2.3 Различия между средними для СОЭ
№ группы№ группыНижняя граница доверительного интервалаРазница средних арифметическихВерхняя граница доверительного интервала1 группа2 группа-1.23315.312711.85851 группа3 группа0.57457.442014.30962 группа3 группа-5.73542.12939.9941Полученные значения показывают, что значимая разница средних арифметических наблюдается между 1 и 3 группой, величина их разности равна 7.4420, 95% доверительный интервал полученной разности средних арифметических составил [0,5745, 14.3096]. Различия считаются значимыми, если в доверительный интервал не попало нулевое значение. Т.е. средние арифметические выборок статистически значимо отличаются друг от друга, для .
Отобразим графически значения средних арифметических и их доверительных интервалов. Два выборочных средних значимо отличаются, если их доверительные интервалы не пересекаются на графике. При наложении границ доверительных интервалов двух средних арифметических, различие между ними можно считать статистически незначимым.
Таблица 2.3.1. Зависимость СРБ от стадии лечения
1 группа2 группа3 группа0006009600192000600096004801920048000484800019201276860603840019296012240486000096000004800000120060060000096004801260960000480000004800001207680096000048004800096096124800006066048066012001920648600000012126004800000096000480384480000
После вычислений:
p = 0.4019
Запишем выходные данные в таблицу дисперсионного анализа
Таблица №2.3.2. Дисперсионный анализ по одному признаку.
Компонента дисперсииСумма квадратов
?/p>