Регрессионный анализ корелляции субъективного ВАШ и лабораторных признаков активности реактивного артрита
Курсовой проект - Математика и статистика
Другие курсовые по предмету Математика и статистика
ь ВАШБП от инфекции вызвавшей заболевание
1 группа2 группа3 группа4 группа152545672825576563354050453333454065555580455027205055584825404575450303544455055100483585653020455525784364205045154060501520755040137556283030101555555251545173095702032454025553570403545101528555272530751025452165535303560334554535735556435520533055551570603620381553122340522507095251027402045151725251035701253850565575025520215101515233531037После вычислений получаем:
p = 0.4569
Таблица №1.5.2. Дисперсионный анализ по одному признаку.
Компонента дисперсииСумма квадратов
Степень свободы
Средний квадратМежду выборками1210.53403.498Остаточная82391178462.871Полная83601.5181-----
p>pкр
Вывод:
Следовательно мы принимаем нулевую гипотезу. т.е. можно предположить что при 5% уровне значимости ВАШБП не зависит от инфекции вызывающей реактивный артрит.
VI) Влияние фактора на показатель ВАШСП
Таблица 1.6.1.Зависимость ВАШСП от инфекции вызвавшей заболевание
1 группа2группа3группа4группа2035627053327078682840415540503043656060752556401270686040382042675210833840405380100707080555051415034706578308050153270483825804550207550283930253010194035105529318968606045452570457050395010155020505535205520206025055374040553250405447807865506225525030601970704130431760152041434058095352035404818184060102012105030563581008010302059104020335184015
После вычислений получаем:
p = 0.3222
Таблица №1.6.2. Дисперсионный анализ по одному признаку.
Компонента дисперсииСумма квадратов
Степень свободы
Средний квадратМежду выборками1701.73567.223Остаточная85230.9176484.266Полная86932.5179-----
p>pкр
Вывод:
Следовательно мы принимаем нулевую гипотезу. т.е. можно предположить что при 5% уровне значимости ВАШСП не зависит от инфекции вызывающей реактивный артрит.
В связи с тем что не один из показателей активности заболевания а также показатели ВАШ не зависят от инфекции предшествующей реактивному артриту дальнейшее разделение данных на группы можно считать не целесообразным.
2 Множественная линейная регрессия
Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson. 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной.
В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем. множественная регрессия позволяет исследователю задать вопрос (и. вероятно. получить ответ) о том. "что является лучшим предиктором для...".
Общая вычислительная задача. которую требуется решать при анализе методом множественной регрессии. состоит в подгонке прямой линии к некоторому набору точек.В многомерном случае. когда имеется более одной независимой переменной. линия регрессии не может быть отображена в двумерном пространстве. однако она также может быть легко оценена. В общем случае. процедуры множественной регрессии будут оценивать параметры линейного уравнения вида:
Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Регрессионные коэффициенты (или B-коэффициенты) представляют независимые вклады каждой независимой переменной в предсказание зависимой переменной.
Линия регрессии выражает наилучшее предсказание зависимой переменной (Y) по независимым переменным (X). Однако обычно имеется существенный разброс наблюдаемых точек относительно подогнанной прямой. Отклонение отдельной точки от линии регрессии (от предсказанного значения) называется остатком.
Чем меньше разброс значений остатков около линии регрессии по отношению к общему разбросу значений. тем. очевидно. лучше прогноз. Например. если связь между переменными X и Y отсутствует. то отношение остаточной изменчивости переменной Y к исходной дисперсии равно 1.0. Если X и Y жестко связаны. то остаточная изменчивость отсутствует. и отношение дисперсий будет равно 0.0. В большинстве случаев отношение будет лежать где-то между этими экстремальными значениями. т.е. между 0.0 и 1.0. 1.0 минус это отношение называется R-квадратом или коэффициентом детерминации. Это значение непосредственно интерпретируется следующим образом. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает. что модель объясняет почти всю изменчивость соответствующих переменных).
Обычно. степень зависимости двух или более предикторов (независимых переменных или переменных X) с зависимой переменной (Y) выражается с помощью коэффициента множественной корреляции R. По определению он равен корню квадратному из коэффициента детерминации. Это неотрицательная величина. принимающая значения между 0 и 1. Для интерпретации направления связи между переменными смотрят на знаки (плюс или минус) регрессионных коэффициентов или B-коэффициентов. Если B-коэффициент положителен. то связь этой переменной с зависимой переменной положительна; если B-коэффициент отрицателен. то и связь носит отрицательный характер. Конечно. если B-коэффициент равен 0. связь между переменными отсутствует.
Прежде всего. как это видно уже из названия множественной линейной регрессии. предполагается. что связь между переменными является линейной. На практике это предположение. в сущности. никогда не может быть подтверждено; к счастью. процедуры множественного регрессионного анализы в незначительной степени подвержены воздействию малых отклонений от этого предположения.
Основное концептуальное ограничение всех методов регрессионного анализа состоит в том. что они позволяют обнаружить только числовые зависимости. а не лежащие в их основе причинные связи.
Важность анализа остатков. Хотя большинство пре