Множественная регрессия и пошаговая регрессия
Контрольная работа - Менеджмент
Другие контрольные работы по предмету Менеджмент
ть по степени влияния на отклик в следующем порядке:X1, X5, X4, X2, X3 В этой таблице немаловажное значение имеет p-level - показатель, находящийся в убывающей зависимости от надежности результата. Более высокий p-level соответствует более низкому уровню доверия к найденной в выборке зависимости между переменными. P-level не должен превышать 0,05. В нашем случае удовлетворяют условию регрессоры Х1 и Х5. Метод можно улучшить, исключив незначимые факторы. Искомая модель имеет вид:
=608,02662+0,63617X1+249,35156 X2-262,50298X3+5,39506X4-40,59804X5
Статистика Дарбина - Уотсона:
Durbin-SerialEstimate1,9509290,007937
Статистика Дарбина-Уотсона имеет небольшое значение (1,950929) при умеренной сериальной корреляции (0,007937). Это свидетельствует о некоторой зависимости наблюдений, следовательно, можно говорить о недостаточной устойчивости некоторых значений коэффициентов регрессии, а значит о невысокой адекватности модели изучаемому процессу.
3.1.2Оценка качества
Так как фактическое значение критерия Фишера больше, чем табличное, то необходимо сделать вывод о значимости модели уравнения регрессии, исследуемая зависимая переменная хорошо описывается переменными X1 и Х5. Из приведенных результатов анализа следует, что зависимость между откликом и предикторами высокая (0,7<R=0,82291525<0,9). Свободный член является статистически значим (p=0,03057<0,05).
.1.3Диагностика соблюдения условия РА-МНК
Проверим соблюдение основных предположений РА .
Соблюдение предположений экспериментатор старается обеспечить при организации эксперимента.
В случае с множественной регрессией модель избыточна, т.к. для регрессоров Х2, ХЗ, Х4 р-level превышает уровень значимости = 0,05, не превышает только для Х1, Х5.
, а именно, значимые коэффициенты парной корреляции.
Нарушение этого предположения трактуется как явление мультиколлинеарности. Наиболее часто мультиколлинеарность обнаруживается по коэффициентам парной корреляции ХУ матрицы R.
статистический регрессионный выборка отклонение
X1X2X3X4X5YX11,000000-0,382598-0,5245800,529433-0,4775910,742958X2-0,3825981,0000000,285537-0,1291080,216740-0,161846X3-0,5245800,2855371,000000-0,2851670,372517-0,500947X40,529433-0,129108-0,2851671,000000-0,1679950,497819X5-0,4775910,2167400,372517-0,1679951,000000-0,594804Y0,742958-0,195242-0,5009470,497819-0,6024221,000000
Парные коэффициенты корреляции rx1x2, rx1x3, rx1x4, rx1x5 значительно отличаются от нуля, значит присутствует мультиколлинеарность.
О нарушении условия неслучайности rij можно судить по косвенному признаку - резкому различию между внутренней и внешней точности прогноза.
Обычно нарушение предположения об аддитивности е происходит при переходе от нелинейной по b модели (внутренне линейной) к линейной. В данном примере мы имеем дело с линейной моделью.
Ошибки e, распределены нормально, что видно из графиков: за пределами полосы З? точек нет.
Условие М[e], = 0, не требует особого внимания при наличии b0 в модели.
Как видно из графиков, условие однородности наблюдений не нарушается.
Авторегрессия положительна, т.к. D находится в интервале 0-2:
Durbin-SerialEstimate1,9509290,007937
. Формальным признаком является применение неполного метода перебора.
Для многооткликовой задачи правомерно применение МНК к каждой из регрессий в отдельности. В данном случае модели однооткликовые.
3.2 Пошаговая регрессия
.2.1 Результаты
Зададим зависимую переменную Y и независимые X1, Х2, Х3, Х4, Х5 Итоги анализа с использованием пакета STATISTICA
Шаг 0
Результаты множ. регрессии(Шаг 0)
Зав.перем.:Y Множест. R = ,82291525 F = 22,65616= ,67718950 сс = 5,54
Число набл.: 60 скоррект.R2= ,64729964 p = ,000000
Стандартная ошибка оценки:184,39683277
Своб.член: 608,02662453 Ст.ошибка: 273,7725 t( 54) = 2,2209 p = ,0306бета=,501 X2 бета=,153 X3 бета=-,12бета=,166 X5 бета=-,32
(выделены значимые бета)
Шаг 1
Результаты множ. регрессии(Шаг 1)
Зав.перем.:Y Множест. R = ,81717234 F = 27,63707= ,66777064 сс = 4,55
Число набл.: 60 скоррект.R2= ,64360850 p = ,000000
Стандартная ошибка оценки:185,35921149
Своб.член: 425,37895333 Ст.ошибка: 233,1118 t( 55) = 1,8248 p = ,0735бета=,547 X2 бета=,142 X4 бета=,170бета=-,34
(выделены значимые бета)
Уравнение регрессии значимо, так как Ft(4,55)<Ff=27,63707
Шаг 2
Результаты множ. регрессии(Шаг 2)
Зав.перем.:Y Множест. R = ,80665645 F = 34,77272= ,65069463 сс = 3,56
Число набл.: 60 скоррект.R2= ,63198184 p = ,000000
Стандартная ошибка оценки:188,35846060
Своб.член: 575,72466483 Ст.ошибка: 218,7626 t( 56) = 2,6317 p = ,0110бета=,487 X4 бета=,184 X5 бета=-,33
(выделены значимые бета)
Уравнение статистически значимо, так как Ft(3,56)<Ff=34,77272
Шаг 3
Результаты множ. регрессии(шаг 3, оконч. решение)
другие F-исключить не выше указ. значения
Зав.перем.:Y Множест. R = ,79157512 F = 47,82385= ,62659117 сс = 2,57
Число набл.: 60 скоррект.R2= ,61348911 p = ,000000
Стандартная ошибка оценки:193,03291779
Своб.член: 734,19552600 Ст.ошибка: 208,4142 t( 57) = 3,5228 p = ,0008бета=,594 X5 бета=-,31
(выделены значимые бета)
Уравнение статистически значимо, так как Ft(2,57)<Ff=47,82385
Программа выделяет значимые регрессоры. Значимыми оказались Х1 и Х5. Значения коэффициента детерминации R, близкое к единице, говорит о хорошем приближении линии регрессии к наблюдаемым данным и о возможности построения качественного прогноза.
Регрессионная сумма:
BetaStd.Err.BStd.Err.t(57)p-levelIntercept734,19553208,414173,522770,00085X10,594480,092120,754480,116926,453080,00000X5-0,310880,09212-39,7530211,77997-3,374630,00134
На третьем шаге нами получ?/p>