Множественная регрессия и пошаговая регрессия

Контрольная работа - Менеджмент

Другие контрольные работы по предмету Менеджмент

ть по степени влияния на отклик в следующем порядке:X1, X5, X4, X2, X3 В этой таблице немаловажное значение имеет p-level - показатель, находящийся в убывающей зависимости от надежности результата. Более высокий p-level соответствует более низкому уровню доверия к найденной в выборке зависимости между переменными. P-level не должен превышать 0,05. В нашем случае удовлетворяют условию регрессоры Х1 и Х5. Метод можно улучшить, исключив незначимые факторы. Искомая модель имеет вид:

=608,02662+0,63617X1+249,35156 X2-262,50298X3+5,39506X4-40,59804X5

Статистика Дарбина - Уотсона:

Durbin-SerialEstimate1,9509290,007937

Статистика Дарбина-Уотсона имеет небольшое значение (1,950929) при умеренной сериальной корреляции (0,007937). Это свидетельствует о некоторой зависимости наблюдений, следовательно, можно говорить о недостаточной устойчивости некоторых значений коэффициентов регрессии, а значит о невысокой адекватности модели изучаемому процессу.

3.1.2Оценка качества

Так как фактическое значение критерия Фишера больше, чем табличное, то необходимо сделать вывод о значимости модели уравнения регрессии, исследуемая зависимая переменная хорошо описывается переменными X1 и Х5. Из приведенных результатов анализа следует, что зависимость между откликом и предикторами высокая (0,7<R=0,82291525<0,9). Свободный член является статистически значим (p=0,03057<0,05).

.1.3Диагностика соблюдения условия РА-МНК

Проверим соблюдение основных предположений РА .

Соблюдение предположений экспериментатор старается обеспечить при организации эксперимента.

В случае с множественной регрессией модель избыточна, т.к. для регрессоров Х2, ХЗ, Х4 р-level превышает уровень значимости = 0,05, не превышает только для Х1, Х5.

, а именно, значимые коэффициенты парной корреляции.

Нарушение этого предположения трактуется как явление мультиколлинеарности. Наиболее часто мультиколлинеарность обнаруживается по коэффициентам парной корреляции ХУ матрицы R.

статистический регрессионный выборка отклонение

X1X2X3X4X5YX11,000000-0,382598-0,5245800,529433-0,4775910,742958X2-0,3825981,0000000,285537-0,1291080,216740-0,161846X3-0,5245800,2855371,000000-0,2851670,372517-0,500947X40,529433-0,129108-0,2851671,000000-0,1679950,497819X5-0,4775910,2167400,372517-0,1679951,000000-0,594804Y0,742958-0,195242-0,5009470,497819-0,6024221,000000

Парные коэффициенты корреляции rx1x2, rx1x3, rx1x4, rx1x5 значительно отличаются от нуля, значит присутствует мультиколлинеарность.

О нарушении условия неслучайности rij можно судить по косвенному признаку - резкому различию между внутренней и внешней точности прогноза.

Обычно нарушение предположения об аддитивности е происходит при переходе от нелинейной по b модели (внутренне линейной) к линейной. В данном примере мы имеем дело с линейной моделью.

Ошибки e, распределены нормально, что видно из графиков: за пределами полосы З? точек нет.

Условие М[e], = 0, не требует особого внимания при наличии b0 в модели.

Как видно из графиков, условие однородности наблюдений не нарушается.

Авторегрессия положительна, т.к. D находится в интервале 0-2:

Durbin-SerialEstimate1,9509290,007937

. Формальным признаком является применение неполного метода перебора.

Для многооткликовой задачи правомерно применение МНК к каждой из регрессий в отдельности. В данном случае модели однооткликовые.

3.2 Пошаговая регрессия

.2.1 Результаты

Зададим зависимую переменную Y и независимые X1, Х2, Х3, Х4, Х5 Итоги анализа с использованием пакета STATISTICA

Шаг 0

Результаты множ. регрессии(Шаг 0)

Зав.перем.:Y Множест. R = ,82291525 F = 22,65616= ,67718950 сс = 5,54

Число набл.: 60 скоррект.R2= ,64729964 p = ,000000

Стандартная ошибка оценки:184,39683277

Своб.член: 608,02662453 Ст.ошибка: 273,7725 t( 54) = 2,2209 p = ,0306бета=,501 X2 бета=,153 X3 бета=-,12бета=,166 X5 бета=-,32

(выделены значимые бета)

Шаг 1

Результаты множ. регрессии(Шаг 1)

Зав.перем.:Y Множест. R = ,81717234 F = 27,63707= ,66777064 сс = 4,55

Число набл.: 60 скоррект.R2= ,64360850 p = ,000000

Стандартная ошибка оценки:185,35921149

Своб.член: 425,37895333 Ст.ошибка: 233,1118 t( 55) = 1,8248 p = ,0735бета=,547 X2 бета=,142 X4 бета=,170бета=-,34

(выделены значимые бета)

Уравнение регрессии значимо, так как Ft(4,55)<Ff=27,63707

Шаг 2

Результаты множ. регрессии(Шаг 2)

Зав.перем.:Y Множест. R = ,80665645 F = 34,77272= ,65069463 сс = 3,56

Число набл.: 60 скоррект.R2= ,63198184 p = ,000000

Стандартная ошибка оценки:188,35846060

Своб.член: 575,72466483 Ст.ошибка: 218,7626 t( 56) = 2,6317 p = ,0110бета=,487 X4 бета=,184 X5 бета=-,33

(выделены значимые бета)

Уравнение статистически значимо, так как Ft(3,56)<Ff=34,77272

Шаг 3

Результаты множ. регрессии(шаг 3, оконч. решение)

другие F-исключить не выше указ. значения

Зав.перем.:Y Множест. R = ,79157512 F = 47,82385= ,62659117 сс = 2,57

Число набл.: 60 скоррект.R2= ,61348911 p = ,000000

Стандартная ошибка оценки:193,03291779

Своб.член: 734,19552600 Ст.ошибка: 208,4142 t( 57) = 3,5228 p = ,0008бета=,594 X5 бета=-,31

(выделены значимые бета)

Уравнение статистически значимо, так как Ft(2,57)<Ff=47,82385

Программа выделяет значимые регрессоры. Значимыми оказались Х1 и Х5. Значения коэффициента детерминации R, близкое к единице, говорит о хорошем приближении линии регрессии к наблюдаемым данным и о возможности построения качественного прогноза.

Регрессионная сумма:

BetaStd.Err.BStd.Err.t(57)p-levelIntercept734,19553208,414173,522770,00085X10,594480,092120,754480,116926,453080,00000X5-0,310880,09212-39,7530211,77997-3,374630,00134

На третьем шаге нами получ?/p>