Множественная регрессия и пошаговая регрессия

Контрольная работа - Менеджмент

Другие контрольные работы по предмету Менеджмент

µна оптимальная искомая модель:

Y=734,19553+0,75448 X1-39,75302X5

 

Дисперсионный анализ:

Sums ofdfMeanFp-levelRegress.35639972178199847,823850,000000Residual21239175737262Total5687914

Статистика Дарбина - Уотсона:

Durbin-SerialEstimate2,005139-0,010950

.2.2Оценка качества

Так как фактическое значение критерия Фишера больше, чем табличное, то необходимо сделать вывод о значимости модели уравнения регрессии, исследуемая зависимая переменная хорошо описывается переменными X1 и Х5. Из приведенных результатов (0,7<R=0,79157512<0,9). Свободный член статистически значим (p=0,00085.

 

.2.3Диагностика соблюдения условия РА-МНК

Проверим соблюдение основных предположений РА .

Соблюдение предположений экспериментатор старается обеспечить при организации эксперимента.

В случае с пошаговой регрессией модель неизбыточна, т.к. для регрессоров Х1, Х5, р-level не превышает уровень значимости = 0,05.

, а именно, значимые коэффициенты парной корреляции.

Нарушение этого предположения трактуется как явление мультиколлинеарности. Наиболее часто мультиколлинеарность обнаруживается по коэффициентам парной корреляции ху матрицы R.

 

X1X5YX11,00000-0,485280,74296X5-0,485281,00000-0,60242Y0,74296-0,602421,00000

Парный коэффициент корреляции rx1x5,значительно отличается от нуля, значит присутствует мультиколлинеарность.

О нарушении условия неслучайности rij можно судить по косвенному признаку - резкому различию между внутренней и внешней точности прогноза.

Обычно нарушение предположения об аддитивности е происходит при переходе от нелинейной по b модели (внутренне линейной) к линейной. В данном примере мы имеем дело с линейной моделью.

Ошибки e, распределены нормально, что видно из графиков: за пределами полосы З? точек нет.

Условие М[e], = 0, не требует особого внимания при наличии b0 в модели.

Как видно из графиков, условие однородности наблюдений не нарушается.

 

Авторегрессия незначительна, т.к. D близко к 2.

 

Durbin-SerialEstimate2,005139-0,010950

. Формальным признаком является применение неполного метода перебора.

Для многооткликовой задачи правомерно применение МНК к каждой из регрессий в отдельности. В данном случае модели однооткликовые.

Выводы

 

Вывод для множественной регрессии.

В настоящее время множественная регрессия - один из наиболее распространённых методов в эконометрике. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, в также совокупное их воздействие на моделируемый показатель. В нашем примере мы получили следующую модель:

=608,02662+0,63617X1+249,35156 X2-262,50298X3+5,39506X4-40,59804X5

 

Проанализировав эту модель мы можем сделать выводы. Коэффициенты регрессии при переменной X1 показывает, что с ростом среднедневного душевого дохода на 1 ед. общий объем кредитования растет в среднем на 0,636 млн. руб., с ростом, при переменной X5 показывает, что с ростом среднегодовой процентной ставки по ипотечным кредитам на 1 % общий объем кредитования снижается в среднем на 40,598 млн. руб.

Проанализируем качество постулируемой модели.

Значимость уравнения множественной регрессии в целом оценим с помощью F -критерия Фишера. Задача состоит в проверке нулевой гипотезы Но о статистической не значимости уравнения регрессии в целом. Анализ выполняется при сравнении фактического и табличного значения F-критерия Фишера Fтабл и Fфакт. Сравнивая Fтабл и Fфакт. получим:

Fфакт. = 22,65616; Fтабл (5,54)=2,39, следовательно Fфакт.> Fтабл . С вероятностью

-?=0,95 приходим к выводу о необходимости отклонить гипотезу Но и делаем заключение о статистической значимости уравнения.

Оценим уравнение регрессии о возможности использовать для прогноза. Для этого воспользуемся следующей формулой: Fфакт.>4Fтабл. В нашем уравнении: Fфакт =22,65616, а 4Fтабл=42,39=9,56, следовательно с вероятностью 1-?=0,95 приходим к выводу о значимости уравнения в целом и уравнение следует использовать для прогноза.

Оценим модель по коэффициенту детерминации. Для оценки качества подбора функции рассчитывается коэффициент детерминации (R2). Величина коэффициента детерминации служит одним из критериев оценки качества модели. Он характеризует долю дисперсии результативного признака Y объясняемую регрессией в общей дисперсии результативного признака. В нашем случае R2 = 0, 67906710.

Следовательно уравнением регрессии объясняется 68%, дисперсии результативного признака, а на долю прочих факторов приходится 32% ее дисперсии.

Результаты диагностики:

По результатам диагностики мы можем сделать следующий вывод, что модель линейна по b; в ней нет лишних слагаемых и все регрессоры присутствуют.

Результаты диагностики . По значениям коэффициентов парной корреляции мультиколлениарность обнаружена (коэффициенты rx1x2, rx1x3, rx1x4, rx1x5 значимо отличаются от нуля)

Результаты диагностики . Данное нарушение проверили по графикам остатков. Сделаем вывод о том, что условие не нарушено

Результаты диагностики . Данное нарушение проверили по графикам остатков. Явного нарушения условия нет.

Результаты диагностики . Для проверки данного условия независимости ошибок из-за неучёта фактора ?/p>