Линейные регрессионные модели

Контрольная работа - Экономика

Другие контрольные работы по предмету Экономика

?ривести к нежелательным последствиям:

1) факторы будут дублировать друг друга, и будет затруднена экономическая интерпретация параметров модели;

2) система уравнений для определения параметров может оказаться плохо обусловленной и повлечь ненадежность полученных уравнений регрессии т нежелательность их использования для анализа и прогноза.

При наличии корреляции ?0,7 между факторами один из них следует исключить. Оставить рекомендуется тот, который при достаточно тесной связи с показателем имеет более слабую связь с другими факторами.

Рассмотрим таблицу 3, используя метод исключения, отберем факторы для построения регрессионных моделей. Так как связь между факторами должна быть слабой, исключим все факторы, коэффициент корреляции которых больше или равен по модулю 0,3. Для построения модели оставляем факторы сильно или умеренно влияющие на данный показатель, то есть коэффициент корреляции должен быть больше или равен 0,3.

Следующее необходимое условие при построении регриссионных моделей: Число включаемых факторов должно в 6 раз меньше объема наблюдений, по которым строится регрессия. N-число наблюдений в нашем случае равно 12. Тогда m ? , то есть m=1 или m=2.

Число параметров при факторах в линейной модели совпадают с их количеством: m=p.

Итак, можно предложить следующие регрессионные модели:

 

1.

2. .

3. .

 

Используя инструмент РЕГРЕССИЯ, оценим 1 модель.

1 этап. Оценка значимости модели в целом.

 

Таблица 4.

ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,985324602R-квадрат0,970864572Нормированный R-квадрат0,963580715Стандартная ошибка0,453164887Наблюдения11Дисперсионный анализ dfSSMSFЗначимость FРегрессия254,7444127,3722133,2899010,00000072Остаток81,6428670, 205358Итого1056,38727 Модель линейной регрессии с двумя фактором Х1 и X6 значима в целом согласно F-критерию (F=133,2899) с приемлемым уровнем значимости 0,00000072 ? 0,05

Итак, получаем модель

Коэф-тыСтанд. ошибкаt-стат. P-ЗначениеY-пересечение27,1888755617,924391,5168640,16777466Х1-0,12200230,146648-0,831940,42957614Х60,862797390,05813114,842420,000000418

Согласно критерию Стьюдента 2 параметра модели a=27,18 и =-0,122 незначимы с приемлемыми уровнями >0,05 и >0,05. Следовательно, эта модель неудачна и не может быть использована к анализу и прогнозу индекса цен платных услуг. Следует изменить спецификацию модели (необходимо убрать фактор Х1).

Используя инструмент РЕГРЕССИЯ, оценим 2 модель.

1 этап. Оценка значимости модели в целом.

 

Таблица 5.

ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,984045R-квадрат0,968344Нормированный R-квадрат0,964827Стандартная ошибка0,445346Наблюдения11Дисперсионный анализ dfSSMSFЗначимость FРегрессия154,6022727354,60227275,30557680,0000000468Остаток91,7850, 198333Итого1056,38727273 Модель линейной регрессии с фактором X6 значима в целом согласно F-критерию (F=275,306) с приемлемым уровнем значимости 0,0000000468 ? 0,05

Итак, получаем модель

2 этап. Оценка параметров модели. Коэф-тыСтанд. ошибкаt-стат. P-ЗначениеY-пересечение12,981825,3519098832,4256420,038255004X60,8806820,0530776316,592330,0000000468

Согласно критерию Стьюдента 2 параметра модели a=12,98 и b=0,88 значимы с приемлемыми уровнями <0,05 и <0,05.

3 этап. Проверка наличия необходимых свойств у остатка модели.

 

Таблица 6.

ВЫВОД ОСТАТКАНаблюдениеПредсказанное YОстаткиСтандартные остатки1101,05-0,05-0,1183452672101,05-0,45-1,0651074043101,050,150,3550358014101,05-0,25-0,5917263355101,05-0,05-0,1183452676108,80,000000000001320,0000000000031287101,051,152,7219411438101,050,150,3550358019101,05-0,25-0,59172633510101,05-0,25-0,59172633511101,05-0,15-0,355035801

График 1.

Проверяем случайность остатков Первое, что требуется, это чтобы график остатков располагался в горизонтальной полосе, симметричной относительно оси абсцисс. Согласно предпосылкам МНК возмущение должно быть случайной величиной с нулевым математическим ожиданием. Это имеет место для получения однофакторной регрессии. График остатка (возмущения, ошибки) располагается в горизонтальной полосе. Имеется большое количество локальных экстремумов (максимумов и минимумов). -значит остатки случайные.

Согласно следующей предпосылке остатки должны быть равноизменчивы. Для проверки этой предпосылки используем в Microsoft Excel инструмент "Среднее значение".

 

-0,000000000000006.

 

Проверка на гомоскедастичность по методу Гольдфельда-Квандта невозможна, так как недостаточно наблюдений (должно быть n>12m) /

Проверим отсутствие автокорреляции остатков. Для этого чаще всего используют критерий Дарбина Уотсона (d-критерий):

 

.

 

находится в Microsoft Excel при помощи инструмента "СУММКВРАЗН"

 

=3,215

, берется из таблицы 4.1 "SS"/ "остаток"

1,785

d=.

 

Критерий Дарбина Уотсона (d-критерий): n=12, m=1, , dl=0,97,du=1,33

 

I dl II du III IV 4-du V 4-dl VI

0 0,97 1,33 2 2,67 3,03 4

 

d=1,801III, IV. Значит нет оснований отклонить предположение об отсутствии автокорреляции соседних остатков по d-критерию с уровнем значимости .

Следующее необходимое условие: остатки должны иметь распределение Гаусса. можно ограничиться критерием размахов (RS - критерий).

 

.

 

-стандартная ошибка модели

=0,445346.

находится в Microsoft Excel при помощи функции "МАКС".

=1,15.

находится в Microsoft Excel при помощи функции "МИН".

=-0,45.

RS=3,59

Критерий размахов, RS - критерий: n=12, ? =0,05, a=2,8, b=3,91.

Если a <RS < b, то остатки имеют нормальный закон распределения с уровнем ? =0,05.

 

2,8 <3,59 < 3,91.

 

Вывод: Все предпосылки регрессионного анализа выполняются с уровнем ? =0,05. Значит ?/p>