Контрольная: Эконометрика: Парная и множественная корреляция

                                    Задача 1.                                    
По предприятиям легкой промышленности региона получена информация,
характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема
капиталовложений (X, млн. руб.):
     
Y32404428505650
X60688076748796
Требуется: 1. Для характеристики зависимости Y от X построить следующие модели: а) линейную, б) степенную, в) показательную, г) гиперболическую. 2. Оценить каждую модель, определив: - индекс корреляции, - среднюю относительную ошибку, - коэффициент детерминации, - F-критерий Фишера. 3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик. 4. Рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня. 5. Результаты расчетов отобразить на графике. Таблица 1.1.
Расчетная таблица
tYXY*XX*X

(Yi-)

(Yi-)2

(Xi-)

(Xi-)2

Ei=Yi-i

*100%

1326019203600-10,8571117,8766-17,2857298,795433,2120-1,21203,7875
2406827204624-2,85718,1630-9,285786,224237,67602,32405,8100
34480352064001,14291,30622,71437,367444,3720-0,37200,8455
4287621285776-14,8571220,7334-1,28571,653042,1400-14,140050,5000
55074370054767,142951,0210-3,285710,795841,02408,976017,9520
656874872756913,1429172,73589,714394,367648,27807,722013,7893
75096480092167,142951,021018,7143350,225053,3000-3,30006,6000
Итого30054123660426610,0003622,85700,0001849,4284300,0020-0,002099,2843
Cред. зн-я42,857177,285733806094,428614,1835
S88,9796121,3469
Решение. 1.а) построение линейной модели парной регрессии. Используются данные, указанные в таблице 1.1. Формулы для расчета данных: где Ц дисперсии; , Уравнение линейной регрессии имеет вид = а+bx. а==-0,299 b==0,558 Определим линейный коэффициент парной корреляции: ryx==b=0,558*1,1678=0,652 Уравнение линейной регрессии имеет вид: = -0,299+0,558Х. С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции увеличится в среднем на 558 тыс. руб. Линейный коэффициент парной корреляции: Коэффициент детерминации: R2=0,6522=0,425 Вариация объема выпуска продукции на 42,5 % объясняется вариацией объема капиталовложений. Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера по формуле F= для а=0,05; kj=m=l, k2=n-m-l=5. F<Fтаб=6,61 Уравнение регрессии с вероятностью 0,95 в целом статистически не значимое. Средняя относительная ошибка: *100% ==14,18 В среднем расчетные значения для линейной модели отличаются от фактических значений на 14,18%. б) построение степенной модели парной регрессии =ахb. Используются данные , указанные в таблице 1.2. Для построения этой модели проведем линеаризацию переменных путем логарифмирования обеих частей уравнения: lg = lg a + b lg x Обозначим Y= lg , Х= lg x, A= lg a. Тогда уравнение примет вид : Y=A+bX b==1,0269 А==-0,3138 Уравнение линейной регрессии имеет вид: Y = -0,3138+1,0269Х. Переходим к исходным переменным х и у , выполнив потенцирование данного уравнения, получим уравнение степенной модели регрессии. =10-0,3138 х1,0269= 0,486 х1,0269 Определим индекс корреляции: ==0,6482, Коэффициент детерминации: R2= 0,64822=0,4202 Вариация объема выпуска продукции на 42,02% объясняется вариацией объема капиталовложений. Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера: Fтабл=6,61 для а=0,05; ki=m=l, k2-n-m-l=5. F=3,62 Fрасч < F табл. Уравнение регрессии с вероятностью 0,95 в целом статистически незначимо. Средняя относительная ошибка: *100% =12,79 % В среднем расчетные значения для линейной модели отличаются от фактических значений на 12,79%. Таблица 1.2.
t

Y1

X1

Y1*X1

X12

Еi

(/Ei/Y/)*100%

Еi2

11,50511,77822,67643,162032,5661-0,56611,73830,3205
21,60211,83252,93583,358137,01222,98788,07258,9269
31,64351,90313,12773,621843,70340,29660,67870,0880
41,44721,88082,72193,537441,4703-13,470332,4818181,4490
51,69901,86923,17583,493940,35479,645323,901393,0318
61,74821,93953,39063,761747,61728,382817,604670,2713
71,69901,98233,36793,929552,6596-2,65965,05067,0735
Итого11,344113,185621,396124,8644295,38354,616589,5278361,1610
Cредн. знач-я1,62061,88373,05663,552112,7897
Таблица 1.3.
ty

Y1=lg(Y)

x

X1=lg(X)

132,00001,505160,00001,7782
240,00001,602168,00001,8325
344,00001,643580,00001,9031
428,00001,447276,00001,8808
550,00001,699074,00001,8692
656,00001,748287,00001,9395
750,00001,699096,00001,9823
Итого300,000011,3439541,000013,1856
Cредн. знач-я42,85711,620677,28571,8837
в). Уравнение показательной кривой: =abx. Используются данные , указанные в таблице 1.3. Для построения этой кривой произведем линеаризацию переменных при логарифмировании обеих частей уравнения: lg у = lg а + х Обозначим Y= lg , В= lg b, A=lga. Получим линейное уравнение регрессии: Y=A+Bx В==0,0058 А==1,1723 Уравнение линейной регрессии имеет вид: Y= 1,1723+0,0058х. Переходим к исходным переменным Y=101,1723(100,0058)х у =14,98651,013х Индекс корреляции: xy==0,616889 Коэффициент детерминации: R2=0,3806 Вариация объема выпуска продукции на 38,06% объясняется вариацией объема капиталовложений. Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера: F=3,07 Fрасч < F табл. Fтабл=6,61 для а=0,05; ki=m=l, k2=n-m-l=5. F<Fтабл Уравнение регрессии с вероятностью 0,95 в целом статистически незначимо. Средняя относительная ошибка: *100% =14,56 % В среднем расчетные значения для линейной модели отличаются от фактических значений на 14,56% Таблица 1.4.
t

Y1

xY*x

x2

(Y-)2

(X-)2

E

(/Ei/Y/)*100%

Е
11,505160,000090,30903600,00000,0133298,795432,5282-0,52821,65060,2790
21,602168,0000108,94014624,00000,000386,224236,06953,93059,826315,4488
31,643580,0000131,47626400,00000,00057,367442,11661,88344,28053,5472
41,447276,0000109,98405776,00000,03011,653039,9960-11,996042,8429143,9040
51,699074,0000125,72385476,00000,006110,795838,976911,023122,0462121,5087
61,748287,0000152,09247569,00000,016394,367646,10309,897017,673297,9506
71,699096,0000163,10119216,00000,0061350,225051,7859-1,78593,57183,1894
Итого11,3441541,0000881,626642661,00000,0727849,4284287,576112,4239101,8915385,8277
Cредн. знач-я1,620677,2857125,94676094,428614,5559
Таблица 1.5.
ty

Y1=lg y

xY*x
132,00001,505160,000090,3060
240,00001,602168,0000108,9428
344,00001,643580,0000131,4800
428,00001,447276,0000109,9872
550,00001,699074,0000125,7260
656,00001,748287,0000152,0934
750,00001,699096,0000163,1040
Итого300,000011,3439541,0000881,6394
Cредн. знач-я42,85711,620677,2857125,9485
г) Уравнение гиперболической функции: =а+b - линеаризуется при замене Х=1/x. Используются данные , указанные в таблице 1.4. b==-2966,84 a==82,02228 Уравнение гиперболической модели имеет вид: = 85,02-2966,84х. Индекс корреляции: xy==0,649629 Коэффициент детерминации: R2=0,6496292=0,422 Вариация объема выпуска продукции на 42,2% объясняется вариацией объема капиталовложений. Оценку значимости уравнения регрессии проведем с помощью F-Фишера: F=3,65 Fрасч < F табл. Fтабл=6,61 для а=0,05; ki=m=l, k2=n-m-l=5. F<Fтабл Уравнение регрессии с вероятностью 0,95 в целом статистически незначимо. Средняя относительная ошибка: *100% =13,46 % В среднем расчетные значения для линейной модели отличаются от фактических значений на 13,46%. Таблица 1.6.
tyхХyX

X2

Y-

(Y-)2

Ei

(y-)2

Ei/y*100

132,0060,00000,0166670,5333330,0002778-10,86117,939632,57496-0,570,331,78125
240,0068,00000,0147060,5882350,0002163-2,868,179638,392291,612,584,025
344,0080,00000,01250,550,00015631,141,299644,93679-0,940,882,136364
428,0076,00000,0131580,3684210,0001731-14,86220,819642,98492-14,98224,5553,5
550,0074,00000,0135140,6756760,00018267,1450,979641,929868,0765,1316,14
656,0087,00000,0114940,6436780,000132113,14172,659647,920688,0865,2814,42857
750,0096,00000,0104170,5208330,00010857,1450,979651,1177-1,121,252,24
Итого300,00541,00000,0924553,8801770,0012467-0,02622,8572299,85720,15360,0094,25119
Средние42,8677,28570,01320,55430,000178113,46446
Для выбора лучшей модели построим сводную таблицу результатов. Таблица 1.7.
Коэффициент детерм.F-критерий ФишераИндекс корреляцииСредняя отн. ошибка
Линейная 0,4253,700,65214,18
Степенная 0,4203,620,64812,79
Показательная 0,3813,070,61714,56
Гиперболическая 0,4223,650,64913,46
Ни одно из уравнений не является статистически значимым. Поэтому прогноз не осуществляем. Все модели имеют примерно одинаковые характеристики, но большее значение F- критерия Фишера и большее значение коэффициента детерминации имеет линейная модель. Изобразим на графике фактические данные и линейную модель. График 1.
ЗАДАЧА 2. По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам(X1) , ставки по депозитам(X2) и размера внутри банковских расходов(X3 ). Требуется: 1. Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели. 2. Рассчитать параметры модели. 3. Для характеристики модели определить: - линейный коэффициент множественной корреляции, - коэффициент детерминации, - средние коэффициенты эластичности, - бетта-, дельта-коэффициенты. Дать их интерпретацию. 4. Осуществить оценку надежности уравнения регрессии. 5. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии. 6. Построить точечный и интервальный прогнозы результирующего показателя. 7. Отразить результаты расчетов на графике. Выполнение задач отразить в аналитической записке, приложить компьютерные распечатки расчетов. Таблица 2.1.
Статистические данные
Y, объем прибыли

Х1, среднегодовая ставка по кредитам

Х2, ставки по депозитам

Х3, внутрибанковские расходы

5022176150
5430170154
6020156146
6232172134
7044162132
5434160126
8452166134
8256156126
866615288
8468138120
Решение. 1. Построение системы показателей. Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Таблица 2.2.
tY

Х1

Х2

Х3

15022176150
25430170154
36020156146
46232172134
57044162132
65434160126
78452166134
88256156126
9866615288
108468138120
Cумма686,00424,001608,001310,00

Среднее

значение

68,6042,40160,80131,00
В данном примере n=10, m=3. а). Осуществим выбор факторных признаков для построения двухфакторной регрессионной модели с использованием инструмента корреляции в EXCEL.(Приложение 1) Для проведения корреляционного анализа необходимо выполнить следующие действия: 1. Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек. 2. Выбрать команду СервисАнализ данных. 3. В диалоговом окне Анализ данных выбрать инструмент Корреляция, а затем щелкнуть на кнопке ОК. 4. В диалоговом окне Корреляция в поле Входной интервал необходимо ввести диапазон Ячеек, содержащих исходные данные. Если выделены и заголовки столбцов, то установить флажок Метки в первой строке. 5. Выбрать параметры ввода. В данном примере Новый рабочий лист. 6. ОК. Таблица 2.3. Результаты корреляционного анализа.
Y, объем прибыли

Х1, среднегодовая ставка по кредитам

Х2, ставки по депозитам

Х3, внутрибанковские расходы

Y, объем прибыли1

Х1, среднегодовая ставка по кредитам

0,92455741

Х2, ставки по депозитам

-0,644592-0,7045285481

Х3, внутрибанковские расходы

-0,704905-0,7929253480,6061538611
Анализ матрицы коэффициентов парной корреляции показывает, что на зависимую переменную, т.е. объем прибыли больше влияют среднегодовая ставка по кредитам (ryx1), и внутри банковские расходы(ryx2). Для построения двухфакторной регрессионной модели выбираем Х1 и Х3. 2. Построим линейную модель регрессии с использованием инструмента регрессия в Excel.(приложение 2) Для проведения регрессионного анализа выполняются следующие действия: 1. Выбрать команду Сервис Анализ данных. 2. В диалоговом окне Анализ данных выбрать инструмент Регрессия, а затем щелкнуть на кнопке ОК. 3. В диалоговом окне Регрессия в поле Входной интервал Y необходимо ввести адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X ввести адреса одного или нескольких диапазонов, которые содержат значения независимых переменных. 4. Если выделены и заголовки столбцов, то установить флажок Метки в первой строке. 5. Выбрать параметры ввода. В данном примере Новый рабочая книга. 6. В поле остатки поставить необходимые флажки. 7. ОК. Таблица 2.4.
Коэффициенты
Y-пересечение26,70290364

Х1, среднегодовая ставка по кредитам

0,808488112

Х3, внутрибанковские расходы

0,058146568
Оценка параметров регрессии осуществляется по методу наименьших квадратов по формуле а=(ХТХ)-1ХТY, используя данные, приведенные в таблице 2.1. тХ) = тХ)-1 = а = Уравнение регрессии зависимости среднегодовой ставки по кредитам и размера внутри банковских расходов можно записать в следующем виде Y=26,7029+0,8085Х1+0,0581Х3 2.Оценим адекватность построенной модели. Таблица 2.5.
tY

Х1

Х2

Х3

Е (t)

Е (t)2

(Е (t)*Е (t-1)

{(Е (t)-Е (t-1)}2

15053,204922176150-3,204910,271384
25459,905330170154-5,905334,87256818,925895977,29216016
36051,3555201561468,644574,72738-51,04836585211,69668
46260,3603321721341,63972,688616114,1743866549,067223
57069,9461441621320,05390,00290520,088379832,51476164
65461,512534160126-7,512556,437656-0,4049237557,250409
78476,5303521661347,469755,796418-56,11612125224,466317
88279,2995561561262,70057,292700320,1719248522,7452686
98685,176766152880,82330,67782292,223321653,52387984
108488,652968138120-4,652921,649478-3,8307325729,9887664
Cумма686,00685,94424,001608,001310,000,056264,41693-55,81623447608,545466

Среднее

значение

68,6042,40160,80131,00
а) Проверку независимости остатков проведем с помощью d-критерия Дарбина Ц Уотсона :
d=

{E (t)-E(t-1)}2

E (t)2

d= 608,545466/264,41693=2,30> 2 - отрицательная корреляция, d1= 4- 2,3= 1,7 В качестве критических табличных уровней при n=10, двух объясняющих факторах при уровне значимости в 5% возьмем величины d1= 0,70 d2=1,64 Так как расчетное значение попало в интервал от d2 до 2, то свойство независимости выполняется. б) Оценим нормальность распределения остаточной компоненты по RS-критерию с критическими уровнями 2,7-3,7. SЕ==6,15 RS=(EmaxЦEmin)/SE={8,64Ц(-7,51)}/6,15=2,63 Гипотеза о нормальном распределении ряда остатков отвергается. На основе полученной модели нельзя строить интервальный прогноз. Таблица 2.5.

Регрессионная статистика

Множественный R

0,925715067

R-квадрат

0,856948384

Нормированный R-квадрат

0,816076494

Стандартная ошибка

6,146039446

Наблюдения

10

Линейный коэффициент множественной корреляции R=0,926 Коэффициент детерминации R2 = 0,857 , то есть 85,7 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов. Вычислим средние коэффиценты эластичности по формуле : Эj=aj*Xj/Y Э1=0,808*42,4/68,6=0,50 Э2=0,058*131/68,6=0,11 При увеличении ставки по кредитам на 1 % и неизменном размере расходов прибыль банка увеличится на 0,50 %, а увеличение размера расходов при неизменной ставке кредита приведет к увеличению прибыли на 0,11 %. Рассчитаем бетта-коэффициенты: j= aj*Sхj/Sy 1=0,98 1=0,08 При неизменном размере расходов увеличение ставки по кредитам на величину среднеквадратического отклонения увеличит прибыль банка на 0,98 ее среднеквадратического отклонения. При неизменной ставке по кредитам увеличение размера расходов на величину среднеквадратического отклонения увеличит прибыль банка на 0,08 ее среднеквадратического отклонения. Вычислим дельта коэффициенты: 1=ryx11 / R2=0,21 2=ryx32 / R2=0,79 Доля влияния ставки по кредитам в суммарном влиянии всех факторов составляет 21 %, а доля влияния размера расходов 79 %. 4. Осуществим оценку надежности уравнения регрессии на основе вычисления F- критерия Фишера :
F=

R2/k

=0,857/2=20,9

(1-R2)(n-k-1)

(1-0,857)/7
Табличное значение F-критерия Фишера при доверительной вероятности 0,95 при V 1=k=2 и V2=n-k-1=7 cоставляет 4,74 Так как F> Fтабл , то уравнение регрессии признается адекватным. 5. Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии. b11=24.5879 b22=-0.13677 b11=-0.14266 taj=aj/Saj tа0=0,876 tа1= 4,197 tа2=0,324 Табличное значение t-критерия при 5 % уровне значимости и степенях свободы (10-2-1)=7 составляет 2,3646. t 2 < tтабл значит , коэффициент а2 не являются статистически значимыми. t1> tтабл то, коэффициент а1 являются статистически значимыми. 6. Построим точечный и интервальный прогнозы на 2 шага вперед на основе приростов от фактически достигнутого уровня. Средний абсолютный прирост Х1 САП = (68-22)/9=5,11 Х(11)=Х1(10)+5,11*1=73,11 Х(12)=Х1(10)+5,11*2=78,22 Средний абсолютный прирост Х3 САП = (120-150)/9=-3,33 Х(11)=Х3(10)-3,33*1=116,67 Х(12)=Х3(10)-3,33*2=113,34 Для получения прогнозных оценок прибыли по модели Y=26,7029+0,8085Х1+0,0581Х3 подставим в нее найденные прогнозные значения факторов: Yр(11)=26,7029+0,8085*73,11+0,0581*116,67=92,59 Yр(12)=26,7029+0,8085*78,22+0,0581*113,34=96,53 Доверительный интервал прогноза будет иметь следующие границы: Верхняя граница прогноза : Yр(N+1) + U(1) Нижняя граница прогноза : Yр(N+1) - U(1) U(l)=Setкр Se=6,15 tкр=t(0,05;7)=2,36 l=1 Х=(1; 73,11; 116,67) тХ) = тХ)-1 = U(1)=6,15*2,36*=10,89 l=2 Х=(1; 78,22; 113,34) U(2)= 6,15*2,36*=11,47 Таблица прогнозов.
УпреждениеПрогнозНижняя границаВерхняя граница
192,5981,7103,48
296,5385,06108
График 2. Приложение 1 (Использование инструмента Корреляция). Рисунок 1. Приложение 1 (Использование инструмента Корреляция).

Рисунок 2. Приложение 1 (Использование инструмента Корреляция).

Рисунок 3. Приложение 1 (Использование инструмента Корреляция). Рисунок 4.

Приложение 2 (Использование инструмента Регрессия) Рисунок 5. Приложение 2 (Использование инструмента Регрессия) Рисунок 6.

Приложение 2 (Использование инструмента Регрессия) Рисунок 7.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ: 1. ЭКОНОМЕТРИКА (методические указания по изучению дисциплины и выполнению контрольной работы) г. Москва ИНФРА-М 2002 Ц 88 с.; 2. Елисеева И.И. ЭКОНОМЕТРИКА г. Москва УФинансы и статистикаФ 2002.-344 с.; 3. Елисеева И.И. ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ г. Москва УФинансы и статистикаФ 2003.-192 с.; 03.04.04г.