1. 525 15,92 579 8. 78915,02 2. 567 16,50 461 9. 51316,77 3. 396 16,54 649 10. 66115,57 4. 726 16,11 378 11. 40716,67 5. 265 16,62 674 12. 60816,92 6. 615 15,15 234 13. 39916,97 7. 370 15,02 681 14. 63116,59 Задание 3.3.2. По данным табл. 3.3.2 построить зависимость, объясняю щую число сделок в день ведущими онлайновскими брокерами США в зависимости от факторов, определяемых с помощью рейтинговых оценок.
Таблица 3.3.Число Удобство Доверие Объем пред- Качество обОнлайновский № сделок в пользова- потребите- лагаемых служивания, брокер день ния, балл лей, балл услуг, балл балл 1. Charles Schwab 177400 7,39 6,91 8,54 8,2. E*Trade 123250 8,10 6,15 8,90 7,3. Waterhouse Securities 107146 7,46 8,35 8,35 5,4. Fidelity 92354 5,63 5,71 8,94 8,5. Datek Online 81040 7,18 6,40 7,72 5,6. Ameritrade 71269 5,44 8,10 6,49 4,7. DLJdirect 30500 6,14 6,55 6,41 4,8. Scottrade 22050 5,04 6,15 6,06 6,9. CyBerCorp 14213 4,92 6,84 6,59 4,10. Suretrade 13200 7,56 5,63 6,46 5,11. Morgan Stanley Online 12500 1,60 7,16 7,26 5,12. National Discount Brokers 17703 6,49 7,32 4,32 4,13. Dreyfus 10125 3,35 7,69 5,65 4,14. Web Street Securities 4535 5,10 7,42 6,40 3,15. Quik & Reilly 3300 4,47 6,80 5,76 4,Для построенной модели проверить гипотезы:
1) :H bi = 0 ( = 1, mi ) ;
2) :H = bb = = b = 0.
0 21 m Если окажется, что среди факторов есть незначимые, то построить модель, исключив эти факторы. Для вновь построенной модели проверить гипотезу: :H H = rb, где 01 - H 30 -= 1 0, r =.
00 1 -1 Задание 3.3.3. Применяя тест Чоу, установить, является ли существенным различие в оплате труда работников государственных и коммерческих организаций. Данные об оплате труда в зависимости от стажа, возраста и образования работников государственных организаций приведены в табл. 3.3.3, а ком мерческих организаций - в табл. 3.3.4.
Таблица 3.3.Образование Зарплата, Стаж, Возраст, (1-высшее;
руб. лет лет 0-среднее) 2596 16 42 2524 7 30 2610 17 48 2756 32 55 2811 27 50 2750 23 46 2484 29 51 2623 14 44 2789 26 47 2768 19 50 2641 33 55 1951 2 24 Таблица 3.3.Зарплата, Стаж, Возраст, Образование (1-высшее;
руб. лет лет 0-среднее) 3480 20 46 2667 19 42 2890 1 23 2340 12 46 3288 31 57 3213 14 35 3354 29 51 2434 19 41 3147 4 31 3512 24 47 2698 22 46 2697 32 57 3280 18 42 2553 6 30 4. ОБОБЩЕННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ И ЕГО ВАРИАНТЫ В СЛУЧАЕ ГЕТЕРОСКЕДАСТИЧНОСТИ 4.1. Расчетные формулы 4.1.1. Оценка коэффициентов обобщенной регрессии:
- = (Xb - X) X -11 y.
4.1.2. Стандартные ошибки в форме Уайта:
n (X (bV )= n(X X)-1 1 e2x xss X)-1.
s n s=4.1.3. F-статистика, используемая в тесте Голдфелда-Куандта:
= eF e1 / e2e2, где e1 - вектор остатков регрессии, построенной по первым n / 2 - d / 2 наблюдениям ; e2 - вектор остатков регрессии, построенной по последним n / 2 - d / 2 наблюдениям.
4.2. Решение типовой задачи Задание 4.2.1. По данным табл. 4.2.1 построить линейную регрессионную модель, характеризующую зависимость показателя y от факторов x и x.
1 Построение модели начать с тестирования на гетероскедастичность. Считая наиболее вероятной ситуацию с двухуровневой дисперсией, использовать для проверки тест Голдфелда-Куандта. Если проверкой будет установлена неод нородность данных, то при построении модели применить многоэтапную процедуру оценивания ее коэффициентов с помощью доступного МНК.
Таблица 4.2.x x y x x y № 1 2 № 1 1. 13 43 79 11. 58 161 2. 28 56 110 12. 23 108 3. 33 24 97 13. 69 86 4. 42 98 171 14.8 143 5. 12 176 204 15. 60 42 6. 44 124 174 16. 11 199 7. 36 130 184 17. 26 145 8. 33 291 311 18. 61 115 9. 34 141 206 19. 18 111 10. 21 95 128 20. 30 192 Решение с помощью табличного процессора Excel 1. Ввод исходных данных.
2. Проверка данных с помощью теста Голдфелда-Куандта.
2.1. Упорядочивание исходных данных по переменной x в предположении, что уровень дисперсии зависит от этой переменной, и удаление шести наблюдений, оказавшихся в середине выборки. Представление результатов в виде табл. 4.2.2.
Таблица 4.2.x x y x x y № 1 2 № 1 1. 33 291 311 14. 42 98 2. 11 199 183 15. 21 95 3. 30 192 204 16. 69 86 4. 12 176 204 17. 28 56 5. 58 161 207 18. 13 43 6. 26 145 178 19. 60 42 7. 8 143 144 20. 33 24 2.2. Построение по упорядоченным данным двух регрессионных уравнений по первым семи наблюдениям (первое регрессионное уравнение, см.
Вывод итогов 1) и по последним семи наблюдениям (второе регрессионное уравнение, см. Вывод итогов 2).
ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,R-квадрат 0,Нормированный Rквадрат 0,Стандартная ошибка 16,Наблюдения Дисперсионный анализ Значимость F df SS MS F Регрессия 2 15064,2081 7532,104 27,1548 0,Остаток 4 1109,50616 277,Итого 6 16173,СтанКоэффици- дартная P- Нижние Верхние енты t-статистика Значение 95% 95% ошибка Y-пересечение 13,86422 26,6435024 0,52036 0,630286 -60,11015 87,Переменная X 1 0,889493 0,39236032 2,267031 0,086009 -0,199876 1,Переменная X 2 0,89948 0,13496104 6,66474 0,002633 0,5247676 1,2.3. Получение расчетных значений и вычисление остатков e и e, с 1 помощью которых составляется статистика = eFрасч e11 / e2e2. Оформление результатов в виде табл. 4.2.3.
ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,R-квадрат 0,Нормированный Rквадрат 0,Стандартная ошибка 5,Наблюдения Дисперсионный анализ Значимость F df SS MS F Регрессия 2 10483,6085 5241,804 168,5583 0,Остаток 4 124,391476 31,Итого 6 Коэффициен- Стандарт- P- Нижние Верхние ты ная ошибка t-статистика Значение 95% 95% Y-пересечение 23,49446 6,3630766 3,692312 0,020976 5,827693 41,Переменная X 1 1,476582 0,11317714 13,04665 0,000199 1,162351 1,Переменная X 2 0,826054 0,07856709 10,51399 0,000463 0,607916 1,Таблица 4.2. yрасч - yy )( x x y расч № 1 1. 33 291 311 304,97 36,2. 11 199 183 202,65 385,3. 30 192 204 213,25 85,4. 12 176 204 182,85 447,5. 58 161 207 210,27 10,6. 26 145 178 167,42 112,7. 8 143 144 149,61 31, ee =1109, 1 14. 42 98 171 166,46 20,15. 21 95 128 132,98 24,16. 69 86 199 196,42 6,17. 28 56 110 111,10 1,18. 13 43 79 78,21 0,19. 60 42 140 146,78 46,20. 33 24 97 92,05 24, ee =124, = eF e11 e2e2 = 1109/,51/124,39 = 8,92; Fc(,4 4)= 6,39.
расч Так как > FFрасч c, то гипотеза H отвергается и, следовательно, в данных наблюдается гетероскедастичность с двухуровневой дисперсией. Поэтому для построения регрессии по данным табл. 4.2.1 необходимо применить многоэтапную процедуру доступного МНК.
3. Построение регрессии с помощью доступного взвешенного МНК.
3.1. Построение регрессии обычным МНК по данным табл. 4.2.1 (см.
Вывод итогов 3).
ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,R-квадрат 0,Нормированный R-квадрат 0,Стандартная ошибка 13,Наблюдения Дисперсионный анализ Значимость F df SS MS F Регрессия 2 44658,7117 22329,36 130,622 4,8E-Остаток 17 2906,08827 170,Итого 19 47564,Коэффици- Стандарт- t- P- Нижние Верхние енты ная ошибка статистика Значение 95% 95% Y-пересечение 36,78068243 9,43676522 3,897594 0,001158 16,87082 56,Переменная X 1 1,191842832 0,16975113 7,021119 2,06E-06 0,833699 1,Переменная X 2 0,760391162 0,04869436 15,61559 1,63E-11 0,657655 0,3.2. Получение расчетных оценок и вычисление абсолютных знаi чений отклонений. Оформление результатов в виде табл. 4.2.4.
Таблица 4.2.- yy yрасч - yy x1 x2 y расч расч № 1. 13 43 79 84,971 -5,971 5,2. 28 56 110 112,734 -2,734 2,3. 33 24 97 94,361 2,639 2,4. 42 98 171 161,356 9,644 9,5. 12 176 204 184,912 19,088 19,6. 44 124 174 183,510 -9,510 9,7. 36 130 184 178,538 5,462 5,8. 33 291 311 297,385 13,615 13,9. 34 141 206 184,518 21,482 21,10. 21 95 128 134,047 -6,047 6,11. 58 161 207 228,331 -21,331 21,12. 23 108 152 146,315 5,685 5,13. 69 86 199 184,411 14,589 14,14. 8 143 144 155,051 -11,051 11,15. 60 42 140 140,228 -0,228 0,16. 11 199 183 201,209 -18,209 18,17. 26 145 178 178,025 -0,025 0,18. 61 115 185 196,928 -11,928 11,19. 18 111 152 142,637 9,363 9,20. 30 192 204 218,531 -14,531 14,3.3. Деление наблюдений с помощью Автофильтра на две группы I и I со значениями остатков, по абсолютной величине превосходящих и не превосходящих заданный уровень. (Анализ последнего столбца табл. 4.2.позволил в качестве такого уровня выбрать 7.) 3.4. Расчет среднеквадратических ошибок по остаткам, не превосходящих заданный уровень, и среднеквадратических ошибок по остаткам, превосходящих заданный уровень.
/1 2 /1 1 2 S1 = e =,4 31; S2 = e = 15,16.
i i n iI1 n iI 1 3.5. Преобразование исходных данных путем деления зависимой и независимых переменных каждого наблюдения первой группы на S, а второй группы - на S2 и оформление результатов в виде табл. 4.2.5.
3.6. Построение регрессионной модели по преобразованным данным табл. 4.2.5. Использование преобразованных данных для построения регрессионной модели эквивалентно применению взвешенного МНК к исходным данным (см. Вывод итогов 4).
Таким образом, уравнение регрессии, построенное с учетом гетероскедастичности, имеет вид =,0 148 + 1,818xy + 0,916x.
Таблица 4.2.x x y / Sx / Sx / Sy № 1 2 1 Х 2 Х Х 1. 13 43 79 3,014 9,968 18,2. 28 56 110 6,491 12,982 25,3. 33 24 97 7,650 5,564 22,4. 42 98 171 2,771 6,465 11,5. 12 176 204 0,792 11,611 13,6. 44 124 174 2,903 8,180 11,7. 36 130 184 8,346 30,137 42,8. 33 291 311 2,177 19,198 20,9. 34 141 206 2,243 9,302 13,10. 21 95 128 4,868 22,023 29,11. 58 161 207 3,826 10,621 13,12. 23 108 152 5,332 25,037 35,13. 69 86 199 4,552 5,674 13,14. 8 143 144 0,528 9,434 9,15. 60 42 140 13,909 9,736 32,16. 11 199 183 0,726 13,128 12,17. 26 145 178 6,027 33,614 41,18. 61 115 185 4,024 7,587 12,19. 18 111 152 1,187 7,323 10,20. 30 192 204 1,979 12,666 13,ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,R-квадрат 0,Нормированный Rквадрат 0,Стандартная ошибка 1,Наблюдения Дисперсионный анализ Значимость F df SS MS F Регрессия 2 2117,1754 1058,588 278,9088 1,01E-Остаток 17 64,5228463 3,Итого 19 2181,tКоэффи- Стандартная статисти- P- Нижние Верхние циенты ошибка Значение 95% 95% ка Y-пересечение 0,148364 0,95183574 0,155871 0,877971 -1,85984 2,Переменная X 1 1,818385 0,14250896 12,75979 3,91E-10 1,517717 2,Переменная X 2 0,915585 0,05632975 16,25403 8,6E-12 0,79674 1,4.3. Контрольное задание Задание 4.3.1. По данным табл. 4.3.1 построить линейную регрессионную модель, характеризующую зависимость показателя y от факторов x1, x2 и x3. Построение модели начать с тестирования на гетероскедастичность.
Считая наиболее вероятной ситуацию зависимости дисперсии ошибки от независимых переменных x1и x2, использовать для проверки тест БреушаПагана. Если проверкой будет установлена неоднородность данных, то при построении модели применить многоэтапную процедуру оценивания ее коэффициентов с помощью доступного МНК.
Таблица 4.3.x1 x2 x3 y x1 x2 x3 y № № 1. 123 53 538 1882 9. 153 25 782 2. 122 83 734 2006 10. 164 23 627 3. 143 48 605 2083 11. 193 93 945 4. 159 29 864 2388 12. 151 119 590 5. 133 42 703 2334 13. 148 33 770 6. 183 69 457 1310 14. 103 88 574 7. 139 141 565 1983 15. 140 114 344 8. 162 51 390 1117 16. 129 31 449 5. СГЛАЖИВАНИЕ И ЭКСТРАПОЛЯЦИЯ ВРЕМЕННЫХ РЯДОВ 5.1. Расчетные формулы 5.1.1. Абсолютный прирост:
= yy - yt -1, t t где yt - уровень временного ряда в момент t (t=1, 2,...).
5.1.2. Средний абсолютный прирост:
- yy n y =.
n 5.1.3. Темп роста:
yt Tt p = 100%.
yt -5.1.4. Темп прироста:
- yy tt -Ttпр = 100% = Tt p -100%.
yt -5.1.5. Средний темп роста:
yn p n TT = Tnp Tnp 100% = n 100%, yгде T1p, T2p,..., Tnp - темпы роста за отдельные интервалы времени.
5.1.6. Скользящая средняя:
+ pt y = yit, m ti -= p где yt - значение скользящей средней для момента t (t = p + 1,...,n - p );
yi - фактическое значение уровня в момент i.
5.1.7. Взвешенная скользящая средняя для p=2:
= -3( yy +12yt -- +17yt +12yt +1 - 3yt + 2 ).
tt 5.1.8. Взвешенная скользящая средняя для p=3:
= -2( yy + 3yt-- + 6yt-1 + 7yt + 6yt+1 + 3yt+2 - 2yt-3).
tt 5.1.9. Модели:
- постоянный рост: = by + b1t - линейная;
t - увеличивающийся рост:
by += b1t + b2t2 - парабола, t = by b1t - показательная;
t - уменьшающийся рост:
= by + b1 ln t - линейная логарифмическая;
t = by tb1 при < 1b - степенная;
t 0 bby -= - модифицированная гипербола;
t t by -= b1е-t модифицированная экспонента;
t - комбинированный рост:
by += b1 ln t + b2(ln t)2 с b2 < 0 - логарифмическая парабола;
t by += b1t + b2t2 + b3t3 с b3 < 0 - полином третьей степени.
t 5.1.10. Критерий Дарбина-Уотсона:
n - ее )( tt -t =d =.
n еt t=5.1.11. Ошибка прогноза:
t = - y.
t t 5.1.12. Относительная ошибка прогноза:
- y tt = 100.
t yt 5.1.13. Средняя абсолютная ошибка прогноза:
n - y tt t ==, n 5.1.14. Средняя относительная ошибка прогноза:
n 1 - y tt = 100.
n yt t= 5.1.15. Средняя квадратическая ошибка прогноза:
n ( - y )tt =1t S =.
n 5.2. Решения типовых задач Задание 5.2.1. По данным табл. 5.2.1 сгладить временной ряд, характеризующий внешнеторговый оборот Австрии за 1980-1995гг. Сглаживание провести с использованием скользящей средней (р=1) и взвешенной скользящей средней (р=2). Построить совмещенный график по исходным и сглаженным данным. Сравнить между собой сглаженные кривые, сделать вывод относительно методов сглаживания. Вычислить абсолютные приросты и относительные темпы роста для исходных и сглаженных данных. Построить для них диаграммы и сравнить между собой. Рассчитать по исходным и сглаженным данным средний абсолютный прирост и средний относительный рост за рассматриваемый период. Результаты расчетов сравнить между собой и в случае их несовпадения объяснить причины этого.
Таблица 5.2.Внешнеторговый оборот, Внешнеторговый оборот, Год Год млн. шиллингов млн. шиллингов 1980 752 1988 1981 824 1989 1982 843 1990 1983 884 1991 1984 994 1992 1985 1096 1993 1986 1033 1994 1987 1047 1995 Решение с помощью табличного процессора Excel.
1. Ввод исходных данных.
2. Расчет сглаженных значений. Расчетные формулы располагаются с учетом исключаемых крайних наблюдений. Оформление результатов расчетов в виде табл. 5.2.2.
3. Построение для исходных и сглаженных данных табл. 5.2.2 Точечного графика, используя для этого Мастер диаграмм.
Сглаживание Внешнеторговый оборот, млн. шиллингов Данные, сглаженные по 1му методу Данные, сглаженные по 2му методу 1980 1982 1984 1986 1988 1990 1992 Время, год ши ли н гов Обор от, млн.
Pages: | 1 | 2 | 3 | 4 | 5 | ... | 6 | Книги по разным темам