Таблица 2.2.y y № п/п x1 x2 № п/п x1 x1. 131 110 106 8. 54 132 2. 70 35 66 9. 79 111 3. 31 16 61 10. 242 168 4. 106 46 53 11. 170 105 5. 109 50 23 12. 80 110 6. 75 99 48 13. 96 108 7. 111 114 52 14. 138 109 Решение с помощью табличного процессора Excel 1. Ввод исходных данных с включением в модель дополнительной переменной x0, принимающей единственное значение, равное 1.
2. Расчет коэффициентов регрессии с использованием матричных функций Excel.
2.1. Формирование матрицы системы нормальных уравнений ( XX )с помощью функций ТРАНСП () и МУМНОЖ ().
14 1313 1313 145633 846 83537 2.2. Формирование вектора правой части системы нормальных урав нений ( X Y ) с помощью функций, указанных в п. 2.1.
2.3. Нахождение обратной матрицы к матрице системы нормальных уравнений с помощью функции МОБР ().
0,741966 -0,002955955 -0,-0,002956 4,97304E-05 -2,83E--0,006509 -2,82655E-05 0,2.4. Получение вектора оценок коэффициентов регрессии путем умножения обратной матрицы на правую часть системы нормальных уравнений -11,0,1,3. Расчет стандартных ошибок с использованием функций Excel.
3.1. Вычисление расчетных значений по полученному уравнению регрессии.
3.2. Нахождение отклонений расчетных значений от фактических.
3.3. Подсчет суммы квадратов отклонений.
3.4. Вычисление остаточной дисперсии и оформление промежуточных результатов в виде табл. 2.2.2.
Таблица 2.2.y y - ( - y )131 167,3888 -36,3888 1324,70 82,61513 -12,6151 159,31 67,04633 -36,0463 1299,106 73,33778 32,66222 1066,109 40,88159 68,11841 4640,75 94,96285 -19,9628 398,111 107,3146 3,685425 13,54 103,9548 -49,9548 2495,79 101,1618 -22,1618 491,242 192,7475 49,2525 2425,170 147,5446 22,45539 504,80 97,193 -17,193 295,96 99,61208 -3,61208 13,138 116,2392 21,76083 473,Сумма квадратов отклонений 15600,Остаточная дисперсия 1418,3.5. Получение стандартных ошибок в виде корня квадратного из произведения диагональных элементов обратной матрицы на остаточную дисперсию 32,0,0,4. Вычисление множественного индекса корреляции.
4.1. Проведение промежуточных расчетов и оформление их в виде табл. 2.2.3.
Таблица 2.2.2 2 X1 X ( - YY ) ( - XX ) ( - XX ) Y 2 11 131 110 106 596,7551 262,9031 2076,70 35 66 1337,469 3455,76 31,31 16 61 5711,041 6050,617 0,106 46 53 0,326531 2283,474 55,109 50 23 5,897959 1917,189 1400,75 99 48 996,7551 27,18878 154,111 114 52 19,61224 408,6173 71,54 132 41 2763,755 1460,332 377,79 111 48 760,1837 296,3316 154,242 168 102 18340,9 5507,76 1728,170 105 91 4023,184 125,7602 934,80 110 45 706,0408 262,9031 238,96 108 48 111,7551 202,0459 154,138 109 62 987,7551 231,4745 2,106,5714 93,78571 60,42857 36361,43 22492,36 7379,Дисперсия 2797,033 1730,181 567,Среднее квадратическое 52,88698 41,59545 23,отклонение 4.2. Расчет множественного индекса корреляции 15600,R 1-= =,0 755619.
36361,4.3. Расчет скорректированного множественного индекса корреляции R -= (11 - 0,755619 )13 =,0 702106.
скор 5. Расчет бетта-коэффициентов =,0 516582 41,59545/ 52,88698 = 0,40629;
=,115075 23,8254/ 52,88698 = 0,518408.
6. Расчет парных коэффициентов корреляции и оформление расчетов в виде табл. 2.2.4.
7. Вычисление множественного коэффициента корреляции R,0 575062= 0,40629 + 0,65068 0,518408 = 0,755619.
8. Вычисление дисперсионного отношения Фишера,0 755619 F = =,7 319308.
расч - 01,755619 Таблица 2.2.X1 X ( )(XYY -- X11 ) ( )(XYY -- X ) Y 2 131 110 106 396,0918 1113,70 35 66 2149,878 -203,31 16 61 5878,378 -43,106 46 53 27,30612 4,109 50 23 -106,337 -90,75 99 48 -164,622 392,111 114 52 89,52041 -37,54 132 41 -2008,98 1021,79 111 48 -474,622 342,242 168 102 10050,73 5629,170 105 91 711,3061 1939,80 110 45 -430,837 409,96 108 48 -150,265 131,138 109 62 478,1633 49,106,5714 93,7857 60,42857 16445,71 10658, Парные коэффициенты корреляции 0,575062 0,9. Построение регрессионного уравнения с использованием Пакета анализа Excel. Идентичность результатов, полученных с помощью расчетных формул и инструментальных средств Excel (см. Вывод итогов к заданию 2.2.1), свидетельствует о правильном понимании алгоритма метода наименьших квадратов в матричной форме.
ВЫВОД ИТОГОВ к заданию 2.2.Регрессионная статистика Множественный R 0,R-квадрат 0,Нормированный Rквадрат 0,Стандартная ошибка 37,Наблюдения Дисперсионный анализ Значи df SS MS F мость F Регрессия 2 20760,90924 10380,45 7,319308 0,Остаток 11 15600,51933 1418,Итого 13 36361,Коэффици- Стандарт- P- Нижние Верхние енты ная ошибка t-статистика Значение 95% 95% Y-пересечение -11,41475 32,43883158 -0,35189 0,731573 -82,812174 59,Переменная X 1 0,516582 0,265573124 1,945158 0,077756 -0,0679411 1,Переменная X 2 1,15075 0,463649975 2,481938 0,030469 0,130263 2, 2.3. Контрольные задания Задание 2.3.1. В табл. 2.3.1 представлены данные о производительности труда, фондоотдаче и уровне рентабельности предприятия Рождественская звезда.
Таблица 2.3.Производительность Фондоот- Уровень рентабель№ п.п.
труда, руб. дача, руб. ности, % 1. 7343 1,08 20,2. 3991 1,05 12,3. 5760 0,99 18,4. 3000 1,02 11,5. 5241 0,98 17,6. 4500 1,04 16,7. 4300 1,03 15,8. 3212 1,10 14,9. 6743 1,03 18,10. 5234 0,89 17,11. 2500 0,78 13,12. 3930 0,99 14,13. 14333 1,43 24,14. 6980 1,03 20,15. 6740 1,05 19,Используя матричную форму метода наименьших квадратов, по данным этой таблицы рассчитать:
1) коэффициенты регрессии;
2) стандартные ошибки коэффициентов регрессии;
3) множественный индекс корреляции;
4) скорректированное значение множественного коэффициента детерминации;
5) бетта - коэффициенты;
6) парные коэффициенты корреляции;
7) множественный коэффициент корреляции через бетта - коэффициенты и парные коэффициенты корреляции;
8) дисперсионное отношение Фишера;
9) частные F-критерии для каждого фактора.
Построить уравнение регрессии, используя Пакет анализа табличного процессора Excel, и полученные результаты сравнить с расчетами по методу наименьших квадратов.
Задание 2.3.2. Данные о деятельности крупнейших компаний США представлены в табл. 2.3.2.
Таблица 2.3.№ Чистый доход, Оборот капитала, Использованный ка- Численность п/п млрд. долл. США млрд. долл. США питал, млрд. долл. служащих, США тыс. чел.
1. 6,6 6,9 83,6 2. 3 18 6,5 3. 6,5 107,9 50,4 4. 3,3 16,7 15,4 45,5. 0,1 79,6 29,6 299,6. 3,6 16,2 13,3 41,7. 1,5 5,9 5,9 17,8. 5,5 53,1 27,1 9. 2,4 18,8 11,2 82,10. 3 35,3 16,4 11. 4,2 71,9 32,5 225,12. 2,7 93,6 25,4 13. 1,6 10 6,4 43,14. 2,4 31,5 12,5 102,15. 3,3 36,7 14,3 16. 1,8 13,8 6,5 49,17. 2,4 64,8 22,7 50,18. 1,6 30,4 15,8 19. 1,4 12,1 9,3 20. 0,9 31,3 18,9 Применяя матричную форму метода наименьших квадратов, по данным этой таблицы рассчитать:
1) коэффициенты регрессии;
2) коэффициенты эластичности;
3) стандартные ошибки коэффициентов регрессии;
4) множественный индекс корреляции;
5) скорректированное значение множественного коэффициента детерминации;
6) бетта - коэффициенты;
7) парные коэффициенты корреляции;
8) множественный коэффициент корреляции через бетта - коэффициенты и парные коэффициенты корреляции;
9) дисперсионное отношение Фишера;
10)частные F-критерии для каждого фактора.
Построить уравнение регрессии, используя Пакет анализа табличного процессора Excel, и полученные результаты сравнить с расчетами по методу наименьших квадратов.
3. СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ И ИХ ПРОВЕРКА 3.1. Расчетные формулы 3.1.1. Нормально распределенная значение статистики:
x - ~ z = n.
3.1.2. Статистика с распределением t -Стьюдента:
ii 0 ( - bb )/ bi - bb ii t = = (nt -= m).
Sbi S / bb 2ii 3.1.3. Статистика с распределением F-Фишера:
Sвоспр R2 mn -- 1 ( - y )2 / m t F = = =, 2 1- R2 m (ne m -- 1/ ) Sост t где - сумма квадратов остатков ( t )2) e2 (ye2-= t tt 3.1.4. F-статистика для проверки общей линейной гипотезы:
- ( bH - r)[H(X X)-1H ] (Hb - r)/ q F =.
ee ( mn -- 1/ ) где bH = r, H - матрица, r - вектор, q - размерность вектора r.
3.1.5. Статистика с распределением F-Фишера, применяемая в тесте Чоу:
2 ( SS ) (k +- 1/ ) ост 3ост F =, (nS m -+ 2/ k - 2) 3ост где k - количество факторов в регрессионной модели; n - объем первой выборочной совокупности; m - объем второй выборочной совокупности;
Sост - сумма квадратов остатков регрессии, построенной по объединенной выборочной совокупности;
S1ост - сумма квадратов остатков регрессии, построенной по первой выборочной совокупности;
S2ост - сумма квадратов остатков регрессии, построенной по второй выборочной совокупности;
2 2 SS += S2ост.
3ост 1ост 3.2. Решение типовых задач Задание 3.2.1. Требуется проверить нуль-гипотезу, состоящую в том, что значение генеральной совокупности, оцененное по случайной выборке отличается от предполагаемого значения. Данные для проверки гипотезы:
=25,0; = 6,0; n =36; x =23,2.
0 Гипотеза H : = H :.
A A Решение с помощью табличного процессора Excel 1. Ввод данных для проверки гипотезы.
2. Расчет абсолютного значения нормально распределенной статистики 23,2 - 25,~ z = 36 =1,8.
3. Сравнение полученного значения статистики с критическим значени~ ем,18 <= 1,96 = zz.
,0 Так как расчетное значение статистики меньше критического значения, то нуль-гипотеза не отвергается (Р>0,05). Неотклоненная нуль-гипотеза принимается в качестве рабочей гипотезы, так как она не противоречит выборочным наблюдениям. Однако нужно помнить, что правильность нуль-гипотезы, возможно, была подтверждена только потому, что не оказалось достаточного для ее отклонения статистического материала.
4. Ввод данных для перепроверки гипотезы:
=25,0; = 6,0; n =49; x =23,1.
0 5. Расчет статистики 231- 25,, ~ z = 49 = 2,.
6. Сравнение полученного значения статистики с критическим значением :
~ z z =2,22>1,96 =,,0 Так как расчетное значение больше критического значения, то нульгипотеза отклоняется на 5%-ном уровне значимости (Р<0,05).
Задание 3.2.2. Используя формулы матричной формы МНК, по данным табл. 3.2.1 построить модель множественной регрессии и проверить гипотезы:
:H bi = 0 ( = 1, mi ) и :H = bb = = bm = 0. Если в результате проверки пер0 0 вой гипотезы окажется, что не все факторы значимы, то заново построить модель, исключив незначимые факторы.
Таблица 3.2.X X X X X X № Y № Y 1 2 3 1 2 1. 32,0 14,1 235,0 605,8 7. 13,2 60,6 261,6 628,2. 22,2 46,9 278,3 677,3 8. 32,7 40,4 291,1 682,3. 37,4 44,2 214,2 572,3 9. 46,0 65,0 218,6 581,4. 47,8 59,4 256,6 627,4 10. 24,1 42,0 269,0 643,5. 47,0 51,7 190,9 567,7 11. 28,1 74,6 250,4 612,6. 52,3 35,6 205,6 566,2 12. 18,1 45,6 286,4 666,Решение с помощью табличного процессора Excel 1. Получение вектора оценок коэффициентов регрессии по формуле (2.1.1) согласно алгоритму, изложенному при выполнении задания 2.2.1.
303,0,-0,1,2. Расчет стандартных ошибок с использованием функций Excel по формуле (2.1.2) согласно алгоритму, изложенному при выполнении задания 2.2.1.
45,0,0,0,3. Вычисление расчетных значений t-статистики путем деления коэффициентов регрессии на стандартные ошибки 6,0,-0,9,Сравнение расчетных значений t-статистики с табличным tS 8( ) = 2,позволяет отвергнуть нулевую гипотезу только для третьего фактора.
4. Вычисление дисперсионного отношения Фишера 4.1. Расчет воспроизведенной дисперсии и оформление результатов в виде табл. 3.2.2.
4.2. Расчет F-статистики путем деления воспроизведенной дисперсии на остаточную 6242,F == 54,расч 115,и сравнение ее с критическим значением Fc )( = 48,07. Так как > FFрасч c, то модель считается адекватной.
Таблица 3.2. ( - YY ) ( - Y ) Y Y 605,8 610,2 -9,1 82,677,3 658,6 39,3 1544,572,3 579,1 -40,2 1614,627,4 633,2 13,9 193,567,7 549,5 -69,8 4868,566,2 572,3 -47,0 2209,628,4 632,8 13,5 182,682,8 678,2 58,9 3464,581,9 582,7 -36,6 1342,643,0 647,8 28,4 808,612,6 618,8 -0,5 0,666,5 668,5 49,2 2415,Сумма квадратов отклонений 18726,Воспроизведенная дисперсия 6242,5. Построение модели = by + b30 x3 с использованием Пакет анализа Excel.
Окончательно модель, отражающая зависимость y от x, имеет вид = 314 33 + 1,, 24xy.
Расчетное значение F-статистики равно 179,12, что свидетельствует о ее адекватности.
Задание 3.2.3. По данным табл. 3.2.3 построить множественное уравнение регрессии и проверить гипотезу, удовлетворяют ли ее коэффициенты линейному ограничению общего вида, т.е. :H Hb = r, где 01 0 0 H 20 -= 1 0, r = 0.
-,00 0 Таблица 3.2.№ X X X № X X X Y Y 1 2 3 1 2 1. 24,5 32,6 53,1 74,5 7. 34,0 15,4 53,1 39,2. 25,8 27,5 50,9 65,7 8. 31,6 23,2 69,0 39,3. 36,0 27,1 68,6 58,1 9. 45,6 25,6 37,0 104,4. 24,6 35,8 53,9 86,3 10. 40,6 23,7 56,8 68,5. 37,0 14,3 34,4 61,5 11. 46,7 21,4 58,7 70,6. 15,4 21,6 54,7 25,5 12. 37,3 21,0 68,5 40,Решение с помощью табличного процессора Excel 1. Получение вектора оценок коэффициентов регрессии по формуле (2.1.1) согласно алгоритму, изложенному при выполнении задания 2.2.1.
2,1,3,-1,2. Вычисление F -статистики для проверки гипотезы о линейном ограничении общего вида.
2.1. Вычисление остаточной дисперсии Sост =,2 06.
2.2. Вычисление значения числителя F-статистики.
2.2.1. Расчет вектора H - rb -2,0,0,- 2.2.2. Расчет матрицы (XH X) H 5,8540 -0,0384 -0,-0,0384 0,0050 0,-0,0380 0,0003 0, и обратной к ней 0,26 1,30 12,1,30 208,97 -10,12,59 -10,88 1952, 2.2.3. Окончательный расчет числителя F-статистики 1, 3. Деление результата п.2.2.3 на остаточную дисперсию (окончательный расчет значения F-статистики) F = 700,.
расч 4. Сравнение полученного результата с критическим значением F,( 83 ) = 4,07. Нуль-гипотеза не отвергается, так как < FF.
c расч c 3.3. Контрольные задания Задание 3.3.1. По данным табл. 3.3.1, используя формулы матричного метода МНК, рассчитать коэффициенты линейного регрессионного уравнения, отражающего зависимость количества еженедельно продаваемых чизбургеров бистро Вкусноед от их цены и расходов на рекламу.
Для построенного уравнения регрессии проверить две гипотезы:
1) :H b = 0 ( = 1, mi ) ;
0 i 2) :H = bb = = b = 0.
0 21 m Если окажется, что среди факторов есть незначимый, то построить модель, исключив этот фактор. Провести сравнение построенных моделей.
Таблица 3.3.Количество Количество Цена чиз- Расходы на Цена Расходы на № проданных № проданных бургера, рекламу, чизбургера, рекламу, п.п. чизбургеров, п.п. чизбургеров, руб. руб. руб. руб.
шт. шт.
Pages: | 1 | 2 | 3 | 4 | ... | 6 | Книги по разным темам