Проверка гипотез относительно коэффициентов линейного уравнения регрессии
Контрольная работа - Менеджмент
Другие контрольные работы по предмету Менеджмент
. вероятность ошибки): 1% или 5%.) Находим критическое значение по таблице:
в таблице выбираем клетку в строке, соответствующей числу степеней свободы и в столбце, соответствующем выбранному уровню значимости.) Сравниваем фактическое значение с табличным:
Если t > t , то коэффициент значим на выбранном уровне значимости (лучше сначала на 1% проверить). Т.е. нулевая гипотеза отвергается.
Если t < t , то коэффициент не значим. Нулевая гипотеза не отвергается.статистика:статистика представляет собой отношение объясненной суммы квадратов (в расчете на одну независимую переменную) к остаточной сумме квадратов (в расчете на одну степень свободы).
Фактически проверяем гипотезу:
Но: все коэффициенты при независимых переменных равны нулю
На: хотя бы один из них нулю не равен.
Выяснить, отвергается нулевая гипотеза или нет, можно 2 способами:
1.По таблицам:
a) Рассчитываем фактическое по формуле:
F(k-1,n-k)= , где
k - число объясняющих переменных.) Находим табличное:
Выбираем уровень значимости ? (1% или 5%)
Вычисляем число степеней свободы: 1 и (n-2).
По таблицам F-распределения Фишера определяем критическое значение F?, 1, n-2 (всегда одностороннее)) Если Fстатистика(фактическое) > F? , 1, n-2, то уравнение в целом является значимым при выбранном уровне значимости ? .
d) В противном случае уравнение в целом незначимо (на данном уровне ?).
Задание 1.
. Для характеристики зависимости у от х рассчитать параметры следующих уравнений регрессии:
а) линейной;
б) параболической
в) степенной;
. Рассчитать коэффициент корреляции или индекс корреляции и коэффициент детерминации по каждой модели.
. Оценить каждую модель через среднюю ошибку аппроксиминации A и F-критерий Фишера.
Душевой доход, долл., уИндекс человеческого развития (ИЧР), х36800,56636500,71732800,71126800,67226000,58926000,62622000,51321500,44513700,32813500,39313500,446линейный регрессия корреляция детерминация
Решение:
1Расчет параметров линейной регрессии.
Парная линейная регрессия - уравнение вида , где a и b - параметры регрессии, а - погрешность уравнения (случайная величина).
Параметры уравнения a и b, находят посредством Метода Наименьших Квадратов. Рассчитаем вспомогательные параметры в таблице:
№ХУх*уХ2y210,56636802082,90,321354240020,71736502617,10,511332250030,71132802332,10,511075840040,67226801801,00,45718240050,58926001531,40,35676000060,62626001627,60,39676000070,51322001128,60,26484000080,4452150956,80,20462250090,3281370449,40,111876900100,3931350692,60,151822500110,4461350600,80,201822500S6,00626910,015820,03,4573310100Ср.зн0,5462446,41438,20,316664555
По найденным значениям вычислим параметр b (коэффициент регрессии):
Рассчитаем значение а:
Тогда уравнение регрессии запишется следующим образом:
. Для оценки тесноты связи в эконометрике используется коэффициент корреляции (r).
.
В нашем случае значение коэффициента корреляции 0,85 говорит о сильной связи между х и у, т.е. связь между индексом человеческого развития и душевым доходом очень сильная. Рассчитаем коэффициент детерминации R2. R2=(0.85)2= 0.72. Таким образом, вариация величины доли душевого дохода на 72% зависит от вариации индекса человеческого развития, а на остальные (100%-72%) 28% ? от вариации факторов, не включенных в модель.
. Расчет средней ошибки аппроксимации.
Определим среднюю ошибку аппроксимации по формуле:
Используем данные вспомогательной таблицы:
2558,312525,31521858,71121,71258255,80,33400,9911063,31448740,5249,162070,70,13367,4848271,1694949,6-87,47635,30,03149,8494766,454586,0-469,8220674,50,22686,657723,123604,1-86,67503,00,02893,1199555,523604,1-293,185895,90,12262,533791,160695,0-62,53911,30,01883,1317265,987831,4266,971235,60,11230,21478956,71158558,7139,819532,90,11592,9728331,91202013,2-242,959019,80,21888,7311011,01202013,2-538,7290176,10,4Сумма=26913,55393261,57478454,5-3,52085910,81,6Ср.зн.= 2446,7490296,5679859,5-0,3189628,30,1
Тогда средняя ошибка аппроксимации равна
Практически полагают, что значение средней ошибки аппроксимации не должно превышать 8-15%, для грубого приближения регрессии к реальной зависимости. В нашем случае средняя ошибка аппроксимации приблизительно равна указанному значению, поэтому можно говорить о том, что реальная зависимость существует.
. Оценка значимости уравнения регрессии в целом даётся при помощи F-критерия Фишера. При этом выдвигается нулевая гипотеза (Н0), что b=0, и, следовательно, фактор х не оказывает влияния на фактор у. Но перед этим следует произвести анализ дисперсии. Рассчитаем Dфакт и Dостат:
.
.
Сопоставляя факторную и остаточную дисперсии получаем F-критерий (величину F-отношения): . Если гипотеза Н0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для того, чтобы опровергнуть гипотезу Н0, необходимо полученное F-отношение сравнить с табличным Fкр, которое берётся из таблиц Фишера - Снедекора (при разных уровнях значимости) или определяется по функции Excel FPACПОБР.
Вычислим критическое значение критерия Фишера на уровне значимости a=0,05 и числе степеней свободы факторной суммы k1 и числе степеней свободы остаточной суммы k2 с помощью статистической функции FPACПОБР: Fкр(a=0,05, k1 =k-1; k2 =n-k)=5,32, где n=11 - объем выборки; k=2 - количество коэффициентов в уравнении.
Так как F=23> Fкр (a=0,05, k1 = 1; k2 =9)=5, то нулевая гипотеза Н0 отвергается и утверждается, что фактор х оказывает влияние на фактор у, уравнение регрессии признаётся значимым (модель достоверна).
2Расчет параметров параболической регрессии
Спецификация модели зависимости у от х с помощью параболической функции
Приведем эту функцию к линейному виду. Для этого заменив переменные х=х1, х2=х2, получим двухфакторное уравнение линейной регр?/p>