Проверка гипотез относительно коэффициентов линейного уравнения регрессии

Контрольная работа - Менеджмент

Другие контрольные работы по предмету Менеджмент

. вероятность ошибки): 1% или 5%.) Находим критическое значение по таблице:

в таблице выбираем клетку в строке, соответствующей числу степеней свободы и в столбце, соответствующем выбранному уровню значимости.) Сравниваем фактическое значение с табличным:

Если t > t , то коэффициент значим на выбранном уровне значимости (лучше сначала на 1% проверить). Т.е. нулевая гипотеза отвергается.

Если t < t , то коэффициент не значим. Нулевая гипотеза не отвергается.статистика:статистика представляет собой отношение объясненной суммы квадратов (в расчете на одну независимую переменную) к остаточной сумме квадратов (в расчете на одну степень свободы).

Фактически проверяем гипотезу:

Но: все коэффициенты при независимых переменных равны нулю

На: хотя бы один из них нулю не равен.

Выяснить, отвергается нулевая гипотеза или нет, можно 2 способами:

1.По таблицам:

a) Рассчитываем фактическое по формуле:

 

F(k-1,n-k)= , где

 

k - число объясняющих переменных.) Находим табличное:

Выбираем уровень значимости ? (1% или 5%)

Вычисляем число степеней свободы: 1 и (n-2).

По таблицам F-распределения Фишера определяем критическое значение F?, 1, n-2 (всегда одностороннее)) Если Fстатистика(фактическое) > F? , 1, n-2, то уравнение в целом является значимым при выбранном уровне значимости ? .

d) В противном случае уравнение в целом незначимо (на данном уровне ?).

Задание 1.

. Для характеристики зависимости у от х рассчитать параметры следующих уравнений регрессии:

а) линейной;

б) параболической

в) степенной;

. Рассчитать коэффициент корреляции или индекс корреляции и коэффициент детерминации по каждой модели.

. Оценить каждую модель через среднюю ошибку аппроксиминации A и F-критерий Фишера.

 

Душевой доход, долл., уИндекс человеческого развития (ИЧР), х36800,56636500,71732800,71126800,67226000,58926000,62622000,51321500,44513700,32813500,39313500,446линейный регрессия корреляция детерминация

Решение:

1Расчет параметров линейной регрессии.

Парная линейная регрессия - уравнение вида , где a и b - параметры регрессии, а - погрешность уравнения (случайная величина).

Параметры уравнения a и b, находят посредством Метода Наименьших Квадратов. Рассчитаем вспомогательные параметры в таблице:

 

№ХУх*уХ2y210,56636802082,90,321354240020,71736502617,10,511332250030,71132802332,10,511075840040,67226801801,00,45718240050,58926001531,40,35676000060,62626001627,60,39676000070,51322001128,60,26484000080,4452150956,80,20462250090,3281370449,40,111876900100,3931350692,60,151822500110,4461350600,80,201822500S6,00626910,015820,03,4573310100Ср.зн0,5462446,41438,20,316664555

По найденным значениям вычислим параметр b (коэффициент регрессии):

 

 

Рассчитаем значение а:

Тогда уравнение регрессии запишется следующим образом:

. Для оценки тесноты связи в эконометрике используется коэффициент корреляции (r).

 

.

 

В нашем случае значение коэффициента корреляции 0,85 говорит о сильной связи между х и у, т.е. связь между индексом человеческого развития и душевым доходом очень сильная. Рассчитаем коэффициент детерминации R2. R2=(0.85)2= 0.72. Таким образом, вариация величины доли душевого дохода на 72% зависит от вариации индекса человеческого развития, а на остальные (100%-72%) 28% ? от вариации факторов, не включенных в модель.

. Расчет средней ошибки аппроксимации.

Определим среднюю ошибку аппроксимации по формуле:

 

 

Используем данные вспомогательной таблицы:

 

2558,312525,31521858,71121,71258255,80,33400,9911063,31448740,5249,162070,70,13367,4848271,1694949,6-87,47635,30,03149,8494766,454586,0-469,8220674,50,22686,657723,123604,1-86,67503,00,02893,1199555,523604,1-293,185895,90,12262,533791,160695,0-62,53911,30,01883,1317265,987831,4266,971235,60,11230,21478956,71158558,7139,819532,90,11592,9728331,91202013,2-242,959019,80,21888,7311011,01202013,2-538,7290176,10,4Сумма=26913,55393261,57478454,5-3,52085910,81,6Ср.зн.= 2446,7490296,5679859,5-0,3189628,30,1

Тогда средняя ошибка аппроксимации равна

 

 

Практически полагают, что значение средней ошибки аппроксимации не должно превышать 8-15%, для грубого приближения регрессии к реальной зависимости. В нашем случае средняя ошибка аппроксимации приблизительно равна указанному значению, поэтому можно говорить о том, что реальная зависимость существует.

. Оценка значимости уравнения регрессии в целом даётся при помощи F-критерия Фишера. При этом выдвигается нулевая гипотеза (Н0), что b=0, и, следовательно, фактор х не оказывает влияния на фактор у. Но перед этим следует произвести анализ дисперсии. Рассчитаем Dфакт и Dостат:

 

.

.

 

Сопоставляя факторную и остаточную дисперсии получаем F-критерий (величину F-отношения): . Если гипотеза Н0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для того, чтобы опровергнуть гипотезу Н0, необходимо полученное F-отношение сравнить с табличным Fкр, которое берётся из таблиц Фишера - Снедекора (при разных уровнях значимости) или определяется по функции Excel FPACПОБР.

Вычислим критическое значение критерия Фишера на уровне значимости a=0,05 и числе степеней свободы факторной суммы k1 и числе степеней свободы остаточной суммы k2 с помощью статистической функции FPACПОБР: Fкр(a=0,05, k1 =k-1; k2 =n-k)=5,32, где n=11 - объем выборки; k=2 - количество коэффициентов в уравнении.

Так как F=23> Fкр (a=0,05, k1 = 1; k2 =9)=5, то нулевая гипотеза Н0 отвергается и утверждается, что фактор х оказывает влияние на фактор у, уравнение регрессии признаётся значимым (модель достоверна).

2Расчет параметров параболической регрессии

Спецификация модели зависимости у от х с помощью параболической функции

Приведем эту функцию к линейному виду. Для этого заменив переменные х=х1, х2=х2, получим двухфакторное уравнение линейной регр?/p>