Методика проведения парного корреляционно-регрессионного анализа
Методическое пособие - Экономика
Другие методички по предмету Экономика
ВВЕДЕНИЕ
линейная функция коэффициент эластичность кореляция
Методические указания к выполнению расчетно-графической работы содержат цели, задачи, теоретические положения, примеры определения параметров парной линейной регрессии и корреляции по формулам, а также с использованием табличного процессора Microsoft Excel, задания для самостоятельной работы студентов, позволяющие освоить и закрепить методику проведения парного корреляционно-регрессионного анализа, а также интерпретировать полученные результаты.
1. Теоретические положения
Цель выполнения расчетно-графической работы - овладеть навыками построения модели парной регрессии с использованием формул и табличного процессора MS Excel.
Уравнение парной линейной регрессии имеет вид:
, (1)
где теоретическое значение результативного признака, найденное из уравнения регрессии;
независимая переменная (факторный признак);
параметры уравнения регрессии (а - экономического содержания не имеет; b - коэффициент регрессии);
случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Параметры линейной регрессии оценивают с помощью метода наименьших квадратов (МНК).
Система нормальных уравнений МНК имеет вид:
(2)
где n - количество наблюдений.
Для решения системы можно воспользоваться готовыми формулами:
, (3)
(4)
где ковариация признаков;
дисперсия признака х.
Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата при изменении фактора на одну единицу.
Тесноту связи изучаемых явлений характеризует коэффициент корреляции (r), который определяется по формуле:
. (5)
Коэффициент корреляции может принимать значения . Если , то связь между признаками прямая, если - связь обратная.
Для оценки тесноты связи используют шкалу Чэддока:
до 0,3 - связь отсутствует или очень слабая;
от 0,3 до 0,5 - связь слабая;
от 0,5 до 0,7 - связь умеренная;
от 0,7 до 1,0 - связь сильная.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции - коэффициент детерминации (), который показывает, на сколько процентов вариация результативного признака определяется вариацией факторов, включенных в модель.
Качество построенной модели оценивает также средняя ошибка аппроксимации - это среднее отклонение расчетных значений от фактических:
. (6)
Допустимый предел значений не более 8-10%.
Средний коэффициент эластичности показывает, на сколько процентов в среднем изменится результат при изменении фактора на 1% и рассчитывается по формуле (для линейной функции):
. (7)
Значимость уравнения регрессии в целом оценивается с помощью F-критерия Фишера, который определяется из соотношения значений факторной и остаточной дисперсии, рассчитанных на одну степень свободы:
, (8)
где n - число единиц совокупности;
m - число параметров при переменных x.
Для оценки значимости уравнения регрессии Fфакт. сравнивается с Fтабл. при , , . Если Fфакт. > Fтабл., то уравнение регрессии значимо, статистически надежно и может быть использовано для прогнозирования.
1.1 Решение задачи
По регионам Центрального федерального округа за 2008 год изучается зависимость доли сельского населения от величины среднедушевых денежных доходов населения. Исходные данные представлены в таблице 1.
Таблица 1.
Исходные данные для корреляционно-регрессионного анализа
РегионыДоля сельского населения, %Среднедушевой денежный доход, тыс. руб.1 Белгородская область33,612,82 Брянская область31,4103 Владимирская область22,29,64 Воронежская область36,710,35 Ивановская область19,28,46 Калужская область23,811,87 Костромская область31,59,48 Курская область35,811,49 Липецкая область35,912,310 Московская область19,219,811 Орловская область35,69,812 Рязанская область3011,313 Смоленская область28,311,514 Тамбовская область4211,315 Тверская область25,710,916 Тульская область2011,417 Ярославская область18,212,6
Задание:
1) Для характеристики зависимости среднего размера вклада физических лиц от величины среднедушевых денежных доходов населения рассчитать параметры линейной функции.
) Определить средний коэффициент эластичности.
) Рассчитать коэффициент корреляции.
) Оценить значимость модели через показатель детерминации, среднюю ошибку аппроксимации и F-критерий Фишера.
) С вероятностью 0,95 указать доверительный интервал ожидаемого значения величины вклада в предположении роста среднего дохода на душу населения на 10,0% от своего среднего уровня и найти доверительный интервал прогноза.
) Проанализировать все рассчитанные показатели.
Решение:
1) Параметры a и b линейной регрессии рассчитываются с помощью метода наименьших квадратов. Для этого составим систему нормальных уравнений (2).
По исходным данным определим , , , , в расчетной таблице 2.
Таблица 2
Расчет показателей парной линейной регрессии и корреляции
№22133,612,8430,11129163,811,10,132,8923,04231,41031498610011,20,121,446,76322,29,6213,1492,892,2120,255,7643,56436,710,33781346,9106,110,80,050,2562,41519,28,4161,3368,670,612,20,4514,4492,16623,811,8280,8566,4139,211,90,010,0125731,59,4296,1992,388