Социально-экономические явления и методы исследования связей между ними
Информация - Экономика
Другие материалы по предмету Экономика
?симости от количества включенных в модель факторов Х модели делятся на однофакторные (парная модель регрессии) и многофакторные (модель множественной регрессии).
Связь между переменной Y и m независимыми факторами можно охарактеризовать функцией регрессии Y= f (X1, X2, X3, … Xm), которая показывает, каково будет в среднем значение переменной yi, если переменные xi примут конкретные значения.
Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений.
Под линейностью здесь имеется в виду, что переменная y предположительно находиться под влиянием переменной x в следующей зависимости:
,
где - постоянная величина (или свободный член уравнения), - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений. Это показатель, характеризующий изменение переменной , при изменении значения на единицу. Если - переменные и положительно коррелированные, если 0 отрицательно коррелированны; - независимые одинаково распределенные случайные величины остаток с нулевым математическим ожиданием () и постоянной дисперсией (). Она отражает тот факт, что изменение будет неточно описываться изменением Х присутствуют другие факторы, неучтенные в данной модели.
Для оценки параметров регрессионного уравнения наиболее часто используют метод наименьших квадратов (МНК), который минимизирует сумму квадратов отклонения наблюдаемых значений от модельных значений .
Согласно принципу метода наименьших квадратов, оценки и находятся путем минимизации суммы квадратов
по всем возможным значениям и при заданных (наблюдаемых) значениях. Задача сводится к известной математической задаче поиска точки минимума функции двух переменных. Точка минимума находится путем приравнивания нулю частных производных функции по переменным и . Это приводит к системе нормальных уравнений
решением которой и является пара , . Согласно правилам вычисления производных имеем
так что искомые значения , удовлетворяют соотношениям
Эту систему двух уравнений можно записать также в виде
Эта система является системой двух линейных уравнений с двумя неизвестными и может быть легко решена, например, методом подстановки. В результате получаем
(3.2)
Такое решение может существовать только при выполнении условия
что равносильно отличию от нуля определителя системы нормальных уравнений. Действительно, этот определитель равен
Последнее условие называется условием идентифицируемости модели наблюдений , и означает, что не все значения совпадают между собой. При нарушении этого условия все точки , лежат на одной вертикальной прямой
Оценки и называют оценками наименьших квадратов. Обратим еще раз внимание на полученное выражение для . Нетрудно видеть, что в это выражение входят уже знакомые нам суммы квадратов, участвовавшие ранее в определении выборочной дисперсии
Для двух переменных теоретический коэффициент корреляции определяется следующим образом:
.
где - дисперсии случайных переменных , а их ковариация.
Парный коэффициент корреляции является показателем тесноты связи лишь в случае линейной зависимости между переменными и обладает следующими основными свойствами:
Коэффициент корреляции принимает значение в интервале (-1,+1), или
|xy| < 1.
Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, т.е.
(?1X+?; ?2Y+?)= xy,
где ?1, ?2, - постоянные величины, причем ?1>0, ?2>0.
Случайные величины Х, Y, можно уменьшать (увеличивать) в ? раз, а также вычитать или прибавлять к значениям одно и тоже число ? - это не приведет к изменению коэффициента корреляции .
При = 1 случайные величинысвязаны линейной зависимостью, т.е.
.
При = 0 линейная корреляционная связь отсутствует.
В практических расчетах коэффициент корреляции генеральной совокупности обычно не известен. По результатам выборки может быть найдена его точечная оценка выборочный коэффициент корреляции r, так как выборочная совокупность переменных случайна, то в отличие от параметра , r случайная величина. Оценкой коэффициента корреляции является выборочный парный коэффициент корреляции:
= , (3.3)
Для оценки значимости коэффициента корреляции применяется t - критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:
(3.4)
Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы.
Если tнабл > tкр, то полученное значение коэффициента корреляции признается значимым (то есть нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимос?/p>