А. С. Гринберг О. Б. Плющ Б. В. Новыш Теория вероятностей и математическая статистика Курс лекций

Вид материалаКурс лекций

Содержание


Элементы теории корреляции
Выборочные уравнения регрессии
Линейная регрессия
Множественная линейная регрессия
Нелинейная регрессия
Логарифмическая модель
Обратная модель
Степенная модель
Показательная модель
Подобный материал:
1   ...   18   19   20   21   22   23   24   25   26

Элементы теории корреляции


Две (или несколько) случайных величин могут быть связаны либо функциональной, либо статистической зависимостью.

Строгая функциональная зависимость реализуется редко, так как случайные величины подвержены действию случайных факторов, причем среди них могут быть и общие для двух или нескольких величин. В этом случае возникает статистическая зависимость.

Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой – в этом случае статистическая зависимость называется корреляционной.

Пример корреляционной зависимости: урожай зерна Y зависит от количества внесенных удобрений X. С одинаковых по площади участков при равных количествах внесенных удобрений снимают разные урожаи. Это связано с влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, средний урожай зависит от количества удобрений, т.е. Y связано с X корреляционной зависимостью.

При рассмотрении взаимосвязей, как правило, рассматривают одну из величин как независимую (объясняющую), а другую как зависимую (объясняющую). При этом изменение первой из них может служить причиной изменения другой. Например, рост дохода ведет к увеличению потребления; рост цены – к снижению спроса; снижение процентной ставки увеличивает инвестиции и т.д. Подобная зависимость не является однозначной в том смысле, что каждому конкретному значению объясняющей переменой может соответствовать не одно, а множество значений из некоторой области. Другими словами, каждому конкретному значению X соответствует некоторое вероятностное распределение зависимой переменной. Поэтому анализируют, как объясняющая переменная (или переменные) влияет (или влияют) на зависимую переменную «в среднем». Зависимость такого типа, выражаемая соотношением:



называется функцией регрессии Y на X. При рассмотрении зависимости двух случайных величин говорят о парной регрессии.

Зависимость нескольких переменных, выражаемую функцией , называют множественной регрессией.

Под регрессией понимается функциональная зависимость между объясняющими переменными и условным математическим ожиданием (средним значением) зависимой переменной Y, которая строится с целью предсказания (прогнозирования) среднего значения Y при фиксированных значениях независимых переменных.

Так как реальные значения зависимой переменной не всегда совпадают с ее средним значением и могут быть различными при данном X (или ), зависимость должна быть дополнена некоторым слагаемым , которое, по существу, является случайной величиной. Получающиеся в результате соотношения:

или



называются регрессионными моделями (или уравнениями).

Решение задачи построения качественного уравнения регрессии, соответствующего эмпирическим данным и целям исследования, является достаточно сложным и многоступенчатым процессом. Его можно разбить на три этапа:
  • выбор формулы уравнения регрессии;
  • определение параметров выбранного уравнения;
  • анализ качества уравнения и проверка адекватности уравнения эмпирическим данным и, при необходимости, совершенствование уравнения.

Выборочные уравнения регрессии


Для определения значений теоретических коэффициентов, входящих в уравнения регрессии, вообще говоря, необходимо знать и использовать все значения переменных генеральной совокупности, что практически невозможно. В связи с этим по выборке ограниченного объема строится так называемое выборочное (эмпирическое) уравнение регрессии. В силу несовпадения статистической базы для генеральной совокупности и выборки оценки коэффициентов, входящих в уравнение регрессии, практически всегда отличаются от истинных (теоретических) значений, что приводит к несовпадению эмпирической и теоретической линий регрессии. Различные выборки из одной и той же генеральной совокупности обычно приводят к отличающимся друг от друга оценкам. Задача состоит в том, чтобы по конкретной выборке найти оценки неизвестных параметров так, чтобы построенная линия регрессии являлась бы наилучшей, среди всех других линий.

Линейная регрессия


Если функция регрессии линейна, то говорят о линейной регрессии. Линейная регрессия (линейное уравнение) является наиболее распространенным (и простым) видом зависимости между экономическими переменными. Для этого простейшего случая имеем:

или



Последнее соотношение называется теоретической линейной регрессионной моделью; коэффициенты – теоретическими параметрами регрессии; – случайным отклонением.

По выборке ограниченного объема строится выборочное уравнение регрессии:

, (1)

где – оценки неизвестных параметров , называемые выборочными (эмпирическими) коэффициентами регрессии, – оценка условного математического ожидания . Для величин справедлива формула:

, (2)

где отклонение – оценка теоретического отклонения .

Построенная прямая выборочной регрессии должна наилучшим образом описывать эмпирические данные, т.е. коэффициенты должны быть такими, чтобы случайные отклонения были минимальны. Наиболее распространенным методом нахождения коэффициентов уравнения регрессии является метод наименьших квадратов (МНК).

Если по выборке требуется определить оценки выборочного уравнения регрессии (2), то вводится в рассмотрение и минимизируется функция:

.

Необходимым условием существования минимума данной функции двух переменных является равенство нулю ее частных производных по неизвестным параметрам :



.

Отсюда:



,

выразив из последних соотношений коэффициенты, получим окончательно:

, (3)

где введены обозначения:

.

Множественная линейная регрессия


На любой экономический показатель, чаще всего, оказывает влияние не один, а несколько факторов. Например, спрос на некое благо определяется не только ценой данного блага, но и ценами на замещающие и дополняющие блага, доходом потребителей и многими другими факторами. В этом случае рассматривается множественная регрессия:

.

Теоретическое линейное уравнение регрессии имеет вид:

,

или для индивидуальных наблюдений :

.

Параметры регрессии могут быть найдены в случае, если . Самым распространенным методом оценки параметров уравнения множественной линейной регрессии также является метод наименьших квадратов.

Нелинейная регрессия


Многие экономические зависимости не являются линейными, и поэтому их моделирование линейными уравнениями регрессии не может дать положительного результата. Например, при анализе эластичности спроса по цене применяется так называемая логарифмическая модель, при анализе издержек от объема выпуска – полиномиальная (кубическая) модель. Достаточно широко применяются и многие другие модели – в частности, обратная и экспоненциальная модели. Кратко рассмотрим некоторые из моделей нелинейной регрессии.

Логарифмическая модель


Пусть некоторая экономическая зависимость моделируется формулой , где A,  – параметры модели. Эта функция может отражать зависимость спроса Y на благо от его цены X
(в этом случае 0) или от дохода X (0 – функция Энгеля). Прологарифмировав обе части последнего соотношения, получим , замена переменных вида позволяет формально свести уравнение к линейному виду:

.

По МНК можно рассчитать значения параметров аналогично случаю линейной модели (при этом вместо наблюдений рассматриваются наблюдения ).

Обратная модель


Обратная модель имеет вид .

Заменой эта модель сводится к линейной. Модель применяется, например, для характеристики связи удельных расходов сырья, материалов, топлива с объемом выпускаемой продукции. Кроме этого, классическим примером применения модели является кривая Филлипса, характеризующая нелинейное соотношение между нормой безработицы x и процентом прироста заработной платы y.

Степенная модель


Степенная функция вида при m=3 (кубическая функция) в микроэкономике моделирует зависимость общих издержек от объема выпуска; квадратичная функция (m=2) отражает зависимость между объемом выпуска и средними или предельными издержками (или между расходами на рекламу и прибылью). Модель может быть сведена к линейной модели множественной регрессии с помощью замены . Параметры модели ищут с помощью МНК.

Показательная модель


Показательная функция может использоваться при анализе изменения переменной Y с постоянным темпом прироста во времени. Например, производственная функция Кобба – Дугласа с учетом научно – технического прогресса:

.

Прологарифмировав, получаем соотношение:

,

которое сводится к линейному виду с помощью замен

.