А. С. Гринберг О. Б. Плющ Б. В. Новыш Теория вероятностей и математическая статистика Курс лекций
Вид материала | Курс лекций |
- Рабочая программа дисциплины "теория вероятностей и математическая статистика", 112.61kb.
- Конспект лекций по курсу "Теория вероятностей и математическая статистика", 1417.24kb.
- Рабочая учебная программа дисциплины (модуля) Теория вероятностей и математическая, 217.23kb.
- Примерная программа наименование дисциплины «теория вероятностей и математическая статистика», 165.37kb.
- Рабочая программа учебной дисциплины теория вероятностей и математическая статистика, 830.1kb.
- Рабочая программа учебной дисциплины «Теория вероятностей и математическая статистика», 165.42kb.
- Программа курса лекций "Теория вероятностей и математическая статистика", 18.69kb.
- Примерная рабочая программа по дисциплине: «теория вероятностей, математическая статистика, 83.07kb.
- Программа по дисциплине «Теория вероятностей и математическая статистика» для студентов, 206.05kb.
- Программа дисциплины «теория вероятностей и математическая статистика» Для направления, 198.58kb.
Элементы теории корреляции
Две (или несколько) случайных величин могут быть связаны либо функциональной, либо статистической зависимостью.
Строгая функциональная зависимость реализуется редко, так как случайные величины подвержены действию случайных факторов, причем среди них могут быть и общие для двух или нескольких величин. В этом случае возникает статистическая зависимость.
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой – в этом случае статистическая зависимость называется корреляционной.
Пример корреляционной зависимости: урожай зерна Y зависит от количества внесенных удобрений X. С одинаковых по площади участков при равных количествах внесенных удобрений снимают разные урожаи. Это связано с влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, средний урожай зависит от количества удобрений, т.е. Y связано с X корреляционной зависимостью.
При рассмотрении взаимосвязей, как правило, рассматривают одну из величин как независимую (объясняющую), а другую как зависимую (объясняющую). При этом изменение первой из них может служить причиной изменения другой. Например, рост дохода ведет к увеличению потребления; рост цены – к снижению спроса; снижение процентной ставки увеличивает инвестиции и т.д. Подобная зависимость не является однозначной в том смысле, что каждому конкретному значению объясняющей переменой может соответствовать не одно, а множество значений из некоторой области. Другими словами, каждому конкретному значению X соответствует некоторое вероятностное распределение зависимой переменной. Поэтому анализируют, как объясняющая переменная (или переменные) влияет (или влияют) на зависимую переменную «в среднем». Зависимость такого типа, выражаемая соотношением:

называется функцией регрессии Y на X. При рассмотрении зависимости двух случайных величин говорят о парной регрессии.
Зависимость нескольких переменных, выражаемую функцией

Под регрессией понимается функциональная зависимость между объясняющими переменными и условным математическим ожиданием (средним значением) зависимой переменной Y, которая строится с целью предсказания (прогнозирования) среднего значения Y при фиксированных значениях независимых переменных.
Так как реальные значения зависимой переменной не всегда совпадают с ее средним значением и могут быть различными при данном X (или



называются регрессионными моделями (или уравнениями).
Решение задачи построения качественного уравнения регрессии, соответствующего эмпирическим данным и целям исследования, является достаточно сложным и многоступенчатым процессом. Его можно разбить на три этапа:
- выбор формулы уравнения регрессии;
- определение параметров выбранного уравнения;
- анализ качества уравнения и проверка адекватности уравнения эмпирическим данным и, при необходимости, совершенствование уравнения.
Выборочные уравнения регрессии
Для определения значений теоретических коэффициентов, входящих в уравнения регрессии, вообще говоря, необходимо знать и использовать все значения переменных генеральной совокупности, что практически невозможно. В связи с этим по выборке ограниченного объема строится так называемое выборочное (эмпирическое) уравнение регрессии. В силу несовпадения статистической базы для генеральной совокупности и выборки оценки коэффициентов, входящих в уравнение регрессии, практически всегда отличаются от истинных (теоретических) значений, что приводит к несовпадению эмпирической и теоретической линий регрессии. Различные выборки из одной и той же генеральной совокупности обычно приводят к отличающимся друг от друга оценкам. Задача состоит в том, чтобы по конкретной выборке

Линейная регрессия
Если функция регрессии линейна, то говорят о линейной регрессии. Линейная регрессия (линейное уравнение) является наиболее распространенным (и простым) видом зависимости между экономическими переменными. Для этого простейшего случая имеем:


Последнее соотношение называется теоретической линейной регрессионной моделью; коэффициенты


По выборке ограниченного объема строится выборочное уравнение регрессии:

где






где отклонение


Построенная прямая выборочной регрессии должна наилучшим образом описывать эмпирические данные, т.е. коэффициенты


Если по выборке



Необходимым условием существования минимума данной функции двух переменных является равенство нулю ее частных производных по неизвестным параметрам



Отсюда:


выразив из последних соотношений коэффициенты, получим окончательно:


где введены обозначения:

Множественная линейная регрессия
На любой экономический показатель, чаще всего, оказывает влияние не один, а несколько факторов. Например, спрос на некое благо определяется не только ценой данного блага, но и ценами на замещающие и дополняющие блага, доходом потребителей и многими другими факторами. В этом случае рассматривается множественная регрессия:

Теоретическое линейное уравнение регрессии имеет вид:

или для индивидуальных наблюдений


Параметры регрессии могут быть найдены в случае, если

Нелинейная регрессия
Многие экономические зависимости не являются линейными, и поэтому их моделирование линейными уравнениями регрессии не может дать положительного результата. Например, при анализе эластичности спроса по цене применяется так называемая логарифмическая модель, при анализе издержек от объема выпуска – полиномиальная (кубическая) модель. Достаточно широко применяются и многие другие модели – в частности, обратная и экспоненциальная модели. Кратко рассмотрим некоторые из моделей нелинейной регрессии.
Логарифмическая модель
Пусть некоторая экономическая зависимость моделируется формулой

(в этом случае 0) или от дохода X (0 – функция Энгеля). Прологарифмировав обе части последнего соотношения, получим



По МНК можно рассчитать значения параметров аналогично случаю линейной модели (при этом вместо наблюдений


Обратная модель
Обратная модель имеет вид

Заменой

Степенная модель
Степенная функция вида


Показательная модель
Показательная функция


Прологарифмировав, получаем соотношение:

которое сводится к линейному виду с помощью замен
