Исследование регрессии на основе численных данных

Курсовой проект - Математика и статистика

Другие курсовые по предмету Математика и статистика

Федеральное агентство по образованию

Государственное образовательное

учреждение высшего профессионального образования

Новгородский Государственный университет

Имени Ярослава Мудрого.

Кафедра Прикладная математика и информатика.

 

 

 

 

 

 

 

 

 

 

 

Курсовая работа по дисциплине

Математическая статистика

на тему:

“Исследование регрессии на основе численных данных”

 

 

 

 

 

 

Преподаватель:

Токмачев М.С.

Студент группы № 3311

Jannat

 

 

 

 

 

 


 

Новгород Великий

2005

ПЛАН

Теоретическая часть

1. Понятие регрессии

2. Постоянная и случайная составляющие случайной переменой

3. Модель парной линейной регрессии

4. Регрессия по методу наименьших квадратов

5. Качество оценки: коэффициент R

6. Точность коэффициентов регрессии

7. Доверительные интервалы

8. F-статистика

Практическая часть

I. Исследование регрессии при выборке из генеральной совокупности N(0;1)

II. Исследование регрессии при выборке из генеральной совокупности N(0;0,5)

III. Исследование регрессии при выборке из генеральной совокупности N(0;2)

Заключение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теоретическая часть

 

1. Понятие регрессии

Условное математическое ожидание M(Y|X=x) случайной переменной Y, рассматриваемое как функция x, т.е. M(Y|X=x)=f(x), называется функцией регрессии случайной переменной Y относительно X (или функцией регрессии Y по X). Точно также условное математическое ожидание M(X|Y=y), случайной переменной X, т.е. M(X|Y=y)=f(x), называется функцией регрессии случайной переменной X относительно Y (или функцией регрессии X по Y).

Функции регрессии выражают математическое ожидание переменной Y (или X) для случая, когда другая переменная принимает определённое числовое значение, или, иначе говоря, функция M(Y|X=x) показывает, каково будет в среднем значение случайной переменной Y, если переменная X принимает значение x. Всё сказанное справедливо и для функции M(X|Y=y).

Становится очевидным, что функция регрессии имеет важное значение при статистическом анализе зависимостей между переменными и может быть использована для прогнозирования одной из случайных переменных, если известно значение другой случайной переменной. Точность такого прогноза определяется дисперсией условного распределения.

Несмотря на важность понятия функции регрессии, возможности её практического применения весьма ограничены. Для оценки функции регрессии необходимо знать аналитический вид двумерного распределения (X,Y). Только зная вид этого распределения, можно точно определить вид функции регрессии, а затем оценить его параметры. Однако для подобной оценки мы чаще всего располагаем лишь выборкой ограниченного объёма, по которой нужно найти вид двумерного распределения (X,Y), а затем вид функции регрессии. Это может привести к значительным ошибкам, т.к. одну и ту же совокупность точек (xi,yi) на плоскости можно одинаково успешно описать с помощью различных функций.

Для характеристики формы связи при изучении корреляционной зависимости пользуются понятием кривой регрессии. Кривой регрессии Y по X (или Y по X) называется условное среднее значение случайной переменной Y (Х), рассматриваемой как функция от x (у). Эта функция обладает одним замечательным свойством: она даёт наименьшую среднюю погрешность оценки прогноза.

 

2. Постоянная и случайная составляющие случайной переменой

Часто вместо рассмотрения случайной величины как единого целого можно и удобно разбить ее на постоянную и чисто случайную составляющие, где постоянная составляющая всегда есть ее математическое ожидание. Если x случайная переменная и - ее математическое ожидание, то декомпозиция случайной величины записывается следующим образом:

x= +u,

где u чисто случайная составляющая (в регрессионном анализе она обычно представлена случайным членом)

 

3. Модель парной линейной регрессии

Коэффициент корреляции показывает, что две переменные связаны друг с другом, однако не дает представления о том, каким образом они связаны.

Рассмотрим простейшую модель: y=x+u

Величина y рассматривается как зависимая переменная, состоящая из:

  1. неслучайной составляющей x, где x выступает как объясняющая (или независимая) переменная, а постоянные величины и - как параметры уравнения
  2. случайного члена u

На графиках подбора в проделанной работе мы видим Y предсказанное (¦) и Y полученное. На них показано, как комбинация этих двух составляющих определяет величину Y. Показатели Xi это гипотетические значения объясняющей переменной. Если бы соотношение между Y и X было точным, то соответствующие значения Y были бы представлены Y предсказанное (¦). Наличие случайного члена приводит к тому, что в действительности значение Y получается другим.

Задача регрессионного анализа состоит в получении оценок и и, следовательно, в определении положения прямой по точкам.

Очевидно, что чем меньше значения u, тем легче эта задача. Действительно, если бы случайный член от?/p>