Анализ данных в линейной регрессионной модели

Контрольная работа - Экономика

Другие контрольные работы по предмету Экономика

Государственное образовательное учреждение высшего профессионального образования

Московский государственный институт электронной технки

(технический универститет)

 

 

 

 

 

 

 

 

 

Курсовая работа

по дисциплине

Теория вероятности и математическая статистика

Тема работы

Анализ данных в линейной регрессионной модели

 

 

Выполнил:

Студент группы ЭКТ-21

Рыжов С.А.

Проверил:

Преподаватель

Бардушкина И. В.

 

 

Москва - 2010

Вариант 20.

 

Задание 1

 

Выполнить предварительную обработку результатов наблюдений, включающую:

  1. построение диаграммы рассеивания (корреляционного поля);
  2. группировку данных и построение корреляционной таблицы;
  3. оценку числовых характеристик для негруппированных и группированных данных.

 

Оценка числовых характеристик для негруппированных данных:

XYXY4,199,194,449,133,0411,9411,314,584,68,097,573,149,8310,331,6214,618,667,155,716,481,312,3411,066,784,2216,3510,352,155,117,72,469,669,855,641,0211,198,84,525,777,7712,174,528,634,0511,252,066,914,765,737,413,568,544,0510,519,472,225,419,976,163,721,2814,688,263,571,679,676,714,3211,993,314,9510,647,665,933,3710,735,179,871,5310,133,2611,529,544,9512,582,883,115,388,343,575,095,795,794,3911,083,873,429,718,74-2,23Сумма X317.78Сумма Y369,18MX6,3556MY7,3836s2X11,02005s2Y15,31479KXY-9,1594?XY-0,7194

Числовые характеристики для негруппированной выборки находятся по следующим формулам:

 

, ;

;

;

;

;

 

Построение корреляционного поля:

 

Построение корреляционной таблицы:

Таблица 1.1

Y

X-1.51.54.57.510.513.516.5ni.2.50011830135.50045611178.511811001211.503410008nj.14178154150

Оценка числовых характеристик для группированных данных:

 

, ;

, ;

;

;

,;

;

;

 

= - 0.87

 

Задание 2

 

Для негруппированных данных проверить гипотезу об отсуствии линейной статистической связи между компонентами X и Y при альтернативной гипотезе ( уровень значимости ? = 0,05);

Выборочное значение статистики равно

 

,

 

Используя средства Matlab, найдем

 

Так как выборочное значение статистики больше квантили распределения Стьюдента, гипотеза H0 отклоняется в сторону гипотезы H1. Корреляция значима.

 

Задание 3

 

Для негруппированых данных получить интервальную оценку для истинного значения коэффициента корреляции ?X,Y, при уровне значимости ? = 0,05.

Используя средства Matlab, найдем

 

,

,

 

 

Задание 4

 

Для негруппированных и группированных данных составить уравнения регрессии Y на x и X на Y.

Рассмотрим вначале случай негруппированных данных.

Этот интервал не содержит нуля, т.е. с доверительной вероятностью 1 ЫВА = 0,95 существует корреляция между X и Y и имеет смысл построение уравнений регрессии.

,

y(x) = 12,77 0,848*x;

x(y) = 10,86 0,6*y;

 

Проверка.

 

, .

, ;

,

, ;

 

Случай группированных данных.

Подставим найденные значения в уравнеиня линейной регрессии Y на x и X на y. Получим:

 

y(x) = 17,14 1,4*x;

x(y) = 10,83 0,54*y;

 

Проверка:

 

Задание 5

 

Для негруппированных данных нанести графики выборочных регрессионных прямых на диаграмму рассеивания.

 

Задание 6

 

Для негруппированных данных по найденным оценкам параметров линейной регрессии Y на x получить оценку s2 для дисперсии ошибок наблюдений ?2, найти коэффициент детерминации R2, построить доверительные интервалы для параметров регрессии a и b, дисперсии ошибок наблюдений ?2 и среднего значения Y при x = x0 .

Для негруппированных данных были получены следующие оценки числовых характеристик и коэффициентов регрессии: , , , , , , , .

Используя соотношение , вычислим остаточную сумму

 

;

;

;

.

;

 

Тогда оценка дисперсии ошибок наблюдений равна

 

.

 

Коэффициент детерминации равен

 

.

 

Поскольку (знак ), то сделаем проверку правильности расчетов:

(верно).

Полученный результат для коэффициента детерминации означает, что уравнение регрессии на 49,7% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой .

Построим доверительные интервалы для параметров линейной регрессии и дисперсии ошибок наблюдений.

С помощью Matlab найдем квантили распределений Стьюдента и :

, , ;

доверительный интервал для параметра :

;

;

 

доверительный интервал для параметра :

 

;

;

 

доверительный интервал для дисперсии ошибок наблюдений :

 

;

.

 

-Найдем границы доверительных интервалов для среднего значения при :

 

;

.

 

Задание 7. Для негруппированных данных проверить значимость линейной регрессии Y на x (уровень значимости ? = 0,05).

Гипотеза : отклоняется на уровне значимости , так как доверительный интервал не накрывает нуль с доверительной вероятностью 0,95.

Этот же результат можно получить, используя для проверки гипотезу : и статистику .

С помощью Matlab найдем квантили распределения Фишера:

, .

Выборочное значение статистики равно:

.

Поскольку , то гипотеза : отклоняется на уровне значимости . Таким образом, линейная регрессия