Анализ данных в линейной регрессионной модели
Контрольная работа - Экономика
Другие контрольные работы по предмету Экономика
Государственное образовательное учреждение высшего профессионального образования
Московский государственный институт электронной технки
(технический универститет)
Курсовая работа
по дисциплине
Теория вероятности и математическая статистика
Тема работы
Анализ данных в линейной регрессионной модели
Выполнил:
Студент группы ЭКТ-21
Рыжов С.А.
Проверил:
Преподаватель
Бардушкина И. В.
Москва - 2010
Вариант 20.
Задание 1
Выполнить предварительную обработку результатов наблюдений, включающую:
- построение диаграммы рассеивания (корреляционного поля);
- группировку данных и построение корреляционной таблицы;
- оценку числовых характеристик для негруппированных и группированных данных.
Оценка числовых характеристик для негруппированных данных:
XYXY4,199,194,449,133,0411,9411,314,584,68,097,573,149,8310,331,6214,618,667,155,716,481,312,3411,066,784,2216,3510,352,155,117,72,469,669,855,641,0211,198,84,525,777,7712,174,528,634,0511,252,066,914,765,737,413,568,544,0510,519,472,225,419,976,163,721,2814,688,263,571,679,676,714,3211,993,314,9510,647,665,933,3710,735,179,871,5310,133,2611,529,544,9512,582,883,115,388,343,575,095,795,794,3911,083,873,429,718,74-2,23Сумма X317.78Сумма Y369,18MX6,3556MY7,3836s2X11,02005s2Y15,31479KXY-9,1594?XY-0,7194
Числовые характеристики для негруппированной выборки находятся по следующим формулам:
, ;
;
;
;
;
Построение корреляционного поля:
Построение корреляционной таблицы:
Таблица 1.1
Y
X-1.51.54.57.510.513.516.5ni.2.50011830135.50045611178.511811001211.503410008nj.14178154150
Оценка числовых характеристик для группированных данных:
, ;
, ;
;
;
,;
;
;
= - 0.87
Задание 2
Для негруппированных данных проверить гипотезу об отсуствии линейной статистической связи между компонентами X и Y при альтернативной гипотезе ( уровень значимости ? = 0,05);
Выборочное значение статистики равно
,
Используя средства Matlab, найдем
Так как выборочное значение статистики больше квантили распределения Стьюдента, гипотеза H0 отклоняется в сторону гипотезы H1. Корреляция значима.
Задание 3
Для негруппированых данных получить интервальную оценку для истинного значения коэффициента корреляции ?X,Y, при уровне значимости ? = 0,05.
Используя средства Matlab, найдем
,
,
Задание 4
Для негруппированных и группированных данных составить уравнения регрессии Y на x и X на Y.
Рассмотрим вначале случай негруппированных данных.
Этот интервал не содержит нуля, т.е. с доверительной вероятностью 1 ЫВА = 0,95 существует корреляция между X и Y и имеет смысл построение уравнений регрессии.
,
y(x) = 12,77 0,848*x;
x(y) = 10,86 0,6*y;
Проверка.
, .
, ;
,
, ;
Случай группированных данных.
Подставим найденные значения в уравнеиня линейной регрессии Y на x и X на y. Получим:
y(x) = 17,14 1,4*x;
x(y) = 10,83 0,54*y;
Проверка:
Задание 5
Для негруппированных данных нанести графики выборочных регрессионных прямых на диаграмму рассеивания.
Задание 6
Для негруппированных данных по найденным оценкам параметров линейной регрессии Y на x получить оценку s2 для дисперсии ошибок наблюдений ?2, найти коэффициент детерминации R2, построить доверительные интервалы для параметров регрессии a и b, дисперсии ошибок наблюдений ?2 и среднего значения Y при x = x0 .
Для негруппированных данных были получены следующие оценки числовых характеристик и коэффициентов регрессии: , , , , , , , .
Используя соотношение , вычислим остаточную сумму
;
;
;
.
;
Тогда оценка дисперсии ошибок наблюдений равна
.
Коэффициент детерминации равен
.
Поскольку (знак ), то сделаем проверку правильности расчетов:
(верно).
Полученный результат для коэффициента детерминации означает, что уравнение регрессии на 49,7% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой .
Построим доверительные интервалы для параметров линейной регрессии и дисперсии ошибок наблюдений.
С помощью Matlab найдем квантили распределений Стьюдента и :
, , ;
доверительный интервал для параметра :
;
;
доверительный интервал для параметра :
;
;
доверительный интервал для дисперсии ошибок наблюдений :
;
.
-Найдем границы доверительных интервалов для среднего значения при :
;
.
Задание 7. Для негруппированных данных проверить значимость линейной регрессии Y на x (уровень значимости ? = 0,05).
Гипотеза : отклоняется на уровне значимости , так как доверительный интервал не накрывает нуль с доверительной вероятностью 0,95.
Этот же результат можно получить, используя для проверки гипотезу : и статистику .
С помощью Matlab найдем квантили распределения Фишера:
, .
Выборочное значение статистики равно:
.
Поскольку , то гипотеза : отклоняется на уровне значимости . Таким образом, линейная регрессия