Регрессионный анализ

Курсовой проект - Математика и статистика

Другие курсовые по предмету Математика и статистика

делена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

Так, для коэффициента корреляции между капиталом и работающими активами получается:

Если сравнить полученное tрасч с критическим значением из таблицы Стьюдента, где ?=30, а ?=0,01 (tтабл=2,750), то полученное значение t-критерия будет больше табличного, что свидетельствует о значимости коэффициента корреляции и существенной связи между капиталом и работающими активами.

Таким образом, построенная регрессионная модель y=245,75+1,42x в целом адекватна, и выводы полученные по результатам малой выборки можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность. За это иногда зависимую переменную называют откликом. Теория регрессионных уравнений со случайными независимыми переменными сложнее, но известно, что, при большом числе наблюдений, использование метода разработанного корректно. Для получения оценок коэффициентов регрессии минимизируется сумма квадратов ошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи. Существует ли линейная регрессионная зависимость? Для проверки одновременного отличия всех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значений зависимой переменной относительно среднего. Его можно разложить на две суммы следующим образом. Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределение Фишера и, естественно, по этой статистике проверяют, являются ли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным, полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициента детерминации называется коэффициентом корреляции. Следует иметь в виду, что является смещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такой вывод.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Практическая часть

- уравнение регрессии.

x12345678910y1.351.096.463.155.807.28.078.128.9710.66

 

Приведем квадратное уравнение к линейной форме:

;

Запишем матрицу X.

 

Составим матрицу Фишера.

 

Система нормальных уравнений.

Решим ее методом Гаусса.

Уравнение регрессии имеет вид:

[7]

 

 

 

 

 

 

 

 

 

 

3.1. Оценка значимости коэффициентов регрессии.

Для проверки нулевой гипотезы используем критерий Стьюдента.

 

 

Коэффициенты значимые коэффициенты.[6]

 

 

 

 

 

 

 

 

3.2. Проверка адекватности модели по критерию Фишера.

гипотеза о равенстве математического ожидания отвергается. [4]

 

 

 

 

 

 

 

 

 

 

 

3.3. Проверка адекватности модели по коэффициенту детерминации или множественной корреляции.

Коэффициент детерминации :

- регрессионная модель адекватна.

Коэффициент множественной корреляции

Рассчитать и построить график уравнения прямолинейной регрессии для относительных значений PWC170 и времени челночного бега 3х10 м у 13 исследуемых и сделать вывод о точности расчета уравнений, если данные выборок таковы:

xi, кГ м/мин/кг ~ 15,6; 13,4; 17,9; 12,8; 10,7; 15,7; 11,7; 12,3; 12,3; 11,1; 14,3; 12,7; 14,4 yi, с ~ 6,9; 7,2; 7,1; 6,7; 7,6; 7,0; 6,4; 6,9; 7,7; 7,6; 7,9; 8,2; 6,8

Решение

1. Занести данные тестирования в рабочую таблицу и сделать соответствующие расчеты.

xixi - (xi - )2yiyi (yi )2(xi - )(yi ) 15.62.14.416.9-0.30.09-0.6313.4-0.10.017.200017.94.419.367.1-0.10.01-0.4412.8-0.70.496.7-0.50.250.3510.7-2.87.847.60.40.16-1.1215.72.24.847.0-0.20.04-0.4411.7-1.83.246.4-0.80.641.4412.3-1.21.446.9-0.30.090.3612.3-1.21.447.70.50.25-0.6011.1-2.45.767.60.40.16-0.9614.30.80.647.90.70.490.5612.7-0.80.648.211-0.8014.40.90.816.8-0.40.16-0.36= 13.5=50,92= 7,2=3,34= -2,64

1. Рассчитать значение нормированного коэффициента корреляции по формуле:

2. Рассчитать конечный вид уравнений прямолинейной регрессии по формулам (2) и (3):

(2)
(3)

Т.е.

4. Рассчитать абсолютные погрешности уравнений регрессии по формулам (4) и (5):

5. Рассчитать относительные погрешности уравнений регрессии по формулам (6) и (7):


6. Для графического представления корреляционной зависимости между признаками рассчитать координаты линий регрессии, подставив в конечный вид уравнений (1) и (2) данные любого исследуемого (например, четвертого из списка).
Тогда:

при х = 12,8 кГм/мин/кг у =7,235 с 7,2 с;

при у = 6,7 с х = 13,895 с 13,9 кГм/мин/кг.

7. Представить графически данное уравнение регрессии.

8. На основании произведенных расчетов и графического изображения уравнения регрессии сделать вывод.

Вывод:
1) в исследуемой группе наблюдается недостоверная обратная взаимосвязь между данными относительных значений PWC170 и времени челночного бега 3х10 м, т.к. rху = -0,20 < rst = 0,55 для К= 11 при ?= 95%;
2) относительная погрешность функции ух = 7,875 0,05х меньше (7,22%), а, следовательно, прогноз результата в челночном беге по дан?/p>