Задача 1.
1.1 Выяснить, существует ли связь между потреблением дизельного топлива (y) и объёмом валовой продукции (). (Для этого построить поле рассеяния. На основе его визуального анализа выдвинуть гипотезу о виде статистической зависимости y от ). Найти точечные оценки неизвестных параметров модели. Выяснить, существует ли связь между потреблением дизельного топлива (y) и объёмом капитальных вложений (). Найти оценки неизвестных параметров модели.
Годы
Валовая продукция промышленности
( млрд. р.)
Объём капитальных вложений
( млрд. р.)
Объём потребления дизельного топлива
(y млн. т.)
1985
4.3
3
0.8
1986
4.1
2.8
1
1987
3.7
2.7
0.9
1988
3.9
2.5
0.7
1989
4.2
2.7
0.9
1990
4.3
3
1
1991
3.8
2.5
1.2
1992
4.2
3.4
1.1
1993
5.1
4.2
1.3
1994
5.2
4.8
1.5
1995
5.6
4.4
1.4
1996
5.1
4.2
1
1997
5.4
4
1
1998
5.5
4.8
1.7
1999
5.5
4.4
1.6
2000
5.4
5.1
1.5
Решение: По исходным данным построим поля рассеяния переменной у в зависимости от и , нанесем линии тренда и эллипсы рассеяния
Вид полей и эллипсов рассеивания позволяют выдвинуть гипотезу о том, что зависимость потребления дизельного топлива (y) от объёмов продукции () описывается линейной моделью вида:
где и - неизвестные постоянные коэффициенты, а e – случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.
Аналогично, между y и зависимость описывается моделью:
Найдем уравнения линейной регрессии
и
неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):
.
.
Найдет сначала коэффициенты первого уравнения. Вычисления поясним с помощью таблицы:
y
1
4.3
3
0.8
18.49
9
3.44
2.4
12.9
0.64
2
4.1
2.8
1
16.81
7.84
4.1
2.8
11.48
1
3
3.7
2.7
0.9
13.69
7.29
3.33
2.43
9.99
0.81
4
3.9
2.5
0.7
15.21
6.25
2.73
1.75
9.75
0.49
5
4.2
2.7
0.9
17.64
7.29
3.78
2.43
11.34
0.81
6
4.3
3
1
18.49
9
4.3
3
12.9
1
7
3.8
2.5
1.2
14.44
6.25
4.56
3
9.5
1.44
8
4.2
3.4
1.1
17.64
11.56
4.62
3.74
14.28
1.21
9
5.1
4.2
1.3
26.01
17.64
6.63
5.46
21.42
1.69
10
5.2
4.8
1.5
27.04
23.04
7.8
7.2
24.96
2.25
11
5.6
4.4
1.4
31.36
19.36
7.84
6.16
24.64
1.96
12
5.1
4.2
1
26.01
17.64
5.1
4.2
21.42
1
13
5.4
4
1
29.16
16
5.4
4
21.6
1
14
5.5
4.8
1.7
30.25
23.04
9.35
8.16
26.4
2.89
15
5.5
4.4
1.6
30.25
19.36
8.8
7.04
24.2
2.56
16
5.4
5.1
1.5
29.16
26.01
8.1
7.65
27.54
2.25
сумма
75.3
58.5
18.6
361.65
226.57
89.88
71.42
284.32
23
n=16,
Тогда = 0.3224
Таким образом,
Аналогично находятся оценки коэффициентов модели
а именно,
1.2. По найденным в п. 1.1. уравнениям регрессии построить доверительные интервалы потребления дизельного топлива, соответствующие вероятности 0,9 при следующих значениях независимой переменной: Построить доверительную полосу для уравнения регрессии. Изобразить на графике поля рассеяния, прямые регрессии и доверительные полосы.
Решение.
Доверительные интервалы среднего потребления дизельного топлива для уравнения парной линейной регрессии находятся по формуле
где соответственно верхняя и нижняя границы доверительного интервала; значение независимой переменной для которого определяется доверительный интервал, квантиль распределения Стьюдента, доверительная вероятность, (n-2) – число степеней свободы;
, ,
Сначала рассмотрим уравнение . По условию задачи число степеней свободы 16 тогда, по таблице распределения Стьюдента находим t0.90 = 1.76.
Поясним вычисления с помощью таблицы:
i
1
3.65618
0.5718
0.2875