Задача 1.
1.1 Выяснить, существует ли связь между потреблением дизельного топлива (y) и объёмом валовой продукции (). (Для этого построить поле рассеяния. На основе его визуального анализа выдвинуть гипотезу о виде статистической зависимости y от ). Найти точечные оценки неизвестных параметров модели. Выяснить, существует ли связь между потреблением дизельного топлива (y) и объёмом капитальных вложений (). Найти оценки неизвестных параметров модели.
Годы
Валовая продукция промышленности
( млрд. р.)
Объём капитальных вложений
( млрд. р.)
Объём потребления дизельного топлива
(y млн. т.)
1985
4.3
3.6
2.9
1986
3.3
3.5
2.6
1987
2.9
3.3
2.6
1988
3.1
3.2
2.7
1989
3.3
3.3
3
1990
3.5
3.6
3.2
1991
3.6
3.8
3.5
1992
3.9
4.1
3.4
1993
4.3
4.4
3.7
1994
4.4
4.5
4
1995
4.8
4.3
3.8
1996
4.3
4.2
3.2
1997
4.5
4.6
4
1998
4.7
4.5
4.3
1999
4.7
4.5
4.1
2000
4.6
4.7
4
Решение: По исходным данным построим поля рассеяния переменной у в зависимости от и , нанесем линии тренда и эллипсы рассеяния
Вид полей и эллипсов рассеивания позволяют выдвинуть гипотезу о том, что зависимость потребления дизельного топлива (y) от объёмов продукции () описывается линейной моделью вида:
где и - неизвестные постоянные коэффициенты, а e – случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.
Аналогично, между y и зависимость описывается моделью:
Найдем уравнения линейной регрессии
и
неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):
.
.
Найдет сначала коэффициенты первого уравнения. Вычисления поясним с помощью таблицы:
y
1
4,3
3,6
2,9
18,49
12,96
12,47
10,44
15,48
8,41
2
3,3
3,5
2,6
10,89
12,25
8,58
9,1
11,55
6,76
3
2,9
3,3
2,6
8,41
10,89
7,54
8,58
9,57
6,76
4
3,1
3,2
2,7
9,61
10,24
8,37
8,64
9,92
7,29
5
3,3
3,3
3
10,89
10,89
9,9
9,9
10,89
9
6
3,5
3,6
3,2
12,25
12,96
11,2
11,52
12,6
10,24
7
3,6
3,8
3,5
12,96
14,44
12,6
13,3
13,68
12,25
8
3,9
4,1
3,4
15,21
16,81
13,26
13,94
15,99
11,56
9
4,3
4,4
3,7
18,49
19,36
15,91
16,28
18,92
13,69
10
4,4
4,5
4
19,36
20,25
17,6
18
19,8
16
11
4,8
4,3
3,8
23,04
18,49
18,24
16,34
20,64
14,44
12
4,3
4,2
3,2
18,49
17,64
13,76
13,44
18,06
10,24
13
4,5
4,6
4
20,25
21,16
18
18,4
20,7
16
14
4,7
4,5
4,3
22,09
20,25
20,21
19,35
21,15
18,49
15
4,7
4,5
4,1
22,09
20,25
19,27
18,45
21,15
16,81
16
4,6
4,7
4
21,16
22,09
18,4
18,8
21,62
16
сумма
64,2
64,1
55
263,68
260,93
225,31
224,48
261,72
193,94
Средние
4,0125
4,0063
3,4375
n=16,
Тогда
Таким образом,
Аналогично находятся оценки коэффициентов модели
а именно,
1.2. По найденным в п. 1.1. уравнениям регрессии построить доверительные интервалы потребления дизельного топлива, соответствующие вероятности 0,9 при следующих значениях независимой переменной: Построить доверительную полосу для уравнения регрессии. Изобразить на графике поля рассеяния, прямые регрессии и доверительные полосы.
Решение.
Доверительные интервалы среднего потребления дизельного топлива для уравнения парной линейной регрессии находятся по формуле
где соответственно верхняя и нижняя границы доверительного интервала; значение независимой переменной для которого определяется доверительный интервал, квантиль распределения Стьюдента, доверительная вероятность, (n-2) – число степеней свободы;
, ,
Сначала рассмотрим уравнение . По условию задачи число степеней свободы 16 тогда, по таблице распределения Стьюдента находим t0.90 = 1.76.
Поясним вычисления с помощью таблицы:
i