Задача 1. В таблице 1 приведены следующие данные: единичная стоимость процесса добычи нефти и газа (Y), процент жидкости в добываемом из скважины газе (X) для различных месторождений.

1. В рамках линейной модели найдите регрессионную зависимость Y от Х.

2. Вычислите коэффициент корреляции между Х и Y.

3. Определите значимость регрессии для a = 0,05.

4. Найдите 95% доверительные интервалы для параметров модели.

5. Найдите интервал, в котором с вероятностью 0,95 находится значение единичной стоимости добычи газа при наличии 25% жидкости.

6. Вычислите коэффициент детерминации R2.

Исходные данные:

Х

Y

13.1

3.4

16.7

5.1

19.6

4.7

23.3

6.7

26.1

6.2

30.2

9.1

42.9

8.3


Решение:

1. Вычислим параметры уравнения линейной регрессии по формулам:

; .

Для этого организуем вычисления во вспомогательной таблице:


Номер

Х

Y

X2

Y2

XY

1

13.1

3.4

171.61

11.56

44.54

2

16.7

5.1

278.89

26.01

85.17

3

19.6

4.7

384.16

22.09

92.12

4

23.3

6.7

542.89

44.89

156.11

5

26.1

6.2

681.21

38.44

161.82

6

30.2

9.1

912.04

82.81

274.82

7

42.9

8.3

1840.41

68.89

356.07

Сумма

171.9

43.5

4811.21

294.69

1170.65

Среднее

24.6

6.2

687.3

42.1

167.2


Тогда

;

.

Значит, уравнение линейной регрессии имеет вид

.


2. Вычислим коэффициент корреляции по формуле:

.

Для применения формулы составим вспомогательную таблицу:

Номер

Х

Y


2


1

13.1

3.4

-11.5

132.25

-2.8

7.84

2

16.7

5.1

-7.9

62.41

-1.1

1.21

3

19.6

4.7

-5

25

-1.5

2.25

4

23.3

6.7

-1.3

1.69

0.5

0.25

5

26.1

6.2

1.5

2.25

0

0

6

30.2

9.1

5.6

31.36

2.9

8.41

7

42.9

8.3

18.3

334.89

2.1

4.41

Сумма

171.9

43.5

 

589.85

 

24.37


Тогда коэффициент корреляции найдется следующим образом:

.


3. Определим значимость регрессии для a = 0,05, проверив гипотезу Н0: «b=0», рассчитав статистику:

.

По таблице F-статистики найдем критическое значение этого критерия:

.

Т.к. F>fкр, то гипотезу Н0: «b=0» отвергаем, т.е. регрессия значима.


4. Найдем 95%-ные доверительные интервалы для параметров модели. Для этого вначале найдем параметры распределения Стьюдента, оформив вспомогательную таблицу:

Номер

Х

Y


1

13.1

3.4

8.506

-5.106

26.07

-2.306

5.32

2

16.7

5.1

11.602

-6.502

42.28

-5.402

29.18

3

19.6

4.7

14.096

-9.396

88.28

-7.896

62.35

4

23.3

6.7

17.278

-10.578

111.89

-11.08

122.72

5

26.1

6.2

19.686

-13.486

181.87

-13.49

181.87

6

30.2

9.1

23.212

-14.112

199.15

-17.01

289.41

7

42.9

8.3

34.134

-25.834

667.40

-27.93

780.31

Сумма

171.9

43.5

128.514

 

1316.94

 

1471.16

Среднее

24.6

6.2

18.35914

 

188.13

 

210.17


Параметры двустороннего распределения Стьюдента:

; .

Тогда, по таблице значений критерия Стьюдента, .

Тогда искомые доверительные интервалы:

Для коэффициента а: .

Для коэффициента b: .


5. Прогнозное значение .

При этом доверительный интервал для прогноза y(x) определяется границами:

, т.е. .


6. Коэффициент детерминации

.


Задача 2. Пусть b – оценка коэффициента наклона в регрессии Y на Х, а g – оценка коэффициента наклона в регрессии Х на Y. Покажите, что b = 1/g