По данным наблюдения провести корреляционно-регрессионный анализ (кра) зависимости количества туристов, привлеченных тур фирмой «Лагуна», от затрат фирмы на рекламу (в месяц)

Вид материалаДокументы

Содержание


Данная оценка дает возможность распространить выводы по результатам выборки на всю генеральную совокупность.
Средняя квадратическая ошибка уравнения S
Подобный материал:
По данным наблюдения провести корреляционно-регрессионный анализ (КРА) зависимости количества туристов, привлеченных тур. фирмой «Лагуна», от затрат фирмы на рекламу (в месяц). Модель считать линейной. Х- затраты на рекламу, тыс. руб. У – количество туристов. Провести оценку надёжности и доказать обоснованность выбора линейной функции в качестве уравнения регрессии. Выполнить прогноз результативного признака по полученному уравнению регрессии.

Х

59

95

110

119

124

45

50

78

65

115

129

102

У

970

920

960

989

1225

920

950

810

840

1025

1279

920


Обратите внимание: теоретические значения результативного признака округлялись до целого значения в силу неделимости единицы измерения. В противном случаи, все расчеты необходимо проводить с точностью округления до четырёх знаком после запятой.

В ходе решения задачи составляется и заполняется расчетная таблица вида:




45

50

59

65

78

95

102

110

115

119

124

129

1091



920

950

970

840

810

920

920

960

1025

989

1225

1279

11808



849

863

890

908

946

996

1017

1040

1055

1067

1082

1096

11809



0,16

0,17

0,2

0,21

0,24

0,28

0,3

0,31

0,32

0,33

0,34

0,35

 



1,875

1,7314

1,4885

1,3422

1,095

1,0099

1,0708

1,1977

1,3008

1,3932

1,5185

1,6524

 



134,7054

124,3888

106,9382

96,4275

78,668

72,5541

76,9294

86,0462

93,4533

100,0915

109,0935

118,7132

 



714

739

783

812

867

923

940

954

962

967

973

977

 



984

987

997

1004

1025

1069

1094

1126

1148

1167

1191

1215

 



  1. В прямоугольной системе координат строится эмпирическая линия зависимости. Для чего отмечаем точки с координатами , затем соединяем их отрезками. Получаем ломаную, которая и будет являться эмпирической линией зависимости.



  1. Вычислить линейный коэффициент корреляции по формуле .


Вычислим промежуточные значения:



Тогда линейный коэффициент корреляции . Значение коэффициента указывает на умеренную связь прямого направления между изучаемыми признаками, т.е. с увеличением затрат на рекламу растет число привлеченных туристов.


  1. Определим уровень значимости линейного коэффициента корреляции.

Оценка значимости линейного коэффициента корреляции основана на сопоставлении абсолютного значения самого коэффициента с его средней квадратической ошибкой . Коэффициент корреляции считается значимым, если его абсолютное значение более чем в три раза превышает свою среднюю квадратическую ошибку: т.е. .

В зависимости от числа наблюдений n различают следующие методы расчета средней квадратической ошибки:

1. если число наблюдений велико (), то ;

2. при небольшом числе наблюдений ( ) .

Получается, что при . Тогда, уровень значимости . Это указывает на наличие других факторов, неучтенных в модели, оказывающих более весомое влияние на результативный признак.

  1. Составим математическую модель зависимости – уравнение регрессии.

Линейная модель описывается уравнением регрессии вида . Коэффициенты уравнения a и b определяются решением системы 

Составим систему и найдем её решение:  . Получаем ; b = 2,9495.

Уравнение регрессии имеет вид у = 715,8402 + 2,9495х.

Полученный коэффициент регрессии b = 2,9495 показывает, что при увеличении затрат на рекламу на 1 тысячу рублей, число вновь привлеченных туристов увеличилось на 3 человека.
  1. По полученной модели рассчитаем теоретические значения результативного признака (заполняется строка в расчетной таблице). Для чего в уравнение регрессии подставляются значения факторного признака  и рассчитываются соответствующие значения результативного признака.
  2. Коэффициент регрессии применяют для определения коэффициента эластичности Эi, который показывает, на сколько процентов изменится величина результативного признака у при изменении признака – фактора на один процент.

Понятие эластичности функции дается в математическом анализе. Эластичность функции – это предел отношения относительного приращения функции у к относительному приращению аргумента х при :

.

Исходя из определения, коэффициент эластичности линейной функции определяется формулой  . Видно, что это переменный коэффициент, поскольку его значение зависит от значения признака-фактора.

Согласно указанной формулы рассчитываются коэффициенты эластичности и заполняется строка расчетной таблицы.

Так, для факторного признака х = 78тыс.руб. коэффициент эластичности Э = 0,24%. Это означает, что при увеличении затрат на рекламу на 1% ( с 78 тыс. руб. до 78,78 тыс.руб.) число вновь привлеченных туристов возрастает на 0,24% ( с 946 чел. до 948 чел., т.е. на два человека)
  1. Далее проводится оценка существенности линейного коэффициента корреляции (через распределение Стьюдента).



  • Данная оценка дает возможность распространить выводы по результатам выборки на всю генеральную совокупность.


✔ Вычисляется показатель , где

r – линейный коэффициент корреляции,

n – длина выборки.

✔ Определить значение tтабл.

определяется по таблице распределения Стьюдента в зависимости от числа степеней свободы k = n – 2 и уровня значимости α = 5%. (таблица находится ниже)


✔ Сравнить tрасч. и tтабл.

если tрасч. > tтабл., то с вероятностью 95 % во всей генеральной совокупности действительно существует линейная зависимость между изучаемыми признаками.

Рассчитаем показатель  . Определим  2,23. Таким образом, tрасч. > tтабл.

Следовательно, с вероятность 95 % принимает тот факт, что вся генеральная совокупность подчиняется линейному закону.


  1. Проведём оценку обоснованности выбора линейной функции в качестве уравнения регрессии.


✔ Вычислить:
  • среднеквадратическую ошибку
  • среднеквадратическое отклонение
  • индекс корреляции

✔ Анализ параметров:



. Тогда,  По полученным результатам делаем вывод об обоснованности выбора линейной модели в качестве уравнения регрессии.

  1. Выполним прогноз значений результативного признака по уравнению регрессии.



  • Средняя квадратическая ошибка уравнения Se дает нам возможность в каждом конкретном случае с определённой вероятностью указать, что величина результативного признака расположена в определённом интервале относительно значения, вычисленного по уравнению регрессии. Данный интервал называют доверительным.

✔ Определить границы доверительного интервала.
  • вычислить дисперсию ;
  • определить множитель ;
  • определить значение tтабл. по таблице распределения Стьюдента в зависимости от числа степеней свободы и уровня значимости α = 5%;
  • рассчитать отклонение ;
  • вычислить границы доверительного интервала;
  • построить диаграммы:
    1. прогноз (теоретическая линия),
    2. доверительный интервал:
      • нижняя граница
      • верхняя граница

Определим дисперсию: . Далее заполним в расчетной таблице строки  . Далее строит:
  • теоретическую линию (по двум точкам)
  • нижнюю границу доверительного интервала по точкам . Точки соединяем отрезками.
  • верхнюю границу доверительного интервала по точкам . Точки соединяем отрезками.



Значения tγ,k – критерия Стьюдента


k

Вероятность γ

k

Вероятность γ

k

Вероятность γ

0,95

0,99

0,95

0,99

0,95

0,99

1

12,71

63,66

12

2,18

3,05

23

2,07

2,81

2

4,30

9,92

13

2,16

3,01

24

2,06

2,80

3

3,18

5,84

14

2,14

2,98

25

2,06

2,79

4

2,78

4,60

15

2,13

2,95

26

2,06

2,78

5

2,57

4,03

16

2,12

2,92

27

2,05

2,77

6

2,45

3,71

17

2,11

2,90

28

2,05

2,76

7

2,36

3,50

18

2,10

2,88

29

2,04

2,76

8

2,31

3,35

19

2,09

2,86

30

2,04

2,75

9

2,36

3,25

20

2,09

2,84

40

2,02

2,70

10

2,23

3,17

21

2,08

2,83

60

2,00

2,66

11

2,2,

3,11

22

2,07

2,82

120

1,98

2,62