СОДЕРЖАНИЕ


Исходные данные.


Задание 1. Регрессионно-корреляционный анализ.


Задание 2. Факторный анализ.


Задание 3. Компонентный анализ.


Задание 4. Дискриминаторный анализ и оптимальная группировка объектов.


Исходные данные:

Номер объекта

Y2

X1

X2

X3

X5

1

204,2

0,23

0,78

0,4

1,23

2

209,6

0,24

0,75

0,26

1,04

3

222,6

0,19

0,68

0,4

1,8

4

236,7

0,17

0,7

0,5

0,43

5

62

0,23

0,62

0,4

0,88

6

53,1

0,43

0,76

0,19

0,57

7

172,1

0,31

0,73

0,25

1,72

8

56,5

0,26

0,71

0,44

1,7

9

52,6

0,49

0,69

0,17

0,84

10

46,6

0,36

0,73

0,39

0,6

11

53,2

0,37

0,68

0,33

0,82

12

30,1

0,43

0,74

0,25

0,84

13

146,4

0,35

0,66

0,32

0,67

14

18,1

0,38

0,72

0,02

1,04

15

13,6

0,42

0,68

0,06

0,66

16

89,8

0,3

0,77

0,15

0,86

17

62,5

0,32

0,78

0,08

0,79

18

46,3

0,25

0,78

0,2

0,34

19

103,5

0,31

0,81

0,2

1,6

20

73,3

0,26

0,79

0,3

1,46


Задание 1. Регрессионно-корреляционный анализ.

Уравнение регрессии ищем в виде:


Используем автоматизированное вычисление множественного линейного уравнения связи (регрессии) с помощью EXCEL.

Получаем уравнение множественной связи:


Из уравнения видно, что основным признаком, определяющим уровень снижения себестоимости продукции является повышение трудоемкости единицы продукции. Изменение трудоемкости единицы продукции на 1% изменяет индекс себестоимости продукции на 4,2447 процентных пункта, что говорит об общей недостаточной организованности производства.

Наиболее заметным признаком – фактором удорожания продукции является удельный вес покупных изделий в общих затратах на производство. Повышение доли этих затрат на один пункт (0,01) увеличивает индекс динамики себестоимости на 1,16%.

Значимость уравнения регрессии в целом оцениваем посредством F-критерия. По результатам дисперсионного анализа имеем

.

По таблице для уровня значимости a = 0,05, к1 = 4, к2 = 20 – 4 – 1 = 15 находим . Так как , делаем вывод о значимости уравнения множественной регрессии.

Оценим тесноту связи признака-результата с признаками-регрессорами с помощью коэффициента множественной детерминации R2. По результатам регрессионной статистики R2 = 0,49 – это означает, что 49 % вариации результативного признака объясняется вариацией факторных переменных, т.е. полученное уравнение не достаточно хорошо описывает изучаемую взаимосвязь между факторами.


ВЫВОД ИТОГОВ



Регрессионная статистика


Множественный R

0,700223


R-квадрат

0,490312


Нормированный R-квадрат

0,354395


Стандартная ошибка

58,53297


Наблюдения

20


Дисперсионный анализ


 

df

SS

MS

F

Значимость F


Регрессия

4

49437,91

12359,48

3,607439

0,029839


Остаток

15

51391,63

3426,109


Итого

19

100829,5

 

 

 


 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

167,2374

267,1635

0,625974

0,540741

-402,208

736,6833

-402,208

736,6833

Переменная X 1

-424,471

206,3497

-2,05705

0,057506

-864,295

15,35344

-864,295

15,35344

Переменная X 2

21,07086

299,2958

0,070401

0,944804

-616,863

659,0051

-616,863

659,0051

Переменная X 3

116,0467

139,5348

0,831668

0,41864

-181,365

413,4583

-181,365

413,4583

Переменная X 4

18,06021

31,91179

0,565942

0,579802

-49,9582

86,07861

-49,9582

86,07861



Проверим параметры уравнения регрессии на значимость с помощью t – критерия. Наблюдаемые значения t – критерия составляют:

t(A0) =

0,625974

t(A1) =

-2,05705

t(A2) =

0,070401

t(A3) =

0,831668

t(A4) =

0,565942


Для данной задачи табличное значение t – критерия равно 1,75 при вероятности его превышения (по абсолютному значению), равной 0,1. Так как ни одно из фактических значений t – критерия не превышает табличного, делаем