1. Статистический анализ показателей, характеризующих деятельность цирков Российской Федерации

Вид материалаРеферат

Содержание


Количество мест
Количество мест
Количество мест
Количество мест
Подобный материал:
1   2   3   4   5   6



3.2. Построение многомерной регрессионной модели.

Применение кластерного анализа позволило представить статистические данные в виде двух статистически однородных групп, для понимания которых, целесообразно построить регрессионную модель для кластера № 1. Применение методов корреляционного и регрессионного анализа, позволило исследовать зависимость доходов от следующих показателей производственно-хозяйственной деятельности:
  • у – доход;
  • х1 – количество мест;
  • х2 – расход;
  • х3 – посещение.

Исходные статистические данные для анализа представлены в приложении №5. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - доход. В таблице № 3.2 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от факторов: количество мест, расход, посещение и доход.


Таблица № 3.2. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 1.

F(3,14)=32,512 p<,00000 Std.Error of estimate: ,40801 RІ= ,87447834

 

 

n=18

B

t(14)

Intercpt

0,0454735

0,3466567

КОЛИЧЕСТВО МЕСТ

-0,0407968

-0,344654

РАСХОДЫ

0,9905392

8,6988326

ПОСЕЩЕНИЕ

0,0742925

0,7181481

Durbin-Watson d =2,1974158

 




Применение пакета прикладных программ Статистика 5,0 - ППП «Statistica», позволило построить регрессионную модель доходов для кластера № 1:

Y = +0,04547-0,04079*Х1+0,99053*Х2+0,07429*Х3. (3.3)

Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.2): множественного коэффициента детерминации R2= 0,87447, свидетельствующего о том, что 87,4% вариации доходов объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,40801, расчетным значением F - критерия Fнабл = 32,512. Уравнение регрессии значимо, так как Fнабл = 32,512 > Fкр =3,11, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =14. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр =2,145 при α = 0,05 и числе степеней свободы и ν1 =14. Из уравнения следует, что статистически значимым является только один коэффициент регрессииt2, так как расчетное значениеt2 = 8,69883 > tкр = 2,145. Расчетные значения tj для остальных коэффициентов регрессии меньше tкр =2,145 при α = 0,05 и числе степеней свободы ν1 =14.

Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,34465. Для оставшихся переменных вновь построим уравнение регрессии:

Y = +0,03001+0,97113*Х2+0,08843*Х3. (3.4)

В таблице № 3.3 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от факторов: расход, посещение и доход.

Таблица № 3.3. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 1.

R= ,93456584 RІ= ,87341332 Adjusted RІ= ,85653509




F(2,15)=51,748 p<,00000 Std.Error of estimate: ,39585




n=18

B

t(15)




Intercpt

0,030011961

0,2509524




РАСХОДЫ

0,971136796

10,112869




ПОСЕЩЕНИЕ

0,088436783

0,9599117




Durbin-Watson d =2,1400127

 







Полученное уравнение значимо, так как Fнабл = 51,748 > Fкр =3,29 при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =15, найденного по таблице F –распределения. Однако в уравнении значим только один коэффициент регрессии t2 = 10,11286 при tкр (0,05;15)=1,753. Расчетное значение t3 = 0,95991 меньше tкр (0,05;15)=1,753, найденного по таблице t – распределения при tкр =2,145 при α = 0,05 и числе степеней свободы и ν1 =15. Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 0,95991. Для оставшихся переменных вновь построим уравнение регрессии:

Y = +0,08518+0,95250*Х2. (3.5)

В таблице № 3.4 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от факторов: расход и доход.

Таблица № 3.4. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 1.

R= ,93039629 RІ= ,86563726 Adjusted RІ= ,85723959

 

 

F(1,16)=103,08 p<,00000 Std.Error of estimate: ,39487

 

 

n=18

B

t(16)

Intercpt

0,085188046

0,8143005

РАСХОДЫ

0,952503668

10,152863

Durbin-Watson d = 1,9403578

 




Полученное уравнение значимо, так как Fнабл = 103,08 > Fкр =3,63, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =16. Расчетное значение коэффициента регрессии t2 = 10,15286 больше tкр=2,120, найденного по таблице t – распределения при при α = 0,05 и числе степеней свободы ν1 =16. Таким образом, получилось значимое статистически надежное уравнение регрессии со значимым и интерпретируемым коэффициентом. Однако полученное уравнение регрессии может являться не единственно хорошей моделью для кластера № 1. Для сравнения, в качестве результативного признака, в модели была использована прибыль.

Исходные статистические данные для анализа представлены в приложении № 6. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, был сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - прибыль. В таблице № 3.5 представлены результаты построения регрессионной модели прибыли для кластера № 1 в зависимости от факторов: количество мест, расход, посещение и прибыль.

Таблица № 3.5. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 1.

R= ,53303477 RІ= ,28412607 Adjusted RІ= ,13072451

 

 

F(3,14)=1,8522 p<,18411 Std.Error of estimate: ,88142

 

 

n=18

B

t(14)

Intercpt1,924887776

0,111443505

0,39326625

КОЛИЧЕСТВО МЕСТ

-0,03352237

-0,1310939

РАСХОДЫ

0,501961762

2,040565228

ПОСЕЩЕНИЕ

0,205334956

0,918802903

Durbin-Watson d =1,924887776

 




Применение пакета прикладных программ Статистика 5.0, позволило построить регрессионную модель прибыли для кластера № 1:

Y = +0,11144-0,03352*Х1+0,50196*Х2+0,20533*Х3. (3.5)

Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.5): множественного коэффициента детерминации R2= 0,28412, свидетельствующего о том, что 28,4% вариации прибыли объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,88142, расчетным значением F - критерия Fнабл = 1,8522. Уравнение регрессии не значимо, так как Fнабл 1,8522 < Fкр = 3,11 при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =14, найденного по таблице F – распределения. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр=2,145, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы и ν1 =14. Из уравнения следует, что статистически не значимыми являются все коэффициенты регрессии, так как t1 = 0,13109 < tкр = 2,145, t2 = 2,04056 < tкр = 2,145 и t3 = 0,91980 < tкр = 2,145. Таким образом, полученное уравнение регрессии неприемлемо.

Для получения регрессии со значимыми коэффициентами также используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,13109. Для оставшихся переменных вновь построим уравнение регрессии:

Y = +0,09873+0,48601*Х2+0,21695*Х3. (3.6)

В таблице № 3.6 представлены результаты построения регрессионной модели прибыли для кластера № 1 в зависимости от факторов: расход, посещение и прибыль.


Таблица № 3.6. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 1.

R= ,53220983 RІ= ,28324730 Adjusted RІ= ,18768028

 

 

F(2,15)=2,9639 p<,08228 Std.Error of estimate: ,85205

 

 

n=18

B

t(15)

Intercpt

0,0987389

0,383569581

РАСХОДЫ

0,48601896

2,351288917

ПОСЕЩЕНИЕ

0,216957176

1,094034964

Durbin-Watson d =1,902130961

 




Полученное уравнение не значимо, так как Fнабл = 2,9639 < Fкр =3,29, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =15. (таблица № 3.6) Из уравнения следует, что статистически значим только один коэффициент регрессии, так как t2 = 2,35128 > tкр =1,753. Расчетное значение t3 = 1,09403 меньше tкр =1,753, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =15.

Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 1,09403. Для оставшихся переменных вновь построим уравнение регрессии:

Y = 0,09873+0,48601*Х2. (3.7)

В таблице № 3.7 представлены результаты построения регрессионной модели прибыли для кластера № 1 в зависимости от факторов: расход и прибыль.


Таблица № 3.7. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 1.

R= ,47545201 RІ= ,22605462 Adjusted RІ= ,17768303

 

 

F(1,16)=4,6733 p<,04613 Std.Error of estimate: ,85728

 

 

n=18

B

t(16)

Intercpt

0,0987389

1,030718532

РАСХОДЫ

0,48601896

2,161780155

Durbin-Watson d = 1,661800027

 




Полученное уравнение значимо, так как Fнабл = 4,6733 > Fкр =3,63, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =16. Расчетное значение коэффициента регрессии t2 = 2,16178 больше tкр =2,120, найденного по таблице t – распределения при при α = 0,05 и числе степеней свободы ν1 =16. Таким образом, получилось значимое, статистически надежное уравнение регрессии со значимым и интерпретируемым коэффициентом. В дальнейшем, будет выбрана лучшая модель для практического применения.

Далее, переходим к построению многомерной регрессионной модели для кластера № 2, в который вошло 16 цирков Российской Федерации. Применение кластерного анализа позволило представить статистические данные в виде двух статистически однородных групп, для понимания которых, целесообразно построить регрессионную модель и для кластера № 2. Применение методов корреляционного и регрессионного анализа, позволило исследовать зависимость доходов от следующих показателей производственно-хозяйственной деятельности:
  • у – доход;
  • х1 – количество мест;
  • х2 – расход;
  • х3 – посещение.

Исходные статистические данные для анализа представлены в приложении №7. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, был сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - доход. В таблице № 3.8 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от факторов: количество мест, расход, посещение и доход.

Таблица № 3.8. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 2.

R= ,75658119 RІ= ,57241510 Adjusted RІ= ,46551887

 

 

F(3,12)=5,3549 p<,01425 Std.Error of estimate: ,26678

 

 

n=16

B

t(12)

Intercpt

-0,358683253

-3,04535279

КОЛИЧЕСТВО МЕСТ

-0,053876141

-0,362107086

РАСХОДЫ

0,458166529

2,552097526

ПОСЕЩЕНИЕ

0,081056957

0,46798366

Durbin-Watson d = 1,924887776

 




Применение пакета прикладных программ Статистика 5,0, позволило построить регрессионную модель доходов для кластера № 2:

Y = +0,35868-0,05387*Х1+0,45816*Х2+0,08105*Х3. (3.7)


Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.8): множественного коэффициента детерминации R2= 0,57241, свидетельствующего о том, что 57,2% вариации доходов объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,26678, расчетным значением F - критерия Fнабл = 5,33549. Уравнение регрессии значимо, так как Fнабл = 5,3549 > Fкр =3,26, найденного по таблице F – распределения при при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =12. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр =2,179 при α = 0,05 и числе степеней свободы и ν1 =12. Из уравнения следует, что статистически значимым является только один коэффициент регрессии t2, так как расчетное значение t2 = 2,55209 > tкр = 2,179. Расчетные значения tj для остальных коэффициентов регрессии меньше tкр = 2,179 при α = 0,05 и числе степеней свободы ν1 =12.

Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,36210. Для оставшихся переменных вновь построим уравнение регрессии:

Y = -0,34380+0,41351*Х2+0,10457*Х3. (3.8)

В таблице № 3.9 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от факторов: расход, посещение и доход.

Таблица № 3.9. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 2.

R= ,75348720 RІ= ,56774296 Adjusted RІ= ,50124188

 

 

F(2,13)=8,5373 p<,00429 Std.Error of estimate: ,25771

 

 

n=16

B

t(13)

Intercpt

-0,34380328

-3,224353914

РАСХОДЫ

0,413512365

3,280969295

ПОСЕЩЕНИЕ

0,104571895

0,674173167

Durbin-Watson d = 1,478284121

 




Полученное уравнение значимо, так как Fнабл = 8,5373 > Fкр =3,41, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =13. (таблица № 3.9) Из уравнения следует, что статистически значим только один коэффициент регрессии t2, так как t2 = 3,28096 > tкр =2,160. Расчетное значение коэффициента регрессииt3 = 0,67417 меньше tкр =2,160, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =13.

Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 0,67417. Для оставшихся переменных вновь построим уравнение регрессии:

Y = -0,38169+0,45346*Х2. (3.9)

В таблице № 3.10 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от факторов: расход и доход.


Таблица № 3.10. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 2.

R= ,74339107 RІ= ,55263028 Adjusted RІ= ,52067530

 

 

F(1,14)=17,294 p<,00097 Std.Error of estimate: ,25264

 

 

n=16

B

t(14)

Intercpt

-0,381694668

-4,296984902

РАСХОДЫ

0,453465818

4,158608736

Durbin-Watson d = 1,540554166

 




Полученное уравнение значимо, так Fнабл = 17,294 > Fкр =3,74 Fнабл = 17,294 > Fкр =3.74, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =14. Расчетное значение коэффициента регрессии t2 = 4,15860 больше tкр =2,145, найденного по таблице t – распределения при при α = 0,05 и числе степеней свободы ν1 =14. Таким образом, получилось значимое, статистически надежное уравнение регрессии со значимым и интерпретируемым коэффициентом. В дальнейшем, будет выбрана лучшая модель для практического применения.

Однако полученное уравнение регрессии может являться не единственно хорошей моделью для кластера № 2. Для сравнения, в качестве результативного признака, в модели была использована прибыль.

Исходные статистические данные для анализа представлены в приложении № 8. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, был сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - прибыль. В таблице № 3.11 представлены результаты построения регрессионной модели прибыли для кластера № 2 в зависимости от факторов: количество мест, расход, посещение и прибыль. Таблица № 3.11. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 2.

R= ,45636015 RІ= ,20826459 Adjusted RІ= ,01033074

 

 

F(3,12)=1,0522 p<,40524 Std.Error of estimate: ,80299

 

 

n=16

B

t(12)

Intercpt

-0,670531946

-1,891388988

КОЛИЧЕСТВО МЕСТ

-0,266984907

-0,596159032

РАСХОДЫ

-0,426049884

-0,788441054

ПОСЕЩЕНИЕ

0,381730392

0,732203845

Durbin-Watson d = 1,881286502

 




Применение пакета прикладных программ Статистика 5,0 - ППП «Statistica», позволило построить регрессионную модель прибыли для кластера № 2:

Y = -0,67053-0,26698*Х1-0,42604*Х2+0,38173*Х3. (3.10)

Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.11): множественного коэффициента детерминации R2=0,20826, свидетельствующего о том, что 20,8% вариации доходов объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,80299, расчетным значением F – критерия Fнабл = 1,0522. Уравнение регрессии не значимо, так как Fнабл =1,0522 < Fкр =3,26, найденного по таблице F – распределения при при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =12. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр =2,179 при α = 0,05 и числе степеней свободы ν1 =12. Из уравнения следует, что статистически не значимыми являются все коэффициенты регрессии, так как t1 = 0,59615 < tкр = 2,179, t2 = 0,78844 < tкр = 2,179 и t3 = 0,73220 < tкр = 2,179. Таким образом, полученное уравнение регрессии неприемлемо.

Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,59615. Для оставшихся переменных вновь построим уравнение регрессии:

Y = -0,59679-0,64733*Х2+0,49825*Х3. (3.11)

В таблице № 3.12 представлены результаты построения регрессионной модели прибыли для кластера № 2 в зависимости от факторов: расход, посещение и прибыль.

Таблица № 3.12. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 2.

R= ,42990192 RІ= ,18481566 Adjusted RІ= ,05940268

 

 

F(2,13)=1,4737 p<,26495 Std.Error of estimate: ,78283

 

 

n=16

B

t(13)

Intercpt

-0,596793775

-1,842526821

РАСХОДЫ

-0,647334996

-1,690828644

ПОСЕЩЕНИЕ

0,498259406

1,057471901

Durbin-Watson d = 1,875893116

 




Полученное уравнение не значимо, так как Fнабл = 1,4737 < Fкр =3,41, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =13. (таблица № 3.12) Из уравнения следует, что статистически не значимыми являются все коэффициенты регрессии, так как t2 = 1,69082 < tкр =2,160 и t3 = 1,05747 меньше tкр =2,160, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =13. Таким образом, полученное уравнение регрессии неприемлемо.

Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 1,05747. Для оставшихся переменных вновь построим уравнение регрессии:

Y = -0,77733-0,45696*Х2. (3.12)

В таблице № 3.13 представлены результаты построения регрессионной модели прибыли для кластера № 2 в зависимости от факторов: расход и прибыль.

Таблица № 3.13. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 2.

R= ,338665 RІ= ,11469433 Adjusted RІ= ,05145821

 

 

F(1,14)=1,8137 p<,19946 Std.Error of estimate: ,78613

 

 

n=16

B

t(14)

Intercpt

-0,777336937

-2,812272711

РАСХОДЫ

-0,456966604

-1,346754272

Durbin-Watson d = 1,773469806

 




Полученное уравнение не значимо, так как Fнабл = 1,8137 < Fкр = 3,74, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =14. (таблица № 3.13) Из уравнения следует, что статистически не значимым является и коэффициент регрессии t2 = 1,34675 при tкр =2,145, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =14. Таким образом, полученное уравнение регрессии неприемлемо.

Анализ показал, что это уравнение регрессии для практического применения рекомендовано быть не может. В дальнейшем целесообразно рассмотреть все ранее разобранные модели и, выбрать лучшие, как для кластера № 1, так и для кластера № 2.


3.3. Выбор модели для практического применения.

Проанализируем регрессионные модели с позиции статистической надежности для кластера № 1. Для этого необходимо проанализировать таблицу № 3.14. В таблице № 3.14 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от фактора расходы, и регрессионная модель прибыли в зависимости от того же фактора.

Таблица № 3.14. Статистическая оценка параметров многомерной регрессионной модели дохода и прибыли для кластера № 1.

модель

b0

b1

F-значение

t

Статистическая

Коэффициент детерминации

Критерий Дарбина-

Относительная ошибка

 

 

 

 

 

 надежность

R2

Уотсона d=2

аппроксимации

1.

0,0851

0,9525

103,080

10,15286

+

0,86564

1,94036

0,39487

2.

0,2341

0,4403

4,67330

2,16178

+

0,22605

1,66180

0,85728

Fкр (0,05;2;16)=3,63 tкр (0,05;16)=2,120

Для многомерной регрессионной модели № 1:

Y = +0,08518+0,95250*Х2. (3.13)

Для многомерной регрессионной модели № 2:

Y = +0,23409+0,44030*Х2. (3.14)

Таким образом, мы имеем две «хороших» модели, из которых нужно выбрать одну. По статистическим критериям наиболее адекватна модель № 1 (для доходов), несколько худшие показатели адекватности имеет модель № 2 (для прибыли). В модели № 1 наибольшее расчетное значение F – критерия Fнабл = 103,08, в отличие от модели № 2, расчетное значение F – критерия Fнабл = 4,67330. Расчетное значение t = 10,15286 для модели № 1 больше, чем значение t = 2,16178 в м одели № 2. Множественный коэффициент детерминации R2 = 0,86564 в модели № 1, также больше, чем в модели № 2 R2 = 0,22605, и свидетельствует о том, что 86,6% и 22,6% вариации доходов объясняется вошедшими в модели № 1 и № 2 показателем Х2 – расходы. Остальная часть вариации обусловлена действием неучтенных факторов ( Х1 – количество мест, Х3 – посещаемость). Критерий Дарбина – Уотсона не значительно отклоняется от d=2 в модели № 1 и равен 1,94036, в отличие от другой модели № 2, который равен 1,66180.

Относительная ошибка аппроксимации в модели № 1 имеет наименьший показатель 0,3948 < 0,8572, чем в модели № 2. Из всех вышеперечисленных показателей, предпочтение следует отдать модели № 1. Таким образом, после реализации алгоритма пошагового регрессионного анализа в уравнение вошла только одна переменная Х2 – расходы. Для практического применения целесообразно рекомендовать уравнение регрессии № 1:

Y = +0,08518+0,95250*Х2. (3.15)

В соответствии с моделью, Y - представляет собой значение результативного признака, характеризующее среднее для совокупности рассматриваемых цирков значение доходов.

Экономическая интерпретация модели.

В соответствии с моделью № 1, рекомендованной для практического использования следует, что при увеличении расходов на единицу, доход увеличивается 0,95250. Множественный коэффициент детерминации R2 = 0,86564 свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 86,6% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 13,4%.

Проанализируем регрессионные модели с позиции статистической надежности для кластера № 2. Для этого необходимо проанализировать таблицу № 3.15. В таблице № 3.15 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от фактора расходы, а также регрессионная модель прибыли в зависимости от того же фактора.

Таблица № 3.15. Статистическая оценка параметров многомерной регрессионной модели дохода и прибыли для кластера № 2.

модель

b0

b1

F-значение

t

Статистическая

Коэффициент детерминации

Критерий Дарбина-

Относительная ошибка

 

 

 

 

 

 надежность

R2

Уотсона d=2

аппроксимации

1


-0,3816

0,453

17,294

4,1586

+

0,55263

1,54055

0,25264

2


-0,7773

-0,456

1,813

-1,6908

-

0,11469

1,77347

0,78613

Fкр (0,05;2;14)=3,74 tкр (0,05;14)=2,145

Для многомерной регрессионной модели № 1:

Y = -0,38169+0,45346*Х2. (3.15)

Для многомерной регрессионной модели № 2:

Y = -0,77733-0,45696*Х2. (3.16)

Таким образом, мы имеем две регрессионные модели, из которых нужно выбрать одну. По статистическим критериям наиболее адекватна модель № 1 (для доходов), несколько худшие показатели адекватности имеет модель № 2 (для прибыли). В модели № 1 наибольшее расчетное значение F – критерия Fнабл = 17,294, в отличие от модели № 2, расчетное значение F – критерия Fнабл = 1,813. Расчетное значение t = 4,1586 для модели № 1 больше, чем значение t = 1,6908 в модели № 2. Множественный коэффициент детерминации R2 = 0,5526 в модели № 1, также больше, чем в модели № 2 R2 = 0,1146, и свидетельствует о том, что 55,3% и 11,5% вариации доходов объясняется вошедшими в модели № 1 и № 2 показателем Х2 - расходы. Остальная часть вариации обусловлена действием неучтенных факторов (Х1 – количество мест, Х3 – посещаемость). Критерий Дарбина – Уотсона не значительно отклоняется от d=2 в модели № 1 и равен 1,7734, в отличие от другой модели № 2, который равен 1,5405. Относительная ошибка аппроксимации в модели № 1 имеет наименьший показатель 0,2526 < 0,7861, чем в модели № 2. Из всех вышеперечисленных показателей и на основании статистической не надежности модели №2, предпочтение следует отдать модели № 1. Таким образом, после реализации алгоритма пошагового регрессионного анализа в уравнение вошла только одна переменная Х2 – расходы. Для практического применения целесообразно рекомендовать уравнение регрессии № 1:

Y = -0,38169+0,45346*Х2. (3.17)

В соответствии с моделью, Y - представляет собой значение результативного признака, характеризующее среднее для совокупности рассматриваемых цирков значение доходов.

Экономическая интерпретация модели.

В соответствии с моделью № 1, рекомендованной для практического использования следует, что при увеличении расходов на единицу, доход увеличивается 0,45346. Множественный коэффициент детерминации R2 = 0,5526, свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 55,3% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 44,7%.


Заключение


В результате статистического анализа показателей, характеризующих деятельность цирков Российской Федерации, были сделаны следующие выводы.

Применение кластерного анализа позволило представить статистические данные в виде двух статистически однородных групп, для понимания которых, построены регрессионные модели как для кластера № 1, так и для кластера № 2. Графическое представление результатов кластерного анализа, а также построение регрессионных моделей осуществлялось с помощью ППП “Statistica”.

Применение методов корреляционного и регрессионного анализа, позволило исследовать зависимость доходов от следующих показателей производственно-хозяйственной деятельности: количество мест, расход, посещение и доходы, а также зависимость прибыли от тех же показателей.

Исходные статистические данные для анализа были представлены в приложениях № 5-8. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Результаты построения регрессионных моделей были представлены в таблицах № 3.2 - 3.15.

Статистическая надежность моделей была оценена с помощью следующих параметров адекватности: множественного коэффициента детерминации, относительной ошибки аппроксимации, расчетным значением F – критерия. Значимость отдельных коэффициентов регрессии была оценена с помощью tкр - критерия.

Для получения уравнения регрессии со значимыми коэффициентами использовался пошаговый алгоритм регрессионного анализа, с исключением переменных. Для оставшихся переменных вновь строились уравнения регрессии.

Таким образом, были получены модели как для кластера № 1, так и для кластера № 2. Проанализировав регрессионные модели с позиции статистической надежности, лучшие из них были рекомендованы для практического применения.

Экономическая интерпретация модели.

Статистический анализ, проделанный в данной работе, показал, что для практического применения целесообразно рекомендовать следующую регрессионную модель для кластера № 1:

Y = +0,08518+0,95250*Х2. (3.18)

В соответствии с моделью, рекомендованной для практического использования, следует, что при увеличении расходов на единицу, доход увеличивается на 0,95250. Множественный коэффициент детерминации R2 = 0,86564 свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 86,6% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 13,4%.

Для кластера № 2, наиболее адекватна следующая регрессионная модель:

Y = -0,38169+0,45346*Х2 . (3.19)

Статистическая оценка параметров данной регрессионной модели позволяет судить о том, что при увеличении расходов на единицу, доход увеличивается на 0,45346. Множественный коэффициент детерминации R2 = 0,5526 свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 55,3% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 44,7%.


Список литературы


1. С.А. Айвазян, В.С. Мхитарян «Практикум по прикладной статистике и эконометрике» Москва - 1998 г.;

2. В.П. Боровиков, И.П. Боровиков «Statistica. Статистический анализ и обработка данных в среде Windows» Информационно-издательский дом «Филинъ»; Москва, – 1997 г.;

3. Белорусская деловая газета №762 от 04.05.2000г.;

4. Биржа труда No 25(126) статья № 9;

5. Государственный комитет Российской Федерации по статистике «Российский статистический ежегодник» Москва 2000г.

6. Под редакцией А.Г. Гранберга «Статистическое моделирование и прогнозирование» Москва «Финансы и статистика» 1990г.;

7. А.М. Дубров, В.С. Мхитарян, Л.И. Трошин «Многомерные статистические методы»; Москва, «Финансы и статистика», – 1998 г.;

8. А.М. Дубров, И.А. Корнилов. Математические и математико-статистических методы, используемые в курсе «Многомерные статистические методы» Москва 1991г.;

9. М.Р. Ефимова, В.М. Рябцев «Общая теория статистики» Москва «Финансы и статистика» 1991г.;

10. А.Н. Кленин, Л.И. Трошин, К.К. Шевченко «Применение математико-статистических методов в экономических расчетах» Москва 1986 г.;

11. Министерство культуры Российской Федерации главный информационно-вычислительный центр «Концертные организации и коллективы Министерства культуры Российской Федерации. Цирки России в цифрах за 1999 год» Москва 2000 г.;

12. М. Одина «Бодрый советский цирк» Москва 2001г.;
13. Пресс-Релиз «Брифинг Министра культуры России М.Е. Швыдкого Москва» 31.08.2000г.;

14. Под редакцией Р.А. Шмойловой «Теория статистики»; Москва; «Финансы и статистика», – 1998 г.;

15. Russian culture navigator «Российский цирк»

16. И. Терентьева «Цирк дю Солей и его русские артисты» Москва2001г.;
17. И. Устинова «Режиссер для цирка» Москва 2001г.