1. Статистический анализ показателей, характеризующих деятельность цирков Российской Федерации
Вид материала | Реферат |
СодержаниеКоличество мест Количество мест Количество мест Количество мест |
- Тема курсовой работы, 22.7kb.
- Тенденции формирования социальной структуры российского общества на современном этапе, 447.36kb.
- Агентство Республики Казахстан по статистике Департамент статистики труда и уровня, 317.93kb.
- Методика аудиторской проверки учета кассовых операций студентки 5 курса Факультет:, 530.73kb.
- Стратегия государственной молодежной политики в российской федерации (Министерство, 484.32kb.
- Бакалаврская программа № 521200 Кафедра: Социологии Направление : Социология Дисциплина, 188.47kb.
- Институт, 132.47kb.
- Статистический отчет ежегодный документ Ежегодный статистический отчет составляется, 2030.09kb.
- Всистеме показателей, характеризующих эффективность производства и реализации, одно, 317.59kb.
- Всистеме показателей, характеризующих эффективность производства и реализации, одно, 49.75kb.
3.2. Построение многомерной регрессионной модели.
Применение кластерного анализа позволило представить статистические данные в виде двух статистически однородных групп, для понимания которых, целесообразно построить регрессионную модель для кластера № 1. Применение методов корреляционного и регрессионного анализа, позволило исследовать зависимость доходов от следующих показателей производственно-хозяйственной деятельности:
- у – доход;
- х1 – количество мест;
- х2 – расход;
- х3 – посещение.
Исходные статистические данные для анализа представлены в приложении №5. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - доход. В таблице № 3.2 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от факторов: количество мест, расход, посещение и доход.
Таблица № 3.2. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 1.
F(3,14)=32,512 p<,00000 Std.Error of estimate: ,40801 RІ= ,87447834 | | |
n=18 | B | t(14) |
Intercpt | 0,0454735 | 0,3466567 |
КОЛИЧЕСТВО МЕСТ | -0,0407968 | -0,344654 |
РАСХОДЫ | 0,9905392 | 8,6988326 |
ПОСЕЩЕНИЕ | 0,0742925 | 0,7181481 |
Durbin-Watson d =2,1974158 | | |
Применение пакета прикладных программ Статистика 5,0 - ППП «Statistica», позволило построить регрессионную модель доходов для кластера № 1:
Y = +0,04547-0,04079*Х1+0,99053*Х2+0,07429*Х3. (3.3)
Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.2): множественного коэффициента детерминации R2= 0,87447, свидетельствующего о том, что 87,4% вариации доходов объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,40801, расчетным значением F - критерия Fнабл = 32,512. Уравнение регрессии значимо, так как Fнабл = 32,512 > Fкр =3,11, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =14. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр =2,145 при α = 0,05 и числе степеней свободы и ν1 =14. Из уравнения следует, что статистически значимым является только один коэффициент регрессииt2, так как расчетное значениеt2 = 8,69883 > tкр = 2,145. Расчетные значения tj для остальных коэффициентов регрессии меньше tкр =2,145 при α = 0,05 и числе степеней свободы ν1 =14.
Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,34465. Для оставшихся переменных вновь построим уравнение регрессии:
Y = +0,03001+0,97113*Х2+0,08843*Х3. (3.4)
В таблице № 3.3 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от факторов: расход, посещение и доход.
Таблица № 3.3. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 1.
R= ,93456584 RІ= ,87341332 Adjusted RІ= ,85653509 | | ||
F(2,15)=51,748 p<,00000 Std.Error of estimate: ,39585 | | ||
n=18 | B | t(15) | |
Intercpt | 0,030011961 | 0,2509524 | |
РАСХОДЫ | 0,971136796 | 10,112869 | |
ПОСЕЩЕНИЕ | 0,088436783 | 0,9599117 | |
Durbin-Watson d =2,1400127 | | | |
Полученное уравнение значимо, так как Fнабл = 51,748 > Fкр =3,29 при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =15, найденного по таблице F –распределения. Однако в уравнении значим только один коэффициент регрессии t2 = 10,11286 при tкр (0,05;15)=1,753. Расчетное значение t3 = 0,95991 меньше tкр (0,05;15)=1,753, найденного по таблице t – распределения при tкр =2,145 при α = 0,05 и числе степеней свободы и ν1 =15. Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 0,95991. Для оставшихся переменных вновь построим уравнение регрессии:
Y = +0,08518+0,95250*Х2. (3.5)
В таблице № 3.4 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от факторов: расход и доход.
Таблица № 3.4. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 1.
R= ,93039629 RІ= ,86563726 Adjusted RІ= ,85723959 | | |
F(1,16)=103,08 p<,00000 Std.Error of estimate: ,39487 | | |
n=18 | B | t(16) |
Intercpt | 0,085188046 | 0,8143005 |
РАСХОДЫ | 0,952503668 | 10,152863 |
Durbin-Watson d = 1,9403578 | | |
Полученное уравнение значимо, так как Fнабл = 103,08 > Fкр =3,63, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =16. Расчетное значение коэффициента регрессии t2 = 10,15286 больше tкр=2,120, найденного по таблице t – распределения при при α = 0,05 и числе степеней свободы ν1 =16. Таким образом, получилось значимое статистически надежное уравнение регрессии со значимым и интерпретируемым коэффициентом. Однако полученное уравнение регрессии может являться не единственно хорошей моделью для кластера № 1. Для сравнения, в качестве результативного признака, в модели была использована прибыль.
Исходные статистические данные для анализа представлены в приложении № 6. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, был сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - прибыль. В таблице № 3.5 представлены результаты построения регрессионной модели прибыли для кластера № 1 в зависимости от факторов: количество мест, расход, посещение и прибыль.
Таблица № 3.5. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 1.
R= ,53303477 RІ= ,28412607 Adjusted RІ= ,13072451 | | |
F(3,14)=1,8522 p<,18411 Std.Error of estimate: ,88142 | | |
n=18 | B | t(14) |
Intercpt1,924887776 | 0,111443505 | 0,39326625 |
КОЛИЧЕСТВО МЕСТ | -0,03352237 | -0,1310939 |
РАСХОДЫ | 0,501961762 | 2,040565228 |
ПОСЕЩЕНИЕ | 0,205334956 | 0,918802903 |
Durbin-Watson d =1,924887776 | | |
Применение пакета прикладных программ Статистика 5.0, позволило построить регрессионную модель прибыли для кластера № 1:
Y = +0,11144-0,03352*Х1+0,50196*Х2+0,20533*Х3. (3.5)
Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.5): множественного коэффициента детерминации R2= 0,28412, свидетельствующего о том, что 28,4% вариации прибыли объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,88142, расчетным значением F - критерия Fнабл = 1,8522. Уравнение регрессии не значимо, так как Fнабл 1,8522 < Fкр = 3,11 при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =14, найденного по таблице F – распределения. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр=2,145, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы и ν1 =14. Из уравнения следует, что статистически не значимыми являются все коэффициенты регрессии, так как t1 = 0,13109 < tкр = 2,145, t2 = 2,04056 < tкр = 2,145 и t3 = 0,91980 < tкр = 2,145. Таким образом, полученное уравнение регрессии неприемлемо.
Для получения регрессии со значимыми коэффициентами также используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,13109. Для оставшихся переменных вновь построим уравнение регрессии:
Y = +0,09873+0,48601*Х2+0,21695*Х3. (3.6)
В таблице № 3.6 представлены результаты построения регрессионной модели прибыли для кластера № 1 в зависимости от факторов: расход, посещение и прибыль.
Таблица № 3.6. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 1.
R= ,53220983 RІ= ,28324730 Adjusted RІ= ,18768028 | | |
F(2,15)=2,9639 p<,08228 Std.Error of estimate: ,85205 | | |
n=18 | B | t(15) |
Intercpt | 0,0987389 | 0,383569581 |
РАСХОДЫ | 0,48601896 | 2,351288917 |
ПОСЕЩЕНИЕ | 0,216957176 | 1,094034964 |
Durbin-Watson d =1,902130961 | | |
Полученное уравнение не значимо, так как Fнабл = 2,9639 < Fкр =3,29, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =15. (таблица № 3.6) Из уравнения следует, что статистически значим только один коэффициент регрессии, так как t2 = 2,35128 > tкр =1,753. Расчетное значение t3 = 1,09403 меньше tкр =1,753, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =15.
Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 1,09403. Для оставшихся переменных вновь построим уравнение регрессии:
Y = 0,09873+0,48601*Х2. (3.7)
В таблице № 3.7 представлены результаты построения регрессионной модели прибыли для кластера № 1 в зависимости от факторов: расход и прибыль.
Таблица № 3.7. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 1.
R= ,47545201 RІ= ,22605462 Adjusted RІ= ,17768303 | | |
F(1,16)=4,6733 p<,04613 Std.Error of estimate: ,85728 | | |
n=18 | B | t(16) |
Intercpt | 0,0987389 | 1,030718532 |
РАСХОДЫ | 0,48601896 | 2,161780155 |
Durbin-Watson d = 1,661800027 | | |
Полученное уравнение значимо, так как Fнабл = 4,6733 > Fкр =3,63, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =16. Расчетное значение коэффициента регрессии t2 = 2,16178 больше tкр =2,120, найденного по таблице t – распределения при при α = 0,05 и числе степеней свободы ν1 =16. Таким образом, получилось значимое, статистически надежное уравнение регрессии со значимым и интерпретируемым коэффициентом. В дальнейшем, будет выбрана лучшая модель для практического применения.
Далее, переходим к построению многомерной регрессионной модели для кластера № 2, в который вошло 16 цирков Российской Федерации. Применение кластерного анализа позволило представить статистические данные в виде двух статистически однородных групп, для понимания которых, целесообразно построить регрессионную модель и для кластера № 2. Применение методов корреляционного и регрессионного анализа, позволило исследовать зависимость доходов от следующих показателей производственно-хозяйственной деятельности:
- у – доход;
- х1 – количество мест;
- х2 – расход;
- х3 – посещение.
Исходные статистические данные для анализа представлены в приложении №7. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, был сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - доход. В таблице № 3.8 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от факторов: количество мест, расход, посещение и доход.
Таблица № 3.8. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 2.
R= ,75658119 RІ= ,57241510 Adjusted RІ= ,46551887 | | |
F(3,12)=5,3549 p<,01425 Std.Error of estimate: ,26678 | | |
n=16 | B | t(12) |
Intercpt | -0,358683253 | -3,04535279 |
КОЛИЧЕСТВО МЕСТ | -0,053876141 | -0,362107086 |
РАСХОДЫ | 0,458166529 | 2,552097526 |
ПОСЕЩЕНИЕ | 0,081056957 | 0,46798366 |
Durbin-Watson d = 1,924887776 | | |
Применение пакета прикладных программ Статистика 5,0, позволило построить регрессионную модель доходов для кластера № 2:
Y = +0,35868-0,05387*Х1+0,45816*Х2+0,08105*Х3. (3.7)
Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.8): множественного коэффициента детерминации R2= 0,57241, свидетельствующего о том, что 57,2% вариации доходов объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,26678, расчетным значением F - критерия Fнабл = 5,33549. Уравнение регрессии значимо, так как Fнабл = 5,3549 > Fкр =3,26, найденного по таблице F – распределения при при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =12. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр =2,179 при α = 0,05 и числе степеней свободы и ν1 =12. Из уравнения следует, что статистически значимым является только один коэффициент регрессии t2, так как расчетное значение t2 = 2,55209 > tкр = 2,179. Расчетные значения tj для остальных коэффициентов регрессии меньше tкр = 2,179 при α = 0,05 и числе степеней свободы ν1 =12.
Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,36210. Для оставшихся переменных вновь построим уравнение регрессии:
Y = -0,34380+0,41351*Х2+0,10457*Х3. (3.8)
В таблице № 3.9 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от факторов: расход, посещение и доход.
Таблица № 3.9. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 2.
R= ,75348720 RІ= ,56774296 Adjusted RІ= ,50124188 | | |
F(2,13)=8,5373 p<,00429 Std.Error of estimate: ,25771 | | |
n=16 | B | t(13) |
Intercpt | -0,34380328 | -3,224353914 |
РАСХОДЫ | 0,413512365 | 3,280969295 |
ПОСЕЩЕНИЕ | 0,104571895 | 0,674173167 |
Durbin-Watson d = 1,478284121 | | |
Полученное уравнение значимо, так как Fнабл = 8,5373 > Fкр =3,41, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =13. (таблица № 3.9) Из уравнения следует, что статистически значим только один коэффициент регрессии t2, так как t2 = 3,28096 > tкр =2,160. Расчетное значение коэффициента регрессииt3 = 0,67417 меньше tкр =2,160, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =13.
Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 0,67417. Для оставшихся переменных вновь построим уравнение регрессии:
Y = -0,38169+0,45346*Х2. (3.9)
В таблице № 3.10 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от факторов: расход и доход.
Таблица № 3.10. Статистическая оценка параметров многомерной регрессионной модели доходов цирков для кластера № 2.
R= ,74339107 RІ= ,55263028 Adjusted RІ= ,52067530 | | |
F(1,14)=17,294 p<,00097 Std.Error of estimate: ,25264 | | |
n=16 | B | t(14) |
Intercpt | -0,381694668 | -4,296984902 |
РАСХОДЫ | 0,453465818 | 4,158608736 |
Durbin-Watson d = 1,540554166 | | |
Полученное уравнение значимо, так Fнабл = 17,294 > Fкр =3,74 Fнабл = 17,294 > Fкр =3.74, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =14. Расчетное значение коэффициента регрессии t2 = 4,15860 больше tкр =2,145, найденного по таблице t – распределения при при α = 0,05 и числе степеней свободы ν1 =14. Таким образом, получилось значимое, статистически надежное уравнение регрессии со значимым и интерпретируемым коэффициентом. В дальнейшем, будет выбрана лучшая модель для практического применения.
Однако полученное уравнение регрессии может являться не единственно хорошей моделью для кластера № 2. Для сравнения, в качестве результативного признака, в модели была использована прибыль.
Исходные статистические данные для анализа представлены в приложении № 8. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Наличие мультиколлиниарности в данной модели не обнаружено. По результатам анализа матрицы парных коэффициентов корреляции, был сделан вывод, использовать такие факторы как: количество мест, расход, посещение. В качестве результативного признака - прибыль. В таблице № 3.11 представлены результаты построения регрессионной модели прибыли для кластера № 2 в зависимости от факторов: количество мест, расход, посещение и прибыль. Таблица № 3.11. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 2.
R= ,45636015 RІ= ,20826459 Adjusted RІ= ,01033074 | | |
F(3,12)=1,0522 p<,40524 Std.Error of estimate: ,80299 | | |
n=16 | B | t(12) |
Intercpt | -0,670531946 | -1,891388988 |
КОЛИЧЕСТВО МЕСТ | -0,266984907 | -0,596159032 |
РАСХОДЫ | -0,426049884 | -0,788441054 |
ПОСЕЩЕНИЕ | 0,381730392 | 0,732203845 |
Durbin-Watson d = 1,881286502 | | |
Применение пакета прикладных программ Статистика 5,0 - ППП «Statistica», позволило построить регрессионную модель прибыли для кластера № 2:
Y = -0,67053-0,26698*Х1-0,42604*Х2+0,38173*Х3. (3.10)
Статистическая надежность модели была оценена с помощью следующих параметров адекватности (таблица № 3.11): множественного коэффициента детерминации R2=0,20826, свидетельствующего о том, что 20,8% вариации доходов объединяет вошедшими в модель показателями (Х1, Х2, Х3), относительной ошибки аппроксимации δ = 0,80299, расчетным значением F – критерия Fнабл = 1,0522. Уравнение регрессии не значимо, так как Fнабл =1,0522 < Fкр =3,26, найденного по таблице F – распределения при при уровне значимости α = 0,05 и числах степеней свободы ν1 =4 и ν1 =12. Для проверки гипотезы о значимости отдельных коэффициентов регрессии Н0: θj = 0, где j = 1,2,3, сравнивают критическое значение tкр =2,179 при α = 0,05 и числе степеней свободы ν1 =12. Из уравнения следует, что статистически не значимыми являются все коэффициенты регрессии, так как t1 = 0,59615 < tкр = 2,179, t2 = 0,78844 < tкр = 2,179 и t3 = 0,73220 < tкр = 2,179. Таким образом, полученное уравнение регрессии неприемлемо.
Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Первоначально используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х1 - количество мест, которой соответствует минимальное по абсолютной величине значение коэффициента t1 = 0,59615. Для оставшихся переменных вновь построим уравнение регрессии:
Y = -0,59679-0,64733*Х2+0,49825*Х3. (3.11)
В таблице № 3.12 представлены результаты построения регрессионной модели прибыли для кластера № 2 в зависимости от факторов: расход, посещение и прибыль.
Таблица № 3.12. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 2.
R= ,42990192 RІ= ,18481566 Adjusted RІ= ,05940268 | | |
F(2,13)=1,4737 p<,26495 Std.Error of estimate: ,78283 | | |
n=16 | B | t(13) |
Intercpt | -0,596793775 | -1,842526821 |
РАСХОДЫ | -0,647334996 | -1,690828644 |
ПОСЕЩЕНИЕ | 0,498259406 | 1,057471901 |
Durbin-Watson d = 1,875893116 | | |
Полученное уравнение не значимо, так как Fнабл = 1,4737 < Fкр =3,41, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =3 и ν1 =13. (таблица № 3.12) Из уравнения следует, что статистически не значимыми являются все коэффициенты регрессии, так как t2 = 1,69082 < tкр =2,160 и t3 = 1,05747 меньше tкр =2,160, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =13. Таким образом, полученное уравнение регрессии неприемлемо.
Для получения регрессии со значимыми коэффициентами используем пошаговый алгоритм регрессионного анализа. Используем пошаговый алгоритм с исключением переменных. Исключим из модели переменную Х3 - посещение, которой соответствует минимальное по абсолютной величине значение коэффициента t3 = 1,05747. Для оставшихся переменных вновь построим уравнение регрессии:
Y = -0,77733-0,45696*Х2. (3.12)
В таблице № 3.13 представлены результаты построения регрессионной модели прибыли для кластера № 2 в зависимости от факторов: расход и прибыль.
Таблица № 3.13. Статистическая оценка параметров многомерной регрессионной модели прибыли цирков для кластера № 2.
R= ,338665 RІ= ,11469433 Adjusted RІ= ,05145821 | | |
F(1,14)=1,8137 p<,19946 Std.Error of estimate: ,78613 | | |
n=16 | B | t(14) |
Intercpt | -0,777336937 | -2,812272711 |
РАСХОДЫ | -0,456966604 | -1,346754272 |
Durbin-Watson d = 1,773469806 | | |
Полученное уравнение не значимо, так как Fнабл = 1,8137 < Fкр = 3,74, найденного по таблице F – распределения при уровне значимости α = 0,05 и числах степеней свободы ν1 =2 и ν1 =14. (таблица № 3.13) Из уравнения следует, что статистически не значимым является и коэффициент регрессии t2 = 1,34675 при tкр =2,145, найденного по таблице t – распределения при α = 0,05 и числе степеней свободы ν1 =14. Таким образом, полученное уравнение регрессии неприемлемо.
Анализ показал, что это уравнение регрессии для практического применения рекомендовано быть не может. В дальнейшем целесообразно рассмотреть все ранее разобранные модели и, выбрать лучшие, как для кластера № 1, так и для кластера № 2.
3.3. Выбор модели для практического применения.
Проанализируем регрессионные модели с позиции статистической надежности для кластера № 1. Для этого необходимо проанализировать таблицу № 3.14. В таблице № 3.14 представлены результаты построения регрессионной модели доходов для кластера № 1 в зависимости от фактора расходы, и регрессионная модель прибыли в зависимости от того же фактора.
Таблица № 3.14. Статистическая оценка параметров многомерной регрессионной модели дохода и прибыли для кластера № 1.
модель | b0 | b1 | F-значение | t | Статистическая | Коэффициент детерминации | Критерий Дарбина- | Относительная ошибка |
| | | | | надежность | R2 | Уотсона d=2 | аппроксимации |
1. | 0,0851 | 0,9525 | 103,080 | 10,15286 | + | 0,86564 | 1,94036 | 0,39487 |
2. | 0,2341 | 0,4403 | 4,67330 | 2,16178 | + | 0,22605 | 1,66180 | 0,85728 |
Fкр (0,05;2;16)=3,63 tкр (0,05;16)=2,120
Для многомерной регрессионной модели № 1:
Y = +0,08518+0,95250*Х2. (3.13)
Для многомерной регрессионной модели № 2:
Y = +0,23409+0,44030*Х2. (3.14)
Таким образом, мы имеем две «хороших» модели, из которых нужно выбрать одну. По статистическим критериям наиболее адекватна модель № 1 (для доходов), несколько худшие показатели адекватности имеет модель № 2 (для прибыли). В модели № 1 наибольшее расчетное значение F – критерия Fнабл = 103,08, в отличие от модели № 2, расчетное значение F – критерия Fнабл = 4,67330. Расчетное значение t = 10,15286 для модели № 1 больше, чем значение t = 2,16178 в м одели № 2. Множественный коэффициент детерминации R2 = 0,86564 в модели № 1, также больше, чем в модели № 2 R2 = 0,22605, и свидетельствует о том, что 86,6% и 22,6% вариации доходов объясняется вошедшими в модели № 1 и № 2 показателем Х2 – расходы. Остальная часть вариации обусловлена действием неучтенных факторов ( Х1 – количество мест, Х3 – посещаемость). Критерий Дарбина – Уотсона не значительно отклоняется от d=2 в модели № 1 и равен 1,94036, в отличие от другой модели № 2, который равен 1,66180.
Относительная ошибка аппроксимации в модели № 1 имеет наименьший показатель 0,3948 < 0,8572, чем в модели № 2. Из всех вышеперечисленных показателей, предпочтение следует отдать модели № 1. Таким образом, после реализации алгоритма пошагового регрессионного анализа в уравнение вошла только одна переменная Х2 – расходы. Для практического применения целесообразно рекомендовать уравнение регрессии № 1:
Y = +0,08518+0,95250*Х2. (3.15)
В соответствии с моделью, Y - представляет собой значение результативного признака, характеризующее среднее для совокупности рассматриваемых цирков значение доходов.
Экономическая интерпретация модели.
В соответствии с моделью № 1, рекомендованной для практического использования следует, что при увеличении расходов на единицу, доход увеличивается 0,95250. Множественный коэффициент детерминации R2 = 0,86564 свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 86,6% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 13,4%.
Проанализируем регрессионные модели с позиции статистической надежности для кластера № 2. Для этого необходимо проанализировать таблицу № 3.15. В таблице № 3.15 представлены результаты построения регрессионной модели доходов для кластера № 2 в зависимости от фактора расходы, а также регрессионная модель прибыли в зависимости от того же фактора.
Таблица № 3.15. Статистическая оценка параметров многомерной регрессионной модели дохода и прибыли для кластера № 2.
модель | b0 | b1 | F-значение | t | Статистическая | Коэффициент детерминации | Критерий Дарбина- | Относительная ошибка |
| | | | | надежность | R2 | Уотсона d=2 | аппроксимации |
1 | -0,3816 | 0,453 | 17,294 | 4,1586 | + | 0,55263 | 1,54055 | 0,25264 |
2 | -0,7773 | -0,456 | 1,813 | -1,6908 | - | 0,11469 | 1,77347 | 0,78613 |
Fкр (0,05;2;14)=3,74 tкр (0,05;14)=2,145
Для многомерной регрессионной модели № 1:
Y = -0,38169+0,45346*Х2. (3.15)
Для многомерной регрессионной модели № 2:
Y = -0,77733-0,45696*Х2. (3.16)
Таким образом, мы имеем две регрессионные модели, из которых нужно выбрать одну. По статистическим критериям наиболее адекватна модель № 1 (для доходов), несколько худшие показатели адекватности имеет модель № 2 (для прибыли). В модели № 1 наибольшее расчетное значение F – критерия Fнабл = 17,294, в отличие от модели № 2, расчетное значение F – критерия Fнабл = 1,813. Расчетное значение t = 4,1586 для модели № 1 больше, чем значение t = 1,6908 в модели № 2. Множественный коэффициент детерминации R2 = 0,5526 в модели № 1, также больше, чем в модели № 2 R2 = 0,1146, и свидетельствует о том, что 55,3% и 11,5% вариации доходов объясняется вошедшими в модели № 1 и № 2 показателем Х2 - расходы. Остальная часть вариации обусловлена действием неучтенных факторов (Х1 – количество мест, Х3 – посещаемость). Критерий Дарбина – Уотсона не значительно отклоняется от d=2 в модели № 1 и равен 1,7734, в отличие от другой модели № 2, который равен 1,5405. Относительная ошибка аппроксимации в модели № 1 имеет наименьший показатель 0,2526 < 0,7861, чем в модели № 2. Из всех вышеперечисленных показателей и на основании статистической не надежности модели №2, предпочтение следует отдать модели № 1. Таким образом, после реализации алгоритма пошагового регрессионного анализа в уравнение вошла только одна переменная Х2 – расходы. Для практического применения целесообразно рекомендовать уравнение регрессии № 1:
Y = -0,38169+0,45346*Х2. (3.17)
В соответствии с моделью, Y - представляет собой значение результативного признака, характеризующее среднее для совокупности рассматриваемых цирков значение доходов.
Экономическая интерпретация модели.
В соответствии с моделью № 1, рекомендованной для практического использования следует, что при увеличении расходов на единицу, доход увеличивается 0,45346. Множественный коэффициент детерминации R2 = 0,5526, свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 55,3% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 44,7%.
Заключение
В результате статистического анализа показателей, характеризующих деятельность цирков Российской Федерации, были сделаны следующие выводы.
Применение кластерного анализа позволило представить статистические данные в виде двух статистически однородных групп, для понимания которых, построены регрессионные модели как для кластера № 1, так и для кластера № 2. Графическое представление результатов кластерного анализа, а также построение регрессионных моделей осуществлялось с помощью ППП “Statistica”.
Применение методов корреляционного и регрессионного анализа, позволило исследовать зависимость доходов от следующих показателей производственно-хозяйственной деятельности: количество мест, расход, посещение и доходы, а также зависимость прибыли от тех же показателей.
Исходные статистические данные для анализа были представлены в приложениях № 5-8. Анализ матрицы парных коэффициентов корреляции позволил оценить тесноту взаимосвязи между факторами, включенными в модель, а также оценить возможность возникновения мультиколлиниарности. Результаты построения регрессионных моделей были представлены в таблицах № 3.2 - 3.15.
Статистическая надежность моделей была оценена с помощью следующих параметров адекватности: множественного коэффициента детерминации, относительной ошибки аппроксимации, расчетным значением F – критерия. Значимость отдельных коэффициентов регрессии была оценена с помощью tкр - критерия.
Для получения уравнения регрессии со значимыми коэффициентами использовался пошаговый алгоритм регрессионного анализа, с исключением переменных. Для оставшихся переменных вновь строились уравнения регрессии.
Таким образом, были получены модели как для кластера № 1, так и для кластера № 2. Проанализировав регрессионные модели с позиции статистической надежности, лучшие из них были рекомендованы для практического применения.
Экономическая интерпретация модели.
Статистический анализ, проделанный в данной работе, показал, что для практического применения целесообразно рекомендовать следующую регрессионную модель для кластера № 1:
Y = +0,08518+0,95250*Х2. (3.18)
В соответствии с моделью, рекомендованной для практического использования, следует, что при увеличении расходов на единицу, доход увеличивается на 0,95250. Множественный коэффициент детерминации R2 = 0,86564 свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 86,6% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 13,4%.
Для кластера № 2, наиболее адекватна следующая регрессионная модель:
Y = -0,38169+0,45346*Х2 . (3.19)
Статистическая оценка параметров данной регрессионной модели позволяет судить о том, что при увеличении расходов на единицу, доход увеличивается на 0,45346. Множественный коэффициент детерминации R2 = 0,5526 свидетельствует о том, что факторы, включенные в окончательную модель, оказывают влияние на 55,3% на доходы, и факторы, не включенные в модель, или же случайные факторы, на 44,7%.
Список литературы
1. С.А. Айвазян, В.С. Мхитарян «Практикум по прикладной статистике и эконометрике» Москва - 1998 г.;
2. В.П. Боровиков, И.П. Боровиков «Statistica. Статистический анализ и обработка данных в среде Windows» Информационно-издательский дом «Филинъ»; Москва, – 1997 г.;
3. Белорусская деловая газета №762 от 04.05.2000г.;
4. Биржа труда No 25(126) статья № 9;
5. Государственный комитет Российской Федерации по статистике «Российский статистический ежегодник» Москва 2000г.
6. Под редакцией А.Г. Гранберга «Статистическое моделирование и прогнозирование» Москва «Финансы и статистика» 1990г.;
7. А.М. Дубров, В.С. Мхитарян, Л.И. Трошин «Многомерные статистические методы»; Москва, «Финансы и статистика», – 1998 г.;
8. А.М. Дубров, И.А. Корнилов. Математические и математико-статистических методы, используемые в курсе «Многомерные статистические методы» Москва 1991г.;
9. М.Р. Ефимова, В.М. Рябцев «Общая теория статистики» Москва «Финансы и статистика» 1991г.;
10. А.Н. Кленин, Л.И. Трошин, К.К. Шевченко «Применение математико-статистических методов в экономических расчетах» Москва 1986 г.;
11. Министерство культуры Российской Федерации главный информационно-вычислительный центр «Концертные организации и коллективы Министерства культуры Российской Федерации. Цирки России в цифрах за 1999 год» Москва 2000 г.;
12. М. Одина «Бодрый советский цирк» Москва 2001г.;
13. Пресс-Релиз «Брифинг Министра культуры России М.Е. Швыдкого Москва» 31.08.2000г.;
14. Под редакцией Р.А. Шмойловой «Теория статистики»; Москва; «Финансы и статистика», – 1998 г.;
15. Russian culture navigator «Российский цирк»
16. И. Терентьева «Цирк дю Солей и его русские артисты» Москва2001г.;
17. И. Устинова «Режиссер для цирка» Москва 2001г.