1. Статистический анализ показателей, характеризующих деятельность цирков Российской Федерации
Вид материала | Реферат |
СодержаниеКоличество зрителей * 100% = % посещения. (3.1) Количество мест * количество представлений |
- Тема курсовой работы, 22.7kb.
- Тенденции формирования социальной структуры российского общества на современном этапе, 447.36kb.
- Агентство Республики Казахстан по статистике Департамент статистики труда и уровня, 317.93kb.
- Методика аудиторской проверки учета кассовых операций студентки 5 курса Факультет:, 530.73kb.
- Стратегия государственной молодежной политики в российской федерации (Министерство, 484.32kb.
- Бакалаврская программа № 521200 Кафедра: Социологии Направление : Социология Дисциплина, 188.47kb.
- Институт, 132.47kb.
- Статистический отчет ежегодный документ Ежегодный статистический отчет составляется, 2030.09kb.
- Всистеме показателей, характеризующих эффективность производства и реализации, одно, 317.59kb.
- Всистеме показателей, характеризующих эффективность производства и реализации, одно, 49.75kb.
Количество зрителей * 100% = % посещения. (3.1)
Количество мест * количество представлений
Данная формула применяется для расчета посещаемости в бухгалтерском учете Росгосцирка.
Следовательно, фактор количество зрителей и количество представлений нецелесообразно включать в регрессионную модель, так как возникает опасность мультиколлинеарности и, как следствие, статистической не надежности модели. Фактор количество мест решено включить в модель из экономических соображений. Построение уравнения регрессии предполагает решение двух основных задач.
Первая задача заключается в выборе независимых переменных, в нашем примере расход, количество мест, посещение, оказывающих существенное влияние на зависимую переменную (доход), а также в определении вида уравнения регрессии.
Вторая задача построения уравнения регрессии – оценивание параметров уравнения. Она решается с помощью того или иного математико-статистического метода обработки данных.
Для анализа статистически данных был применен пакет прикладных программ Статистика 5,0 - ППП “Statistica”. Переменные, которые будут использоваться в многомерном статистическом анализе, имеют различные единицы измерения. Поэтому перед проведением статистического анализа данные стандартизировались, то есть приводились к единой шкале измерений.
В пакете прикладных программ Статистика 5,0, команда Standardize Rows Columns (стандартизация строк), позволяет выполнить стандартизацию значений в каждой строке выделенного блока. Значения переменных в блоке изменяются на стандартизированные, которые вычисляются по следующей формуле (3.2):
новое значение = (старое значение – среднее в выделенной строке)/стандартное отклонение,
t = x – x . (3.2)
s
Далее, с целью получения однородных статистических совокупностей, был проведен кластерный анализ.
Кластерный анализ - это общее название множества вычислительных процедур, используемых при создании классификации. Это многомерная статистическая процедура, выполняющая сбор данных, содержащая информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы.
В качестве расстояния между объектами принимались различные расстояния, обычное евклидово расстояние, взвешенное евклидового расстояния. При объединении в группы в кластерном анализе были рассмотрены дендограммы (приложение № 4.) сделанные, двумя иерархическими методами: методом дальнего соседа (Complete Linkage) и методом Уорда (Ward's method).
Графическое представление результатов кластерного анализа будет осуществляться с помощью ППП “Statistica”. Кластерный анализ проводится в одном, выше рассмотренном, статистическом пакете прикладных программ. Все дендограммы представлены в приложении № 4.
Таким образом, используя несколько алгоритмов кластерного анализа, отдадим предпочтение разбиению на два кластера методом Уорда. В методе «Уорда» в данной дипломной работе будет применяться взвешенное евклидовое расстояние.
На рис. 3.1 представлена дендограмма классификации городов на основе взвешенного евклидового расстояния и принципа Уорда.

Рис. 3.1. Дендограмма. Классификация городов на основе взвешенного евклидового расстояния и принципа Уорда.
Классификация проводилась по различным алгоритмам кластерного анализа, но наилучшими в содержательном плане оказались результаты, полученные методом Уорда при разбиении на два кластера, первый: состоящий из 18 городов, и второй: из 16 городов.
Таким образом, были получены две статистически однородные группы. В нашем примере, следует остановиться на применении именно этого метода, как наилучшего варианта классификации. Результаты кластерного анализа представлены в таблице № 3.1.
Таблица № 3.1. Города, вошедшие в первый и второй кластеры.
№ п/п | 1 кластер | № п/п | 2 кластер |
1 | Владивосток | 1 | Астрахань |
2 | Волгоград | 2 | Брянск |
3 | Воронеж | 3 | Иваново |
4 | Иркутск | 4 | Кемерово |
5 | Краснодар | 5 | Киров |
6 | Красноярск | 6 | Кисловодск |
7 | Тверь | 7 | Кострома |
8 | Екатеринбург | 8 | Курск |
9 | Самара | 9 | Сочи |
10 | Новосибирск | 10 | Магнитогорск |
11 | Омск | 11 | Нижний Тагил |
12 | Пермь | 12 | Новокузнецк |
13 | Ростов Дон | 13 | Оренбург |
14 | Рязань | 14 | Пенза |
15 | Саратов | 15 | Ставрополь |
16 | Тула | 16 | Тюмень |
17 | Челябинск | | |
18 | Ярославль | | |