1. Статистический анализ показателей, характеризующих деятельность цирков Российской Федерации

Вид материала

Реферат

Содержание

Количество зрителей * 100% = % посещения. (3.1) Количество мест * количество представлений

Подобный материал:

Тема курсовой работы, 22.7kb.
Тенденции формирования социальной структуры российского общества на современном этапе, 447.36kb.
Агентство Республики Казахстан по статистике Департамент статистики труда и уровня, 317.93kb.
Методика аудиторской проверки учета кассовых операций студентки 5 курса Факультет:, 530.73kb.
Стратегия государственной молодежной политики в российской федерации (Министерство, 484.32kb.
Бакалаврская программа № 521200 Кафедра: Социологии Направление : Социология Дисциплина, 188.47kb.
Институт, 132.47kb.
Статистический отчет ежегодный документ Ежегодный статистический отчет составляется, 2030.09kb.
Всистеме показателей, характеризующих эффективность производства и реализации, одно, 317.59kb.
Всистеме показателей, характеризующих эффективность производства и реализации, одно, 49.75kb.

1 2 3 4 5 6

Количество зрителей * 100% = % посещения. (3.1)

Количество мест * количество представлений

Данная формула применяется для расчета посещаемости в бухгалтерском учете Росгосцирка.

Следовательно, фактор количество зрителей и количество представлений нецелесообразно включать в регрессионную модель, так как возникает опасность мультиколлинеарности и, как следствие, статистической не надежности модели. Фактор количество мест решено включить в модель из экономических соображений. Построение уравнения регрессии предполагает решение двух основных задач.

Первая задача заключается в выборе независимых переменных, в нашем примере расход, количество мест, посещение, оказывающих существенное влияние на зависимую переменную (доход), а также в определении вида уравнения регрессии.

Вторая задача построения уравнения регрессии – оценивание параметров уравнения. Она решается с помощью того или иного математико-статистического метода обработки данных.

Для анализа статистически данных был применен пакет прикладных программ Статистика 5,0 - ППП “Statistica”. Переменные, которые будут использоваться в многомерном статистическом анализе, имеют различные единицы измерения. Поэтому перед проведением статистического анализа данные стандартизировались, то есть приводились к единой шкале измерений.

В пакете прикладных программ Статистика 5,0, команда Standardize Rows Columns (стандартизация строк), позволяет выполнить стандартизацию значений в каждой строке выделенного блока. Значения переменных в блоке изменяются на стандартизированные, которые вычисляются по следующей формуле (3.2):

новое значение = (старое значение – среднее в выделенной строке)/стандартное отклонение,

t = x – x . (3.2)

s

Далее, с целью получения однородных статистических совокупностей, был проведен кластерный анализ.

Кластерный анализ - это общее название множества вычислительных процедур, используемых при создании классификации. Это многомерная статистическая процедура, выполняющая сбор данных, содержащая информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы.

В качестве расстояния между объектами принимались различные расстояния, обычное евклидово расстояние, взвешенное евклидового расстояния. При объединении в группы в кластерном анализе были рассмотрены дендограммы (приложение № 4.) сделанные, двумя иерархическими методами: методом дальнего соседа (Complete Linkage) и методом Уорда (Ward's method).

Графическое представление результатов кластерного анализа будет осуществляться с помощью ППП “Statistica”. Кластерный анализ проводится в одном, выше рассмотренном, статистическом пакете прикладных программ. Все дендограммы представлены в приложении № 4.

Таким образом, используя несколько алгоритмов кластерного анализа, отдадим предпочтение разбиению на два кластера методом Уорда. В методе «Уорда» в данной дипломной работе будет применяться взвешенное евклидовое расстояние.

На рис. 3.1 представлена дендограмма классификации городов на основе взвешенного евклидового расстояния и принципа Уорда.

Рис. 3.1. Дендограмма. Классификация городов на основе взвешенного евклидового расстояния и принципа Уорда.

Классификация проводилась по различным алгоритмам кластерного анализа, но наилучшими в содержательном плане оказались результаты, полученные методом Уорда при разбиении на два кластера, первый: состоящий из 18 городов, и второй: из 16 городов.

Таким образом, были получены две статистически однородные группы. В нашем примере, следует остановиться на применении именно этого метода, как наилучшего варианта классификации. Результаты кластерного анализа представлены в таблице № 3.1.

Таблица № 3.1. Города, вошедшие в первый и второй кластеры.

№ п/п	1 кластер	№ п/п	2 кластер
1	Владивосток	1	Астрахань
2	Волгоград	2	Брянск
3	Воронеж	3	Иваново
4	Иркутск	4	Кемерово
5	Краснодар	5	Киров
6	Красноярск	6	Кисловодск
7	Тверь	7	Кострома
8	Екатеринбург	8	Курск
9	Самара	9	Сочи
10	Новосибирск	10	Магнитогорск
11	Омск	11	Нижний Тагил
12	Пермь	12	Новокузнецк
13	Ростов Дон	13	Оренбург
14	Рязань	14	Пенза
15	Саратов	15	Ставрополь
16	Тула	16	Тюмень
17	Челябинск
18	Ярославль

1. Статистический анализ показателей, характеризующих деятельность цирков Российской Федерации

Содержание

Количество зрителей * 100% = % посещения. (3.1)

Количество мест * количество представлений

Воронеж

Иваново

Самара