1. Статистический анализ показателей, характеризующих деятельность цирков Российской Федерации

Вид материалаРеферат

Содержание


Количество зрителей * 100% = % посещения. (3.1) Количество мест * количество представлений
Подобный материал:
1   2   3   4   5   6

Количество зрителей * 100% = % посещения. (3.1)

Количество мест * количество представлений


Данная формула применяется для расчета посещаемости в бухгалтерском учете Росгосцирка.

Следовательно, фактор количество зрителей и количество представлений нецелесообразно включать в регрессионную модель, так как возникает опасность мультиколлинеарности и, как следствие, статистической не надежности модели. Фактор количество мест решено включить в модель из экономических соображений. Построение уравнения регрессии предполагает решение двух основных задач.

Первая задача заключается в выборе независимых переменных, в нашем примере расход, количество мест, посещение, оказывающих существенное влияние на зависимую переменную (доход), а также в определении вида уравнения регрессии.

Вторая задача построения уравнения регрессии – оценивание параметров уравнения. Она решается с помощью того или иного математико-статистического метода обработки данных.

Для анализа статистически данных был применен пакет прикладных программ Статистика 5,0 - ППП “Statistica”. Переменные, которые будут использоваться в многомерном статистическом анализе, имеют различные единицы измерения. Поэтому перед проведением статистического анализа данные стандартизировались, то есть приводились к единой шкале измерений.

В пакете прикладных программ Статистика 5,0, команда Standardize Rows Columns (стандартизация строк), позволяет выполнить стандартизацию значений в каждой строке выделенного блока. Значения переменных в блоке изменяются на стандартизированные, которые вычисляются по следующей формуле (3.2):

новое значение = (старое значение – среднее в выделенной строке)/стандартное отклонение,

t = xx . (3.2)

s

Далее, с целью получения однородных статистических совокупностей, был проведен кластерный анализ.

Кластерный анализ - это общее название множества вычислительных процедур, используемых при создании классификации. Это многомерная статистическая процедура, выполняющая сбор данных, содержащая информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы.

В качестве расстояния между объектами принимались различные расстояния, обычное евклидово расстояние, взвешенное евклидового расстояния. При объединении в группы в кластерном анализе были рассмотрены дендограммы (приложение № 4.) сделанные, двумя иерархическими методами: методом дальнего соседа (Complete Linkage) и методом Уорда (Ward's method).

Графическое представление результатов кластерного анализа будет осуществляться с помощью ППП “Statistica”. Кластерный анализ проводится в одном, выше рассмотренном, статистическом пакете прикладных программ. Все дендограммы представлены в приложении № 4.

Таким образом, используя несколько алгоритмов кластерного анализа, отдадим предпочтение разбиению на два кластера методом Уорда. В методе «Уорда» в данной дипломной работе будет применяться взвешенное евклидовое расстояние.

На рис. 3.1 представлена дендограмма классификации городов на основе взвешенного евклидового расстояния и принципа Уорда.



Рис. 3.1. Дендограмма. Классификация городов на основе взвешенного евклидового расстояния и принципа Уорда.

Классификация проводилась по различным алгоритмам кластерного анализа, но наилучшими в содержательном плане оказались результаты, полученные методом Уорда при разбиении на два кластера, первый: состоящий из 18 городов, и второй: из 16 городов.

Таким образом, были получены две статистически однородные группы. В нашем примере, следует остановиться на применении именно этого метода, как наилучшего варианта классификации. Результаты кластерного анализа представлены в таблице № 3.1.


Таблица № 3.1. Города, вошедшие в первый и второй кластеры.


№ п/п

1 кластер

№ п/п

2 кластер

1

Владивосток

1

Астрахань

2

Волгоград

2

Брянск

3

Воронеж


3

Иваново


4

Иркутск

4

Кемерово

5

Краснодар

5

Киров

6

Красноярск

6

Кисловодск

7

Тверь

7

Кострома

8

Екатеринбург

8

Курск

9

Самара


9

Сочи

10

Новосибирск

10

Магнитогорск

11

Омск

11

Нижний Тагил

12

Пермь

12

Новокузнецк

13

Ростов Дон

13

Оренбург

14

Рязань

14

Пенза

15

Саратов

15

Ставрополь

16

Тула

16

Тюмень

17

Челябинск







18

Ярославль