Обработка статистических данных предприятия

Дипломная работа - Социология

Другие дипломы по предмету Социология

образов позволило разработать метод группировки совокупности единиц одновременно по множеству характеризующих признаков. Такие группировки получили название многомерных.

При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.

Интервал - количественное значение, отделяющее одну единицу (группу) от другой, т. е. интервал очерчивает количественные границы групп.

Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.

Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т.д.

Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблимости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.

При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока оно не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики - выделить эти факты, изучить их.

Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления. На количество выделяемых групп существенное влияние оказывает степень вариации группировочного признака: чем она больше, тем больше следует образовать групп.

Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:

 

n = 1 + 3,322 lg N (1.1),

 

где N - число единиц совокупности;

х max и x min - соответственно наибольший и наименьший варианты признака в исследуемой совокупности равного.

Величина интервала определяется по формуле:

 

 

 

,

где h - величина

 

интервала;

R - разность между наибольшим и наименьшим вариантом признака в исследуемой совокупности;

n - количество групп или интервалов.

1.2 Средние величины

 

Статистическая совокупность содержит некоторое количество статистических величин, имеющих, как правило, разные значения и признаки, что делает невозможным сравнение нескольких совокупностей в целом. Для этой цели применяется средняя величина, как обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса.

Особый вид средних величин - структурные средние - применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен.

В качестве структурных средних чаще всего используют показатели моды и медианы.

Мода - значение признака, которое имеет наибольшую частоту в статистическом ряду распределения.

Отыскание моды производится по-разному, и это зависит от того, представлен ли варьирующий признак в виде дискретного или интервального ряда. Поиск моды в дискретном ряду происходит путем простого просматривания столбца частот. В этом столбце находится наибольшее число, характеризующее наибольшую частоту. Ей соответствует определенное значение признака, которое и является модой. Может оказаться, что два признака имеют одинаковую частоту. В этом случае ряд будет называться бимодальным. В интервальном вариационном ряду модой приближенно считают центральный вариант интервала с наибольшей частотой. В таком ряде распределения мода вычисляется по формуле:

 

(1.3),

где ХMo - нижнее значение модального интервала;

fMo - число наблюдений или объем взвешивающего признака в модальном интервале;

fMo-1 - то же для интервала, предшествующего модальному;

fMo+1 - то же для интервала, следующего за модальным;

?X - величина интервала изменения признака в группах.

Медиана - это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая - большие.

Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного ряда.

В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера медианы по формуле:

 

(1.4),

 

гдеXMe - нижняя граница медианного интервала;- его величина (размах);

- половина от общего числа величин;

- сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;

fMe - число наблюдений или объем взвешивающего признака в медианном интервале.

 

1.3 Ряды динамики

 

Изменение социально-экономических явлений во времени изучается статистикой методом построения и анализа динамических рядов

Ряд динамики - это последовательность упорядоченных во времени количественных статистических величин, характеризующих развити