Курсовая: Статистические ряды распределения

                          ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ                          
                 ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ                 
                             КУРСОВАЯ РАБОТА                             
                                  ПО ДИСЦИПЛИНЕ                                  
                                 л СТАТИСТИКА                                  
     ТЕМА: л СТАТИСТИЧЕСКИЕ РЯДЫ РАСПРЕДЕЛЕНИЯ, ИХ ЗНАЧЕНИЕ И ПРИМЕНЕНИЕ В
СТАТИСТИКЕ 
     Выполнил: студент
группы 01ФФБ
Воробьев В.А.
                                 2003 г.                                 
                               Оглавление:                               
Введение.                                                                      3
1.     Понятие статистических рядов распределения, их виды.          5
1.1. Атрибутивные ряды распределения.                                    6
1.2. Вариационные ряды распределения.                                    7
1.3.  Расчет средних величин                                                   9
1.4. Расчет моды и медианы                                                    10
1.5. Графическое изображение статистических данных             12
1.6. Расчет показателей вариации                                              16
2.     Расчетная часть                                                        18
3.     Аналитическая часть                                                    24
Заключение.                                                                   28
Список литературы                                                             29
                                ВВЕДЕНИЕ.                                
Статистические ряды  распределения являются одним из наиболее важных
элементов  статистики.  Они  представляют  собой  составную часть  метода
статистических сводок и группировок, но, по сути, ни одно из  статистических
исследований  невозможно  произвести,  не представив первоначально
полученную  в результате статистического наблюдения информацию в виде
статистических рядов распределения.
Первичные данные  обрабатываются в целях получения обобщенных характеристик
изучаемого явления по  роду  существенных  признаков для   дальнейшего
осуществления   анализа   и   прогнозирования; производится   сводка   и
группировка;   статистические   данные оформляются с помощью рядов
распределения в таблицы,  в результате чего информация представляется в
наглядном рационально  изложенном виде, удобном   для   использования  и
дальнейшего  исследования; строятся различного   рода   графики   для
наиболее   наглядного восприятия и анализ информации.    На основе
статистических  рядов  распределения   вычисляются основные  величины
статистических    исследований:  индексы, коэффициенты; абсолютные,
относительные, средние величины и т.д., с помощью  которых можно проводить
прогнозирование,  как конечный итог статистических исследований.
Актуальность данной темы обусловлена тем, что  статистические  ряды
распределения  являются базисным методом для  любого  статистического
анализа.  Понимание данного метода   и   навыки   его   использования
необходимы  для проведения статистических исследований.
В теоретической части курсовой  работы рассмотрены следующие аспекты:
1)     Понятие статистических рядов распределения, их виды;
2)     Атрибутивные и вариационные ряды распределения;
3)     Расчет средних величин, моды и медианы;
4)     Графическое представление рядов распределения;
Расчетная часть курсовой работы  включает решение задачи по теме из варианта
расчетного задания:
1.     Работа с таблицей лВыборочные данные о среднегодовой стоимости
основных производственных фондов
Аналитическая часть работы включает в себя расчет средних величин, моды и
медианы на основе данных, представленных в таблице лРезультаты выборочного
бюджетного обследования населения РФ, отображающей распределение населения
РФ по среднедушевому доходу. В качестве источника статистических данных
использован лРоссийский статистический ежегодник. Статистический сборник
2001.
При работе с табличными данными использовался персональный компьютер
конфигурации: процессор Intel Pentium Seleron 848 МГц, 128 Mб ОЗУ, система
Microsoft Windows XP Professional версия 2000, табличный процессор Excel
пакета Microsoft Office 2000.
При написании курсовой работе были использованы учебник базового курса,
дополнительная литература, а также Интернет-ресурсы.
         1.ПОНЯТИЕ СТАТИСТИЧЕСКИХ РЯДОВ РАСПРЕДЕЛЕНИЯ И ИХ ВИДЫ.         
Результаты сводки и группировки материалов статистического наблюдения
оформляются в виде статистических рядов распределения.     Статистические
ряды    распределения    представляют    собой упорядоченное распределение
единиц  изучаемой   совокупности   на группы по    группировочному
(варьирующему)    признаку.    Они характеризуют состав  (структуру)
изучаемого  явления,  позволяют судить об   однородности   совокупности,
границах  ее  изменения, закономерностях развития наблюдаемого объекта. В
зависимости  от  признака статистические ряды распределения делятся на:
- атрибутивные (качественные);
- вариационные (количественные)
а) дискретные;
б) интервальные.
                  1.1. Атрибутивные ряды  распределения                  
Атрибутивные ряды   образуются   по  качественным  признакам, которыми могут
выступать занимаемая должность работников торговли, профессия,  пол,
образование  и т.д.
                                                                      Таблица 1.
     Распределение работников предприятия по образованию.
     

Образование работников

Количество работников

абсолютное

в % к итогу

высшее 20 15,4
неполное высшее 25 19,2
среднее специальное 35 26,9
среднее 50 38,5

ИТОГО

130

100

В данном примере группировочным признаком выступает образование работников предприятия (высшее, среднее). Данные ряды распределения являются атрибутивными, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число составляют работники со средним образованием (порядка 40%); остальные работники распределяются на группы по данному качественному признаку: со средним специальным образованием - 25%; с неполным высшим - 20%; с высшим - 15%. 1.2. Вариационные ряды распределения Вариационные ряды строятся на основе количественного группировочного признака. Вариационные ряды состоят из двух элементов: вариант и частот. Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот называется объемом совокупности и определяет число элементов всей совокупности. Частости Ц это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений. Вариационные ряды в зависимости от характера вариации подразделяются на дискретные (прерывные) и интервальные (непрерывные). Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье). Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала. При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование Ц расположение всех вариантов в возрастающем (убывающем) порядке. Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака , а затем подсчитывается частота повторения варианта . Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты. Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности. 1.3. Расчет средних величин. Как правило, средние величины рассчитываются для получения обобщенных количественных характеристик уровня какого либо варьирующего признака по совокупности однородных по основным свойствам единиц конкретного явления или процесса. В статистике все средние величины обозначаются как `X. Существует несколько видов средних величин. Основной средней величиной является средняя степенная. Она имеет следующий вид: (1) , где `Х - средняя величина; X - меняющаяся величина признака варианты; n - число признаков или вариант; m - показатель степени средней. В зависимости от величины показателя степени средней она принимает следующие виды: а). Средняя арифметическая невзвешенная, где m = 1. Она имеет вид: (2) б). Средняя арифметическая взвешенная. Она имеет вид: (3) где f - частоты или веса 1.4. Расчет моды и медианы. Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана. Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту. В интервальном ряду распределения мода находится по следующей формуле: (4) , где: минимальная граница модального интервала; - величина модального интервала; {частоты модального интервала, предшествующего и следующего за ним Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д. Медиана - варианта, находящаяся в середине ряда распределения. Медиана делит ряд на две равные (по числу единиц) части Ц со значениями признака меньше медианы и со значениями признака больше медианы. В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле: (5) , где - варианты, находящиеся в середине ряда В интервальном ряду распределения медиана рассчитывается следующим образом: (6) , где: - нижняя граница медианного интервала; - величина медианного интервала; - полусумма частот ряда; - сумма накопленных частот, предшествующих медианному интервалу; - частота медианного интервала. Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности. Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства Ц сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая: Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного расположения частот вариационного ряда. 1.5. Графическое изображение статистических данных Ряды распределения удобно изучать с помощью графического метода. Статистический график Ц это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным. Это, однако, вовсе не означает, что графики имеют лишь иллюстративное значение. Они дают новое знание о предмете исследования, являясь методом обобщения исходной информации. Значение графического метода в анализе и обобщении данных велико. Графическое изображение позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры явлений, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравнительные характеристики и отчетливо виды основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу. Таблица 2.

1995

1996

1997

1998

1999

2000

Валовой внутренний продукт

в рыночных ценах

1 428,5

2 007,8

2 342,5

2 629,6

4 823,2

7 305,6

*Номинальный объем произведенного ВВП в текущих ценах, млрд. рублей, до 1998г. - трлн. рублей[1] Рис.1. График динамики произведенного объема ВВП. Для изображения и внесения суждений о развитии явления во времени и составе совокупности наряду с графиками строятся диаграммы. Используются диаграммы: столбиковые, ленточные, квадратные, круговые, линейные, радикальные и др. Выбор вида диаграммы зависит в основном от особенностей исходных данных, цели исследования. Например, если имеется ряд динамики с несколькими неравноотносящимися уровнями во времени (1913, 1940, 1950, 1980, 1985, 1997 гг.), то часто для наглядности используют столбиковые, квадратные или круговые диаграммы. Они зрительно впечатляют, хорошо запоминаются, но не годны для изображения большого числа уровней, так как громоздки. Когда число уровней в ряду динамики велико, целесообразно применять линейные диаграммы, которые воспроизводят непрерывность процесса развития в виде непрерывной ломанной линии. Кроме того, линейные диаграммы удобно использовать: если целью исследования является изображение общей тенденции и характера развития явления; когда на одном графике необходимо изобразить несколько динамических рядов с целью их сравнения; если наиболее существенным является сопоставление темпов роста, а не уровней. Основное назначение структурных диаграмм заключается в графическом представлении состава статистических совокупностей, характеризующихся как соотношение различных частей каждой из совокупностей. Состав статистической совокупности графически может быть представлен с помощью как абсолютных, так и относительных показателей. В первом случае не только размеры отдельных частей, но и размер графика в целом определяются статистическими величинами и измеряются в соответствии с изменениями последних. Во втором Ц размер всего графика не меняется (так как сумма всех частей любой совокупности составляет 100%), а меняются только размеры отдельных его частей. Графическое изображение состава совокупности по абсолютным и относительным показателям способствует проведению более глубокого анализа и позволяет проводить международные сопоставления и сравнения социально Ц экономических явлений. В качестве графического образа для изображения структуры совокупностей применяются прямоугольники Ц для построения столбиковых и полосовых диаграмм и круги Ц для построения секторных диаграмм. Рис. 2 Распределение работников предприятия по образованию. Круговая диаграмма. Рис. 3. Распределение работников предприятия по образованию. Гистограмма. 1.6. Расчет показателей вариации. Вариация Ц это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности. Существует несколько видов показателей вариации: а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака: R = Xmax Ц Xmin Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. б) Среднее линейное отклонение (7) - невзвешенное; (8) - взвешенное, где: Х - варианты; `Х - средняя величина; n - число признаков; f - частоты. Линейное отклонение учитывает различия всех единиц изучаемой совокупности. в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора. (9) - невзвешенная; (10) - взвешенная. Показатель дисперсии более объективно отражает меру вариации на практике. г) Среднее квадратическое отклонение (11) - взвешенное; (12) - невзвешенное. Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность. д) Показатель вариации. (13) Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах. Рассмотрим методику построения интервального ряда распределения и его применение на примере, представленном в расчетной части данной работы. 2. Расчетная часть Задание 5 По первичным данным, представленным в таблице 5.2: 1. Постройте статистический ряд распределения предприятий по среднегодовой стоимости основных производственных фондов, образовав четыре группы предприятий с равными интервалами, охарактеризовав их числом предприятий и удельным весом предприятий. 2. Рассчитайте обобщающие показатели ряда распределения: а) Среднегодовую стоимость основных производственных фондов, взвешивая значения признака по абсолютной численности предприятий и их удельному весу; б) Моду и медиану в) Постройте графики ряда распределения и определите на них значение моды и медианы. Таблица 5.2
№ п/пСреднегодовая стоимость основных производственных фондов, млн. рубВыпуск продукции, млн. руб
А12
12721
24627
33341
43530
54147
64242
75334
85557
96046
104648
113945
124543
135748
145660
153635
164740
172024
182936
192619
204939
213835
223734
235661
244950
253738
263330
275551
284446
294138
302835
Решение: 1.Определим длину интервала по формуле: е=(хmax Ц xmin)/k, где k Ц число выделенных интервалов е=(60-20)/4=10 Образуются группы: 20-30, 30-40, 40-50, 50-60. Рассчитываем характеристику ряда распределения предприятий по среднегодовой стоимости основных производственных фондов, для этого составим расчетную таблицу: Таблица 3.
№ группы

Группировка предприятий

по среднегодовой стоимости

№ предприятия

Среднегодовая стоимость

основных фондов

120-30127
1720
1829
1926
3028
230-40333
435
1139
1536
2138
2237
2537
340-50246
541
642
1046
1245
1647
2049
2449
2844
2841
450-60753
855
960
1357
1456
2356
2755
2. Для расчета данных таблицы используем табличный процессор Microsoft Excel пакета Microsoft Office 2000. Таблица 4. Шаблон выходной таблицы

Группировка предприятий

по среднегодовой стоимости

Число предприятий,

f

Удельный вес

предприятий, %

d

Середина

интервала, X

XfXd
20-305=C76/C$80*10025=E76*C76=E76*D76/D$80
30-408=C77/C$80*10035=E77*C77=E77*D77/D$80
40-5010=C78/C$80*10045=E78*C78=E78*D78/D$80
50-607=C79/C$80*10055=E79*C79=E79*D79/D$80
Итого=СУММ(C76:C79)=СУММ(D76:D79)

=СУММ(F76:F79)

=СУММ(G76:G79)

Таблица 5. Итоговая таблица

Группировка предприятий

по среднегодовой стоимости

Число предприятий,

f

Удельный вес

предприятий, %

d

Середина

интервала, X

XfXd
20-30516,7251254,175
30-40826,7352809,345
40-501033,34545014,985
50-60723,35538512,815
Итого 30100124041,32
а) Средняя арифметическая взвешенная: Получаем = 1240/30 =41,34 (млн. руб) Заменяя проценты коэффициентами (åd=1), получаем: = 41,32 (млн. руб) б) Моду находим по формуле: (4) = 40+10 *(10-8/ 10-8)+(10-7)) =44 Медиану находим по формуле: N= 30 30+1/2 = 15.5 (x15, x16) (5) = 40+10*(0.5*30-13/ 10)) = 42 (млн. руб.) в) Построим график ряда распределения: Рис. 4. Среднегодовая стоимость основных производственных фондов 3. Аналитическая часть. В результате обобщения итогов выборочного бюджетного обследования населения РФ построен вариационный интервальный ряд, отражающий распределение жителей Российской Федерации по величине среднедушевого дохода. Таблица 6.
Все население, млн. чел.145.6в % к итогу,
Со среднедушевыми доходами в месяц:
До 5004,53,1
500-75010,57,2
750-100014,39,8
1000-150030,120,7
1500-200024,717,0
2000-300030,721,1
3000-400014,910,2
Свыше 4000,015,910,9
Итого100
*Российский статистический ежегодник. Статистический сборник 2001. 1. Рассчитать обобщающие показатели ряда распределения: а) Среднюю арифметическую взвешенную в абсолютном выражении и по удельному весу. б) Моду и медиану в) Построить график ряда распределения . Решение: 1.Для расчетов необходимо выразить варианты одним числом. Преобразуем интервальный ряд в дискретный, принимая величину интервала первой группы равной величине интервала второй группы, а величину интервала поледней группы равной величине интервала предыдущей группы. Строим расчетную таблицу: Рис.5. Шаблон выходной таблицы Таблица 7. Таблица с результирующими данными.
Группировка по величине среднедушевого доходаВсе население, млн. чел., в % к итогу,Середина интервала,

f

d

X

xfxd
250- 500,04,53,13751687,51162,5
500,1-750,010,57,26256562,54500
750,1-1000,014,39,887512512,58575
1000,1-1500,030,120,712503762525875
1500,1-2000,024,71717504322529750
2000,1-3000,030,721,125007675052750
3000,1-400014,910,235005215035700
4000,1 Ц5000,015,910,945007155049050
Итого145,6100302063207363
а) Средняя арифметическая взвешенная: Получаем = 302063/145,6 =2047,6 (руб) б) Получаем = 207363/100 = 2073,63 (руб) в) Моду находим по формуле: = 2000+1000 *(30,7-24,7)/(30,7-24,7)+(30,7-14,9)) =2275,23 (руб) - наибольшее число жителей РФ имеют среднедушевой доход в интервале 2000-3000 (руб), который и является модальным. Медиану находим по формуле: Медиана дискретного вариационного ряда определяется по сумме накопленных частот, которая должна превышать половину всего объема единиц совокупности: 145,6/2 = 72,8 cum (f) =4,5+10,5+14,3+30,1+24,7= 84,1 Цследовательно, медианный интервал 1500-2000 (руб). (5) = 1500+500*(0.5*145,6-59,4/24,7)) = 1771,25 (руб.) Ц таким образом, половина данной совокупности имеет среднедушевой доход ниже 1771, 25 руб., а половина Ц выше. в) Построим график ряда распределения: Рис.6. Диаграмма. Заключение Итак, статистические ряды распределения представляют собой один из наиболее важных элементов статистического исследования. Статистические ряды распределения являются базисным методом для любого статистического анализа. Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий. Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики. Статистические методы используют комплексно (системно). Выделяют три основные стадии экономико-статистического исследования: сбор первичной статистической информации, статистическая сводка и обработка первичной информации, обобщение и интепретация статистической информации. Качество, достоверность статистической информации определяют эффективность использования статистики на любом уровне и в любой сфере. В настоящее время ведется работа по совершенствованию статистической методологии и завершению перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями развития рыночной экономики. Список использованной литературы. 1. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: лИнфра-М 1998г. 2. Гусаров В.М. Теория статистики: - М.: лАудит, л ЮНИТИ 1998г. 3. Теория статистики: Учебник под редакцией профессора Шамойловой Р.А. - М.: лФинансы и статистика 1998г. 4. Практикум по статистике: Учебное пособие для вузов/ под редакцией В.М. Симчеры/ВЗФЭИ.-М.: ЗАО лФинстатинформ, 1999. 5. Общая теория статистики:/Статистическая методология в коммерческой деятельности: учебник для вузов/под редакцией А.С. Спирина и О.Е. Башиной. Ц М.: Финансы и статистика, 1994. 6. Российский статистический ежегодник 2002. Статистический сборник. Госкомстат 7. Сироткина Т.С., Каманина А.М. Основы теории статистики: учебное пособие. Ц М.: АО лФинстатинформ, 1995. 8. Ряузов Н.Н. Общая теория статистики: Учебник для вузов.-М.: Финансы и статистика, 1984.
[1] Источник: официальный сайт Государственного Комитета по Статистике www://gks.ru