А. В. Бессалов общая теория статистики курс лекций

Вид материалаКурс лекций

Содержание


Тема 1. Основные понятия статистики
1.2. Статистические закономерности. Закон больших чисел
1.3. Статистическое наблюдение
1.4. Статистические показатели
2.1. Виды статистических группировок
2.2. Выбор интервалов группирования
2.3. Ряды распределения
Таблица 2.4 (млн. грн.)
Контрольные вопросы
Подобный материал:
А.В. Бессалов

ОБЩАЯ ТЕОРИЯ СТАТИСТИКИ


Курс лекций для студентов

экономических высших учебных

заведений


Киев - 1999


ББК 60.6я73

К56


Бессалов А.В.

К56 Общая теория статистики: Курс лекций. – К.: Наша справа, 1999. - с.


ISBN 966-529-035-5


Учебное пособие представляет собой краткий курс лекций по общей теории статистики. В нем рассмотрены характеристики и параметры выборочного наблюдения массовых социально-экономических явлений, модели и корреляционно- регрессионный анализ статистически связанных явлений, ряды динамики, индексы. Теоретический материал всех тем сопровождается примерами расчета, помогающими уяснить целевую и прикладную значимость предмета. Каждая тема завершается задачами для закрепления материала и подготовки к практическим занятиям, а также контрольными вопросами для самопроверки.

Пособие предназначено для студентов экономических вузов.


Введение



Сегодня понятие “cтатистика” - одно из самых широко употребляемых на работе и в быту. Когда мы говорим об уровне жизни, цен, преступности, инфляции и т.д. – мы пользуемся статистическими данными. Зная, что во время эпидемии гриппа заболевает каждый, например, десятый, мы делаем все возможное, чтобы попасть в “девятку”. Желая быть и здоровыми, и богатыми, мы стараемся набрать больше сведений о том, что ведет к успеху, после чего вырабатываем свою тактику и стратегию. Говорят, что лишь в искусстве нельзя опираться на статистику, хотя и это весьма условно: таланты и гении всегда признавались на основе большинства экспертных оценок (если не вчера, то сегодня или завтра).

Жизнь каждого человека и общества в целом просто немыслима без информации и важной ее части – статистики. В экономике на всех уровнях (от фирмы до отрасли) все важнейшие показатели (ресурсы, производительность, оборот, спрос и предложение, рентабельность и т.д.) основаны на использовании статистических данных. Управление (сейчас чаще говорят – менеджмент) предприятием или государством предполагает принятие решений, необходимым образом учитывающих статистический анализ.

Термин “статистика” возник в XVIII веке и был связан с изучением особенностей государств, а его происхождение обязано латинским словам “stato” – государство и “statista” – знаток государства. Ныне это понятие имеет несколько значений. Им определяют практику сбора и обработки данных о массовых явлениях, науку о методах обработки данных и, наконец, одну из характеристик математической статистики. В то время как наука – статистика занимается лишь анализом, построением моделей и выработкой рекомендаций или прогнозов, ее применение может быть (и нередко бывает) тенденциозным. Не случайно возник известный афоризм: “Есть просто ложь, наглая ложь и статистика” (принадлежит английскому политику Б.Дизраэли (1804-1881)). Наука-статистика не несет ответственности за статистику-политику.

Знание методологии статистики сегодня стало бесспорно необходимым грамотному менеджеру для принятия обоснованных и просчитанных решений. Любой бизнес-план или инвестиционный проект опирается на многочисленные исходные данные, характеризующие состояние рынка и его тренды. Умение строить математические модели экономических процессов позволяет с большей надежностью прогнозировать будущие доходы. Справедливо и обратное: неграмотные решения и действия влекут банкротство и экономическое фиаско.

Задачей настоящего пособия является введение студентов в круг наиболее общих понятий теории статистики. Сегодня имеется достаточно широкий список литературы (приведен в конце пособия), полезный для более глубокого изучения предмета. Кроме того, наряду с общей теорией статистики, нацеленной на общие методологические вопросы, существуют курсы прикладной статистики (статистика финансов, страхования, здравоохранения и т.д.). Их методологической основой является, разумеется, общая теория статистики.

Курс лекций включает материал 8 тем. Первые 4 темы содержат основные понятия стактистики: выборочное наблюдение, статистические показатели, группировка, ряды распределения, параметры средних величин и вариации. Эти понятия являютя базовыми для изучения следующих двух более сложных тем: ошибок выборочного наблюдения и анализа статистической взаимосвязи между явлениями. Эти темы весьма важны при финансово-экономических расчетах и прогнозировании. Заключительные темы 7 и 8 рассматривают важные на практике понятия динамических рядов и индексов.




Тема 1. Основные понятия статистики



1.1. Предмет общей теории статистики


Статистика – это наука, изучающая количественные (статистические) закономерности массовых социально-экономических явлений. Ее основными методами являются:
  • массовое наблюдение (сбор данных);
  • сводка и группировка (первичная обработка данных);
  • оценка показателей , проверка гипотез, построение моделей.

Сразу заметим, что в отличие от математической статистики, объектами которой могут быть физические или абстрактные предметы и явления, общая теория статистики изучает общественные явления. В математической статистике событие называют случайным, если оно обладает двумя свойствами: массовостью и статистической устойчивостью. Общественные явления вторым свойством, как правило, не обладают. Жизнь человека и общества весьма динамична и сложна, что часто разрушает прогнозы. Тем не менее это не исключает проблему прогнозирования, а лишь усложняет процесс построения и тестирования моделей.

Несмотря на специфику предмета изучения, общая теория статистики в основном использует те же методы, что и математическая статистика. Любая теория дает корректные (адекватные практике) результаты лишь в рамках своей аксиоматики (принятых условий и допущений). Поскольку жизнь, как отмечалось, сложней любой схемы или модели, даже строгая методология может дать неверные результаты. Но, как мудро заметил Эйнштейн: “Если вовсе не грешить против разума, нельзя вообще ни к чему прийти”. Поэтому, строя математические модели общественных явлений, нужно быть весьма осмотрительным в их применении и выводах, привлекая максимально возможную долю скепсиса. Если модель плоха, ее следует отвергнуть и строить новую, учитывающую также другие существенные факторы.

Статистику часто называют наукой “о среднем”. Действительно, оператор усреднения используется при определении практически всех статистических параметров. В статистике изучаются синтетические показатели:
  • ряды распределения (полигоны, гистограммы);
  • средние величины и вариации;
  • ошибки оценивания выборочного наблюдения;
  • измерение статистических взаимосвязей (регрессионный анализ);
  • ряды динамики;
  • индексы.

Корреляционно-регрессионный анализ взаимосвязей экономических явлений в последние десятилетия выделился в отдельную дисциплину – эконометрику. Ее основным предметом является построение и анализ многофакторных моделей в экономике. В данном пособии эти модели рассматриваются в одной главе.

Итак, статистика занимается сбором данных о массовых явлениях, их обработкой и анализом, и, наконец, выработкой рекомендаций для принятия решений. Конечно, эти рекомендации не обязательно отвечают правильному в данных условиях решению (существуют, несомненно, интуиция и просто опыт), однако чаще всего (статистически) они полезны и даже необходимы. Нельзя, например, выпускать лекарство без многочисленных испытаний его воздействия на организм и установления противопоказаний. Если оно поможет лишь одному из 10 больных, его, очевидно, следует отвергнуть. При вложении инвестиций в крупный проект анализ расходов и доходов требует учета множества статистических данных и факторов. Чем грамотнее решения – тем меньше потери, тем богаче страна.


1.2. Статистические закономерности. Закон больших чисел


Поставим вопросы: влияет ли погода на урожайность, реклама на торговлю, экология на здоровье, солнечная активность на преступность? Наш жизненный опыт и статистика дают положительные ответы. Даже на уровне жизненного опыта наши суждения базируются на многократной повторяемости известных явлений. Самолеты разбивались? Шахтеры гибли? Маньяки убивали? Да. И, к сожалению, будут. И это надо знать и быть умнее.

Не всегда, однако, достаточно просто жизненного опыта. В сложных экономических системах часто ожидаемые результаты не очевидны. Приведем пример. Рыбаки Камчатки столкнулись с дилеммой: бросать чаще глубоководные сети или мелководные? В первом случае улов сравнительно редкий, но рыба ценная. Во втором, наоборот, успешные забросы часты, но рыба дешевая. Какова должна быть стратегия для максимизации доходов? Пригласили математиков – специалистов по теории массового обслуживания. Два месяца математики набирали статистику уловов, после чего вручили капитану колоду карт с рекомендацией: вынимаете наугад карту червовой масти – бросайте глубоководные сети, в противном случае – на малую глубину. Несмотря на простоту рекомендации, выработана она на основе статистики уловов (например, лишь четверть глубоких забросов – успешная), цены на рыбу и неочевидной для рыбаков теории проверки статистических гипотез.

Статистика занимается изучением закономерностей явлений, которые проявляются в массе повторяющихся событий. Как измерить эти закономер-ности? Такая мера была предложена в XVII веке основателями теории вероятностей и математической статистики Паскалем, Ферма, Гюйгенсом, Якобом Бернулли. Швейцарский математик Якоб Бернулли (1654 – 1705) дал первую формулировку важнейшего положения теории вероятностей – закона больших чисел.

Пусть производится n независимых опытов, в результате которых m раз появляется случайное событие А. Относительной частотой (частостью) события А называют отношение (A) =m/n, а вероятность события А обознают как р(А). Тогда закон больших чисел в формулировке Бернулли определяется неравенством

P{m/n-p(A)<}>1-, n,

т.е. вероятность того, что относительная частота события А при неограниченном нарастании числа опытов n отличается от вероятности этого события на величину, меньшую , больше, чем 1-, при сколь угодно малых ,>0. Иначе говоря, вероятность статистически устойчивого события можно рассматривать как предел относительной частоты этого события при n. Английский статистик Пирсон не поленился 12000 раз подбрасывать монету и в результате для события ”орел” получил частоту (А)=0,5069. Он не остановился на достигнутом и продолжил это увлекательное занятие до 24000 раз. Новый результат: (А)=0,5008, что в полной мере отвечает закону больших чисел. В жизни мы это называем “fifty-fifty”, измеряя вероятности в процентах. Следует, однако, помнить, что можно говорить о 200%, но нельзя (по определению) получить вероятность, большую 1 (или меньше 0).

Практическое значение закона Бернулли очевидно. При неизвестной вероятности р(А) нетрудно получить ее оценку в виде относительной частоты m/n, которая тем точнее, чем больше опытов. Если известны n и p, то можно оценить среднее число m событий А. Например, если каждый тысячный телевизор отказывает в течение гарантийного срока, то при объеме продаж 70000 можно ожидать, что в гарантийную мастерскую за соответствующий период поступят около 70 телевизоров.

В XVIII веке французский математик Пуассон обобщил закон больших чисел для случая различных вероятностей событий, а в XIX веке русский математик П.Л.Чебышев дал наиболее общую его формулировку в смысле сходимости средней величины к математическому ожиданию. Дальнейшие исследования, касающиеся сходимости распределений вероятности, обычно не связывают с законом больших чисел.

Напомним, что статистика, в отличие от классической теории вероятностей, имеет дело с ограниченными наборами данных, с их временной динамикой (статистически неустойчивые). Тем не менее и сложным социально-экономическим явлениям присущи закономерности, которые можно измерить, при этом с ростом объема изучаемой совокупности ошибки оценивания снижаются. Поэтому закон больших чисел является методологической основой статистики.


1.3. Статистическое наблюдение


Статистическое наблюдение – это научно организованный сбор данных о массовых социально-экономических явлениях. Это первый этап статистического исследования, цель которого – получение исходной информации для последующей обработки.

Основными формами наблюдения являются периодическая отчетность и специально организованное наблюдение. Этим занимаются специальные службы как на предприятиях, так и в масштабах государства (например, Минстат). Примерами организованного наблюдения являются социологические опросы, переписи населения, экологический контроль, метеоинформация за длительный период, сбор сведений о дорожно-транспортных происшествиях и т.д.

Результаты наблюдения регистрируются в виде элементов совокупности {x1,x2,x3,…,xn}, объединяемых какими-то общими признаками. Например, при обследовании семей хi может означать количественный состав отдельной семьи (или число детей). Признаки элементов совокупности могут быть атрибутивными (качественными) и количественными. К примеру, пол, национальность, специальность – атрибутивные признаки. Для разделения по атрибутивным признакам используют номинальные шкалы или таблицы. Количественные признаки описывают с помощью обычной числовой шкалы. Кроме того, признаки бывают факторными (причинными) и результативными (следственными). При изучении статистической взаимосвязи явлений “погода-урожай”, “безработица-преступность”, “ресурсосбережение-рентабельность” нетрудно догадаться, какие признаки факторные, какие – результативные.

Различают сплошное и выборочное наблюдение. В первом случае регистрируются все без исключения элементы совокупности, которую называют генеральной совокупностью. Классический пример – всеобщая перепись населения. Как правило, организуется выборочное наблюдение, включающее малую часть генеральной совокупности. По выборке с определенной вероятностью можно судить о генеральной совокупности. Таким образом, к примеру, проводится выборочный контроль бракованной продукции.


1.4. Статистические показатели

Статистический показатель – это обобщающая характеристика какого-либо свойства совокупности. Обычно показатель рассчитывается как усредненный параметр одного из признаков совокупности, при этом он сопровождается набором других признаков. Например, средний рыночный курс доллара – число, которое дополняется признаками: время (дата), место (город), купли (продажи), опт (розница) и др. Практическая статистика по существу занимается расчетом на основе собранных данных статистических показателей.


Статистические показатели применяют как к конкретным объектам (себестоимость продукции, рентабельность отдельного предприятия), так и для характеристики любых массовых явлений (показатели состояния образования, здравоохранения в стране или в области, средний срок жизни, безработица). Как статистические параметры они определяют средние величины, вариации, распределения, корреляционные связи, показатели динамики и оценки точности.

Различают абсолютные и относительные показатели. Абсолютные показатели отражают величины, имеющие размерность одной количественной меры (гривни, килограммы, часы, число изделий и т.д.). Лесной массив, например, можно измерить площадью (в гектарах или квадратных километрах), и суммарной кубатурой древесины (в кубических метрах). Для сравнения с другими массивами или для расчета планируемой вырубки естественно определить плотность массива в [куб.м/га], разделив второй показатель на первый. Это и есть относительный показатель. Отношение двух показателей одинаковой размерности дает безразмерный относительный показатель, который часто выражается в процентах (инфляция, рост цен, уровень заболеваемости, рентабельность). Относительные показатели используются чаще абсолютных. В особенности они важны в задачах сравнительного анализа, а также как показатели эффективности производства (инвестиций, оборота и пр.).

Поскольку любой объект (предприятие, отрасль, государство) образуют сложную многопараметрическую систему, то и оценивается она системой показателей (фонды, число работников, объем продукции, экономическая эффективность и т.д.). В такой системе ряд показателей статистически связаны (см. главу 6), тогда как другие могут быть статистически независимы. Выявление и измерение степени корреляционных связей явлений и процессов является одной из важных задач статистики.


Контрольные вопросы

  1. Сформулируйте предмет общей теории статистики. В чем специфика социально-экономической статистики ?
  2. Что такое частость события и вероятность события?
  3. Сформулируйте закон больших чисел Я. Бернулли. В чем практическая значимость этого закона?
  4. Что такое генеральная совокупность? Для чего проводится выборочное наблюдение?
  5. Приведите примеры атрибутивных и количественных признаков, факторных и результативных признаков.
  6. Приведите примеры абсолютных и относительных показателей, безразмерных относительных показателей.







Тема 2. Сводка и группировка статистических данных


2.1. Виды статистических группировок


После сбора статистических данных приступают к следующему этапу – их сводке и группировке.

Сводка – это систематизация собранных данных с подсчетом общих групповых итогов и производных величин.

Группировка – это метод сводки, состоящий в образовании групп эле-ментов совокупности, обладающих общими признаками.

Наглядным примером сводки является работа избирательной комиссии округа по подсчету итогов голосования. Сначала устанавливается общее число принявших участие в голосовании, затем отбраковываются недействительные бюллетени. Вслед за этим начинается группировка: селекция бюллетеней с голосами, отданными за каждого отдельного кандидата. В итоговом протоколе регистрируются абсолютные показатели (число голосов за кандидата) и относительные (процент проголосовавших за кандидата). По подобной же схеме действуют службы обработки статистических данных, которые привлекают для своих трудоемких задач компъютеры.

Различают следующие виды статистических группировок:

структурные (разделение элементов совокупности по признакам, характеризующим ее состав: возрастные группы, сорт продукции и пр.);

типологические (выделение групп по социально-экономическим ти-пам: форма собственности предприятий, типы семей, город – село и пр.);

аналитические (выявление взаимосвязей между факторными и результативными признаками: качество – реализация, удобрения – урожайность);

простые (по одному признаку) и комбинационные (более одного).

Приведем пример аналитической группировки наиболее вероятных причин коммерческого провала:
  • ошибки в определении объемов спроса – 30% неудач;
  • дефекты товара и производственные проблемы – 25%;
  • недостаточная реклама – 16%;
  • завышена цена – 12%;
  • конкуренция – 11%;
  • неудачное время выхода на рынок – 6%.

По итогам простых группировок обычно строятся графики распре-делений, а по результатам комбинационных – таблицы. При построении графиков по оси абсцисс откладываются значения количественного признака х от минимального хmin до максимального xmax значений. Важными понятиями при этом являются (как и в теории вероятностей) понятия дискретной и непрерывной величины.

Случайная величина Х называется дискретной, если множество ее воз-можных значений конечно. Чаще всего такие величины мы будем описывать целыми числами (число детей в семье, размер обуви, счет футбольного матча).

Величина Х называется непрерывной, если множество ее возможных значений бессчетно и занимает отрезок [xmin ,xmax] числовой оси. Скажем, рост, вес человека изменяются непрерывно, хотя результаты измерений обычно дискретны.

Одним из вопросов при разделении элементов совокупности на группы является корректный выбор интервалов группирования. Он возникает в случае, когда речь идет о признаках, выражаемых непрерывными величинами.


2.2. Выбор интервалов группирования


При использовании атрибутивных признаков группы образуются срав-нительно просто (скажем, разделение людей по цвету глаз, волос). А как разбивать людей на группы по возрасту, росту, весу? Здесь границы интервалов условны и зависят от цели исследования. Если требуется одеть и обуть роту солдат, то надо знать размеры одежды и обуви каждого, а склад должен наполняться на основе статистических данных. Распределение мужчин по росту можно разбить на два интервала (выше среднего (>176см) и ниже среднего (<176cм)), а можно и с интервалом 1 см. Оба варианта мало пригодны: первый дает недостаточно информации, второй приводит к изломанным графикам распределений. Число m интервалов группирования, очевидно, зависит от объема выборки n. Чем больше выборка, тем больше статистической информации и тем больше интервалов группирования можно построить.

В области значений непрерывного признака X=[xmin,xmax] выборки объема n необходимо определить число интервалов групирования m. Чаще всего используется группировка с равными интервалами ширины h (равномерное квантование), при этом

h=( xmax - xmin)/m

В математической статистике рекомендуется оценивать m в зависимо-сти от объема выборки формулой Стерджесса

m=[1+3,322lgn], (2.1) где [.] означает округление до целого числа. Численные значения этой логарифмической зависимости приведены в таблице 2.1

Таблица 2.1

n N

10

50

100

1000

m M

4

7

8

11


Реже встречается неравномерное квантование области значений Х на интервалы с разной шириной hi, i=1,2,…,m. В этом случае может использоваться, например, метод равных частот.

Области значений Х внутри интервалов рассматриваются как сегменты [ximin ,ximax), замкнутые слева и открытые справа. Например, при разбиении целочисленной числовой оси на интервалы шириной 10 первый интервал включает значения 0 - 9, второй 10 – 19, третий 20 - 29 и т.д. На непрерывной числовой оси правые границы становятся равными 9,999, 10,999 и т.д., с числом знаков после запятой, задаваемым условиями задачи (к примеру, не существует 0,999 доллара).


2.3. Ряды распределения


Ряды распределения определяют наиболее общие закономерности группировок с количественными (вариационными) признаками. На их основе определяются частные характеристики (параметры распределения): средние величины, параметры вариации (отклонения от среднего), асимметрии, эксцесса и др.

В теории вероятностей изучаются родственные понятия ряда вероятностей и плотности вероятности. В статистике на основе ограниченного набора данных строются ряды распределения частот или относительных частот по группам. Относительная частота события А, как следует из п.1.2, может рассматриваться как оценка вероятности.

Рассмотрим пример. Пусть k – число детей в семье (k=0,1,2,..,m-1), nk – число семей в городе, имеющих k детей, n – общее число семей, так что

(2.2)

Эти равенства называют условиями нормировки. Значения nk определяются как частоты k-й группы, а k – как относительные частоты (частости). В качестве примера в таблице 2.2 приведены данные о количестве семей г. Киева (в тыс.), имеющих до 5 детей (m=6). Отметим, что здесь группировка упорядочена, т.е. значения признака расположены в порядке нарастания. По приведенным данным нетрудно построить график

Таблица 2.2

K

0

1

2

3

4

5



nk, тыс.

79

258

205

86

23

3

654

k

0,12

0,39

0,31

0,13

0,035

0,005

1


k

0,5_


0,4_ 1 k=1

2

0,3_


0,2_

3

0,1_

4




0 1 2 3 4 5 k



Рис. 2.1

ряда распределения частот (частостей) числа детей в семьях города, рис.2.1. Этот график называется полигоном распределения. Полигоны характерны для дискретных случайных величин.

Построение рядов распределения для непрерывных величин начинается с разбиения области значений Х на интервалы шириной h (при равномерном квантовании), при этом число интервалов рекомендуется выбирать в зависимости от объема выборки n согласно (2.1). В качестве примера приведем распределение числа банков nk в зависимости от уставного капитала до 30 млн. грн. с интервалами шириной h=5 млн. грн. Общее число банков равно n=120. Распределение дано в таблице 2.3 и изображено на графике рис.2.2а По вертикальной оси откладываются частоты nk или частости k, по горизонтальной – капиталы с интервалами по 5 млн. грн. Как и для полигонов, сумма частостей k равна 1. Такие распределения, характерные для непрерывных величин, получили

Таблица 2.3


Капитaл,

млн.грн.

0– 4,999

5-- 9,999

10– 14,999

15– 19,999

20– 24,999

25– 29,999



nk

62

26

18

8

4

2

120

k

0,52

0,22

0,15

0,07

0,03

0,01

1

Fk

0,52

0,74

0,89

0.96

0,99

1,0






k (a)



0,52




0,22





0,15



0,07 0,03

0,01






0 5 10 15 20 25 30

х


Fk (б) 1,0

0,96 0,99

0,89

0,74




0,52







0 5 10 15 20 25 30

х

Рис. 2.2


название гистограммы.

Наряду с распределением относительных частот k иногда используют понятие накопленной частоты


Fk=k, k>=1,

для которой вместо полигона или гистограммы строют график кумулянтной кривой (рис.2.2б).

Пример 2.1. Число хi телевизоров, проданных магазином в i-й день, за 20 дней описывается выборкой

{xi}n={4, 3, 6, 6, 5, 3, 2, 3, 5, 4, 4, 2, 6, 7, 4, 7, 3, 5, 5, 5}.

Необходимо построить ряд распределения частот и относительных частот и кумулянтную кривую.

После упорядочения выборки в порядке возрастания хi нетрудно подсчитать распределение частот nk по группам, k=1 – 6, которое приведено в таблице 2.4. Здесь же даны частости k и накопленные частоты Fk. Соответствующие им графики приведены на рис.2.3a,б.


Таблица 2.4

xi

2

3

4

5

6

7



nk

2

4

4

5

3

2

20

k

0,1

0,2

0,2

0,25

0,15

0,1

1

Fk

0,1

0,3

0,5

0,75

0,9

1,0





В качестве следующего примера рассмотрим построение гистограммы с неравными интервалами группирования, формируемыми на основе метода равных частот. В этом случае в каждый интервал попадает равное число элементов выборки, а объем выборки n должен быть кратен числу m интервалов.


(а)

k _

0,3

_

0,2

_

0,1



0 2 3 4 5 6 7 k

Fk

1,0_ (б)




0,8_




0,6_


0,4_

0,2_


0 2 3 4 5 6 7 k

Рис.2.3

Пример 2.2. Веса 20 человек (в кг.) в порядке их нарастания описываются упорядоченной выборкой {xi}={(60, 62, 63, 65, 66 ); (68, 70, 70, 72, 73); (74, 76, 76, 77, 77); (78, 81, 81, 85, 86)}. Приняв m=4, построить гистограмму распределения весов.

В приведенной выборке группировка уже произведена и группы обозначены круглыми скобками. Ширина каждого интервала равна:

h1=68-60=8; h2=74-68=6; h3=77-73=4; h4=86-78=8.

Значения fk ряда определяются так, чтобы площадь под гистограммой на каждом интервале равнялась частости k (оценке вероятности), а суммарная площадь – 1 (как и под плотностью вероятности в теории вероятностей). Таким образом

f1=1/h1=1/32; f2=2/h2=1/24; f3=3/h3=1/16; f4=4/h4=1/32.

График этой гистограммы изображен на рис.2.4.


fk

1/16




1/24

1/32 1/32




.



60 68 74 78 86 x, кГ


Рис.2.4

Результаты группирования величин или явлений часто представляются в виде прямоугольных или секторных диаграмм, которые привлекают своей наглядностью. Умноженные на 100 значения относительных частот дают их процентные соотношения.

В заключение заметим, что графики и диаграммы удобны при анализе распределения одномерной величины Х. Многомерные признаки чаще всего заставляют нас обращаться к табличному способу представления сгруппированных данных. В этих случаях используют так называемые статистические таблицы. В них показатели обычно располагаются по колонкам таблицы, а объекты – по строкам. Примером начала такой таблицы является таблица 2.4.


Таблица 2.4 (млн. грн.)

Банк



Капитал



Активы

Депозиты,

вклады

Кредиты,

инвестиции

1

2

3

4

5

1

27,0

137

37,2

73,8

2

24, 6

108,7

54,1

69,2

3















Ряды распределения содержат наиболее полную информацию о статистических закономерностях массовых явлений. На их основе определяются частные характеристики распределения: средние величины; параметры вариации, асимметрии, эксцесса; мода, медиана и др. Они изучаются в следующих темах.

Задачи


2.1. Число комнат в 24 квартирах дома описывается выборкой

xi}={2, 3, 1, 3, 2, 2, 1, 3, 2, 3, 1, 3, 2, 2, 3, 2, 3, 3, 1, 2, 2, 3, 3, 2}.

Построить ряд распределения частот и частостей числа квартир в доме.

2.2. Возрастная структура населения характеризуется данными (млн. чел.)



Возраст,

(лет)

0 – 20

20 – 40

40 – 60

60 – 80
Мужчины

12

15

16

9

Женщины

10

16

14

14



Построить гистограммы возрастных структур населения (в относительных частотах).

2.3. Задолженность предприятий (в млн. грн.) по краткосрочным кредитам в прошлом году составляла (по месяцам)

126 174 112 96 80 155 138 105 126 149 74 165

Построить гистограмму с разбиением на 3 интервала методом равных частот.

2.4. Процент работоспособного населения по районам страны определяется выборкой

{xi}={82, 92, 66, 85, 63, 75, 71, 83, 79, 68, 58, 65, 62, 54}.

Построить гистограмму распределения работоспособного населения с группированием на 3 равных интервала.

2.5. Распределение семейных доходов Х (грн) населения характеризуется таблицей


Х

0-100

100-200

200-300

300-400

400-500

500-600

600-700

>700

k

1/3

2/9

1/6

1/9

1/18

1/18

1/36

1/36


Для 20 млн. семей построить ряды распределения частот, относительных и накопленных частот.


Контрольные вопросы


1. Что такое группировка статистических данных? С какой целью она проводится?

2. Какие величины называют дискретными, непрерывными? Как называют ряды распределения для дискретных и непрерывных величин (признаков)?

3. Дайте определение частоты, относительной частоты (частости), накопленной частоты.

4. Какие способы используются в статистике для представления рядов распределения? В каких случаях применяются графики, статистические таблицы?

5. Как выбираются интервалы группирования непрерывных величин? От чего зависит число возможных интервалов?

6. Что такое условие нормировки ряда распределения? Как его выразить в процентах?

7. Как строится гистограмма с неравными интервалами методом равных частот?