Учебное пособие © Центр дистанционного образования мгуп удк 311
Вид материала | Учебное пособие |
- Учебное пособие томск 2003 Томский государственный университет систем управления, 2466.49kb.
- Учебное пособие разработано в соответствие с программой дисциплины "Статистика" и предназначено, 217.11kb.
- Учебно-методическое пособие томск 2003 Корректор: Воронина, 785.4kb.
- Учебное пособие Под общей редакцией доктора технических наук, профессора Н. А. Селезневой, 1419.51kb.
- Министерство образования и науки российской федерации, 1891.81kb.
- Учебное пособие Житомир 2001 удк 33: 007. Основы экономической кибернетики. Учебное, 3745.06kb.
- Учебное пособие Уфа 2005 удк 338 (075. 8) Ббк, 1087.66kb.
- Учебное пособие Санкт-Петербург 2007 удк алексеева С. Ф., Большаков В. И. Информационные, 1372.56kb.
- М. В. Григорьева руководство по преддиплом, 824.54kb.
- Учебное пособие г. Тюмень 2005 Печатается по решению Совета Института дополнительного, 1907.38kb.
Средней величиной называют показатель, который характеризует обобщенное значение признака или группы признаков в исследуемой совокупности.
Если исследуется совокупность с качественно однородными признаками, то средняя величина выступает здесь как типическая средняя. Например, для групп работников определенной отрасли с фиксированным уровнем дохода определяется типическая средняя расходов на предметы первой необходимости, т.е. типическая средняя обобщает качественно однородные значения признака в данной совокупности, каковым является доля расходов у работников данной группы на товары первой необходимости.
При исследовании совокупности с качественно разнородными признаками на первый план может выступить нетипичность средних показателей. Такими, к примеру, являются средние показатели произведенного национального дохода на душу населения (разные возрастные группы), средние показатели урожайности зерновых культур по всей территории России (районы разных климатических зон и разных зерновых культур), средние показатели рождаемости населения по всем регионам страны, средние температуры за определенный период и т.д. Здесь средние величины обобщают качественно разнородные значения признаков или системных пространственных совокупностей (международное сообщество, континент, государство, регион, район и т.д.) или динамических совокупностей, протяженных во времени (век, десятилетие, год, сезон и т.д.). Такие средние величины называют системными средними.
Таким образом, значение средних величин состоит в их обобщающей функции. Средняя величина заменяет большое число индивидуальных значений признака, обнаруживая общие свойства, присущие всем единицам совокупности. Это, в свою очередь, позволяет избежать случайных причин и выявить общие закономерности, обусловленные общими причинами.
5.2.
Виды средних величин и методы их расчета
На этапе статистической обработки могут быть поставлены самые различные задачи исследования, для решения которых нужно выбрать соответствующую среднюю. При этом необходимо руководствоваться следующим правилом: величины, которые представляют собой числитель и знаменатель средней, должны быть логически связаны между собой.
Используются две категории средних величин:
степенные средние;
структурные средние.
Первая категория степенных средних включает: среднюю арифметическую, среднюю гармоническую, среднюю квадратическую и среднюю геометрическую.
Вторая категория (структурные средние) - это мода и медиана. Эти виды средних будут рассмотрены в теме «Ряды распределения».
Введем следующие условные обозначения:
- величины, для которых исчисляется средняя;
- средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений;
- частота (повторяемость индивидуальных значений признака).
Различные средние выводятся из общей формулы степенной средней:
(5.1)
при k = 1 - средняя арифметическая; k = -1 - средняя гармоническая; k = 0 - средняя геометрическая; k = -2 - средняя квадратическая.
Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи с чем каждый вариант приходится умножать на эту численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней.
Средняя арифметическая - самый распространенный вид средней. Она используется, когда расчет осуществляется по несгруппированным статистическим данным, где нужно получить среднее слагаемое. Средняя арифметическая - это такое среднее значение признака, при получении которого сохраняется неизменным общий объем признака в совокупности.
Формула средней арифметической (простой) имеет вид
(5.2)
где n - численность совокупности.
Например, средняя заработная плата работников предприятия вычисляется как средняя арифметическая:
Определяющими показателями здесь являются заработная плата каждого работника и число работников предприятия. При вычислении средней общая сумма заработной платы осталась прежней, но распределенной как бы между всеми работниками поровну. К примеру, необходимо вычислить среднюю заработную плату работников небольшой фирмы, где заняты 8 человек:
При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной, которая имеет вид
(5.3)
Так, нам необходимо рассчитать средний курс акций какого-то акционерного общества на торгах фондовой биржи. Известно, что сделки осуществлялись в течение 5 дней (5 сделок), количество проданных акций по курсу продаж распределилось следующим образом:
1 - 800 ак. - 1010 руб.
2 - 650 ак. - 990 руб.
3 - 700 ак. - 1015 руб.
4 - 550 ак. - 900 руб.
5 - 850 ак. - 1150 руб.
Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА):
ОСС = 1010 ·800+990·650+1015·700+900·550+1150·850= 3 634 500;
КПА = 800+650+700+550+850=3550.
В этом случае средний курс стоимости акций был равен
Необходимо знать свойства арифметической средней, что очень важно как для ее использования, так и при ее расчете. Можно выделить три основных свойства, которые наиболее всего обусловили широкое применение арифметической средней в статистико-экономических расчетах.
Свойство первое (нулевое): сумма положительных отклонений индивидуальных значений признака от его среднего значения равна сумме отрицательных отклонений. Это очень важное свойство, поскольку оно показывает, что любые отклонения (как с +, так и с -), вызванные случайными причинами, взаимно будут погашены.
Доказательство:
Свойство второе (минимальное): сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа (а), т.е. есть число минимальное.
Доказательство.
Составим сумму квадратов отклонений от переменной а:
(5.4)
Чтобы найти экстремум этой функции, необходимо ее производную по а приравнять нулю:
Отсюда получаем:
(5.5)
Следовательно, экстремум суммы квадратов отклонений достигается при . Этот экстремум - минимум, так как функция не может иметь максимума.
Свойство третье: средняя арифметическая постоянной величины равна этой постоянной: при а = const.
Кроме этих трех важнейших свойств средней арифметической существуют так называемые расчетные свойства, которые постепенно теряют свою значимость в связи с использованием электронно-вычислительной техники:
если индивидуальное значение признака каждой единицы умножить или разделить на постоянное число, то средняя арифметическая увеличится или уменьшится во столько же раз;
средняя арифметическая не изменится, если вес (частоту) каждого значения признака разделить на постоянное число;
если индивидуальные значения признака каждой единицы уменьшить или увеличить на одну и ту же величину, то средняя арифметическая уменьшится или увеличится на ту же самую величину.
Средняя гармоническая. Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1.
Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1:
(5.6)
К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость:
В статистической практике чаще используется гармоническая взвешенная, формула которой имеет вид
(5.7)
Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.
Например, при расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам не известно количество реализованных единиц (речь идет о разных товарах), но известны суммы реализаций этих различных товаров. Допустим, необходимо узнать среднюю цену реализованных товаров:
Вид товара Цена за единицу, руб. Сумма реализаций, руб.
а 50 500
б 40 600
с 60 1200
Получаем
Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:
Средняя геометрическая. Чаще всего средняя геометрическая находит свое применение при определении средних темпов роста (средних коэффициентов роста), когда индивидуальные значения признака представлены в виде относительных величин. Она используется также, если необходимо найти среднюю между минимальным и максимальным значениями признака (например, между 100 и 1000000). Существуют формулы для простой и взвешенной средней геометрической.
Для простой средней геометрической
Для взвешенной средней геометрической
(5.9)
Средняя квадратическая величина. Основной сферой ее применения является измерение вариации признака в совокупности (расчет среднего квадратического отклонения).
Формула простой средней квадратической
(5.10)
Формула взвешенной средней квадратической
(5.11)
В итоге можно сказать, что от правильного выбора вида средней величины в каждом конкретном случае зависит успешное решение задач статистического исследования. Выбор средней предполагает такую последовательность:
а) установление обобщающего показателя совокупности;
б) определение для данного обобщающего показателя математического соотношения величин;
в) замена индивидуальных значений средними величинами;
г) расчет средней с помощью соответствующего уравнения.
Вопросы для самоконтроля к теме 5
6.
Тема 6. Анализ вариации
6.1.
Понятие вариации. Показатели вариации
Вариацию можно определить как количественное различие значений одного и того же признака у отдельных единиц совокупности. Термин «вариация» имеет латинское происхождение - variatio, что означает различие, изменение, колеблемость. Изучение вариации в статистической практике позволяет установить зависимость между изменением, которое происходит в исследуемом признаке, и теми факторами, которые вызывают данное изменение.
Для измерения вариации признака используют как абсолютные, так и относительные показатели.
К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию.
К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение и др.
Размах вариации R. Это самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:
(6.1)
Размах вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.
Среднее линейное отклонение d, которое вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности. Эта величина определяется как средняя арифметическая из абсолютных значений отклонений от средней. Так как сумма отклонений значений признака от средней величины равна нулю, то все отклонения берутся по модулю.
Формула среднего линейного отклонения (простая)
(6.2)
Формула среднего линейного отклонения (взвешенная)
(6.3)
При использовании показателя среднего линейного отклонения возникают определенные неудобства, связанные с тем, что приходится иметь дело не только с положительными, но и с отрицательными величинами, что побудило искать другие способы оценки вариации, чтобы иметь дело только с положительными величинами. Таким способом стало возведение всех отклонений во вторую степень. Обобщающие показатели, найденные с использованием вторых степеней отклонений, получили очень широкое распространение. К таким показателям относятся среднее квадратическое отклонение и среднее квадратическое отклонение в квадрате , которое называют дисперсией.
Средняя квадратическая простая
(6.4)
Средняя квадратическая взвешенная
(6.5)
Дисперсия есть не что иное, как средний квадрат отклонений индивидуальных значений признака от его средней величины.
Формулы дисперсии взвешенной и простой :
(6.6)
Расчет дисперсии можно упростить. Для этого используется способ отсчета от условного нуля (способ моментов), если имеют место равные интервалы в вариационном ряду.
Кроме показателей вариации, выраженных в абсолютных величинах, в статистическом исследовании используются показатели вариации (V), выраженные в относительных величинах, особенно для целей сравнения колеблемости различных признаков одной и той же совокупности или для сравнения колеблемости одного и того же признака в нескольких совокупностях.
Данные показатели рассчитываются как отношение размаха вариации к средней величине признака (коэффициент осцилляции), отношение среднего линейного отклонения к средней величине признака (линейный коэффициент вариации), отношение среднего квадратического отклонения к средней величине признака (коэффициент вариации) и, как правило, выражаются в процентах.
Формулы расчета относительных показателей вариации:
(6.7)
где VR - коэффициент осцилляции; - линейный коэффициент вариации; - коэффициент вариации.
Из приведенных формул видно, что чем больше коэффициент V приближен к нулю, тем меньше вариация значений признака.
В статистической практике наиболее часто применяется коэффициент вариации. Он используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).
6.2.
Виды (показатели) дисперсий и правило их сложения
В статистическом исследовании очень часто бывает необходимо не только изучить вариации признака по всей совокупности, но и проследить количественные изменения признака по однородным группам совокупности, а также и между группами. Следовательно, помимо общей средней для всей совокупности необходимо просчитывать и частные средние величины по отдельным группам.
Различают три вида дисперсий:
общая;
средняя внутригрупповая;
межгрупповая.
Общая дисперсия () характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина определяется по формуле
(6.8)
где - общая средняя арифметическая всей исследуемой совокупности.
Средняя внутригрупповая дисперсия () свидетельствует о случайной вариации, которая может возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от признака-фактора, положенного в основу группировки. Данная дисперсия рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным группам (), затем рассчитывается средняя внутригрупповая дисперсия :
(6.9)
где ni - число единиц в группе
Межгрупповая дисперсия (дисперсия групповых средних) характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле
(6.10)
где - средняя величина по отдельной группе.
Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:
(6.11)
Данное соотношение отражает закон, который называют правилом сложения дисперсий. Согласно этому закону (правилу), общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.
Вопросы для самоконтроля к теме 6
7.
Тема 7. Ряды распределения
7.1.
Ряды распределения и их построение
Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).
Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается
где k - число вариантов значений признака
Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.
Частоты ряда f могут заменяться частностями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
(7.1)
При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:
(7.2)
где R = xmax - xmin ; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности.
7.2.
Медиана и мода - структурные (распределительные) средние величины
Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.
Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда.
Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.