Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Информационные технологии в экономике
Бараз В.Р.. Корреляционно-регрессионный анализ связи показателей коммерческой деятельности с использованием программы Excel, 2005 | |
1.5. Измерение степени тесноты связи между качественными признаками (ранговая корреляция) |
|
При определении корреляционной зависимости нужно было иметь числовой набор двух совокупностей. Однако возможны случаи, когда имеющиеся данные не поддаются выражению числом единиц. Это обстоятельство заставляет прибегать к использованию так назы-ваемых непараметрических методов. Они позволяют измерять интенсивность взаимосвязи между качественными (атрибутивными) признаками. В основу непараметрических методов положен принцип нумерации значений статистического ряда. Каждой единице массива присваивается порядковый номер (ранг) в ряду, который будет упорядочен (ранжирован) по уровню признака. Следовательно, важным условием является возможность сделать рассматриваемые совокупности упорядоченными. Предварительное представление о наличии или отсутствии связи между рассматриваемыми массивами можно получить, если сопоставить после-довательность взаимного расположения рангов факторного (воздействующего) и результативного (подверженного влиянию) признаков. Для этого ранги измеренных значений факторного признака располагают в порядке возрастания. Если ранги результативного признака обнаруживают тенденцию к уве- личению, то можно говорить о наличии прямой связи. Если картина проти-воположная, то и связь толкуется как обратная. В статистике известны коэффициенты корреляции, основанные на использовании рангов. Одним из таковых является коэффициент корреляции рангов Спирмена. Он основан на рассмотрении разности рангов значений факторного и результативного признаков и ее обозначают как dt. Представим себе, что имеются две выборки, которые классифицированы по каким-то двум признакам: х и у. Выборки (их объем): 1, 2, 3, ..., n я совокупность (признак х): х 1, х2 , хз, . Х Х, Хп я совокупность (признак у): у1, у2, у3, ..., Уп. Здесь оба параметра х и у принимают только целочисленные значения в количестве, равном n. Тогда формула коэффициента корреляции рангов Спирмена (этот коэффициент именуют р) имеет следующий вид: <> d p=1 - n^-!) - где d = Xi -у'ж Рассмотрим определение этого коэффициента на следующем примере. Студенты третьего курса, обучающиеся по специальности Коммерция (торговое дело), проходили производственную практику в качестве стажеров на двух фирмах, занимающихся торгово-закупочными операциями с цветными металлами. Число студентов составляло 12 человек. Они работали вначале в течение двух недель на фирме Колокольный звон, занимающейся в основном изделиями из бронзы, а остальные две недели - на фирме Мельхиор, коммерческий интерес которой преимущественно был направлен на торговлю декоративно-ювелирными изделиями из медноникеле- вых сплавов. Получив жалование, заработанное усердным трудом, ребята решили выяснить, отличаются ли принципиально их материальные успехи в зависимости от того, где они приобретали практические навыки своей будущей профессии. Эту задачу мы постараемся решить двумя приемами. Вначале выпол-ним необходимые расчеты лвручную, проведя все необходимые рутинные операции с использованием вспомогательных табличных материалов, а также последующих скучных расчетов. Затем решим ту же задачу, воспользовавшись помощью замечательного Excel. Итак, в табл.3 укажем условные порядковые номера студентов, их заработок (тыс. руб.) на каждой фирме, соответствующее условное место (ранг), который они занимают в зависимости от размера заработка, а также все необходимые вспомогательные выкладки. Как видно из результатов сопоставления рангов материальных достижений студентов, их фактические показатели выглядят достаточно пестро. В одних случаях ранги были вполне совпадающими (например, у студентов под номерами 2, 8 и 12, но особенно полное совпадение у студентов с номерами 7 и 10), в других же заметно различались (например, у студентов под номерами 3, 5, 6 и 11). Возникает вопрос: насколько точно можно было прогнозировать успешную (или, напротив, менее удачную) работу студентов в указанных фирмах? Для ответа вычислим коэффициент корреляции рангов Спирмена, используя результаты расчетов в графе 7: p=1 = 1 - 6х1205 = 0,633 n(n2 -1) 12(122 -1) Как и линейный коэффициент корреляции, коэффициент корреляции рангов может также меняться от -1 до +1. Используя шкалу Чеддока, по результатам расчетов коэффициента Спирмена можно предположить наличие заметной прямой зависимости между итогами работы студентов на данных фирмах. Однако следует учесть, что ранговый показатель был рассчитан по небольшому объему исходной информации (n = 12). Не является ли отличие рангового коэффициента от нуля лишь следствием случайных совпадений результатов деятельности студентов на обеих фирмах? Иначе говоря, указанные совпадения не есть результат влияния каких-то иных факторов (дурной характер работодателя, финансовое положение фирмы, знойная жара в этот период лета и проч.), а всецело определяются усердием самих студентов. Чтобы ответить на этот вопрос более определенно, оценим статистическую значимость расчетного коэффициента. Для этого его значение ррасч нужно сопоставить с критическими (табличными) ртабл. Используется таблица, напоминающая таблицу /-критерия (прил.2). Найдем табличное значение коэффициента ртабл, для а = 0,05 и n = 12 его величина составит 0,580. Поскольку ррасч > ртабл (0,633 и 0,580), то с вероятностью 95 % можно утверждать, что исследуемая связь является значимой. Однако для уровня значимости а = 0,01 табличное значение ртабл = 0,723. Тем самым уже для вероятности 99 % наличие связи становится неочевидной. Таким образом, общий вывод можно свести к следующему тезису: следовало бы повысить число обследуемых студентов (увеличить объем выборки), а при отсутствии такой возможности высказанные оценки следует воспринимать с определенной осторожностью. Таблица 3 Поряд-ковый номер студента Заработок, фирма Коло-кольный звон, тыс. руб. (х) Заработок, фирма Мельхиор, тыс. руб. (у) Ранг Rx Ранг Ry Разность рангов d = \Rx - Ry\ d2 1 2 3 4 5 6 7 1 2,8 3,3 6 3 3 9 2 3,1 3,0 5 6 1 1 3 2,0 2,8 11 7 4 16 4 3,2 4,1 4 2 2 4 5 2,4 2,1 8 12 4 16 6 3,3 2,7 3 8 5 25 7 2,2 2,5 10 10 0 0 8 1,8 2,3 12 11 1 1 9 2,5 3.2 7 4 3 9 10 2,3 2.6 9 9 0 0 11 3,5 3,1 1 5 4 16 12 3,4 4,5 2 1 1 1 Итого 105 Расчетная таблица для определения коэффициента корреляции рангов Спирмена Заметим, что ранговый коэффициент корреляции Спирмена может быть использован не только для оценки связи качественных признаков, но и количественных. Принципиальное условие - значения признаков поддаются ранжированию (как именно - по степени убывания или возрастания - это не важно). Теперь ту же задачу мы решим, используя компьютерные расчеты. В данном случае Excel нам поможет выполнить рутинные расчеты, хотя сама процедура поиска коэффициента корреляции Спирмена будет носить схожий характер. Итак, запустим программу Excel. В открывшемся рабочем листе Excel (Лист 1) сформируем исходную таблицу, в которой поместим данные, соответствующие содержимому колонок 1-3 табл.3. Эта таблица будет располагаться в ячейках A1:C13. Итоговый результат представлен на рис.6. А В С 1 2 Порядковый номер студента Заработок, фирма "Колокольный звон", тыс. руб. Заработок, фирма "Мельхиор", тыс. руб. 1 2,8 3,3 3 2 3,1 3 4 3 2 2,8 5 4 3,2 4,1 6 5 2,4 2,1 7 6 3,3 2,7 8 7 2,2 2,5 9 8 1,8 2,3 10 Э 2,5 3,2 11 10 2,3 2,6 12 11 3,5 3,1 13 12 3,4 4,5 Рис.6. Исходные данные в таблице Excel Далее будем двигаться следующим образом: запустим опции Сервис/Анализ данных/Ранг и персентиль. Примечание. Тут следует дать предварительное пояснение. В отношении рангов рассуждения у нас уже были. Теперь дадим разъяснение по поводу термина персентиль (или, как принято писать, перцентиль). Как уже говорилось, для характеристики формы распределения вариационного ряда применяют ранговые показатели. Под этим понимают такие единицы исследуемого массива, которые занимают определенное место в вариационном ряду (например, десятое, двадцатое и т.д.). Они получили название квантилей или градиентов. Квантили в свою очередь подразделя- ются на квартили, децили и перцентили. Различие между ними в том, на какое количество частей делится вариационный ряд. Если на 4 части - это квартили; на 10 - децили и, наконец, на 100 - перцентили. Поясним это на примере перцентилей. |
|
<< Предыдушая | Следующая >> |
= К содержанию = | |
Похожие документы: "1.5. Измерение степени тесноты связи между качественными признаками (ранговая корреляция)" |
|
|