Аналитический доклад                   Москва 2002      

Вид материалаДоклад
1.2. Что удалось установить нам
Таблица 1.2.4. Значения линейных коэффициентов корреляции между переменной V40
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   18

1.2. Что удалось установить нам


В дополнение к описанным выше результатам, извлеченным из проведенных ранее исследований, мы предприняли свой статистический анализ. Его задача состояла в установлении зависимости между переменными, характеризующими уровень оплаты должностных лиц в различных странах, и переменными, описывающими уровень коррупции и эффективность бюрократии в этих странах. Для решения этой задачи нами была сформирована база данных, содержащая сведения о 47 странах мира и включавшая 51 переменную. Данные брались из международных сравнительных исследований, проводившихся в течение последних нескольких лет. Мы не считали некорректным, если между данными была разница в два-три года, поскольку свойства стран, изучавшиеся нами, достаточно инерционны, и сдвигами, которые могут происходить за такое время, можно пренебречь.

Основные данные для наших изысканий мы черпали из следующих источников:
  •         исследование Всемирного банка «World Bank Aggregate Governance Indicators, 2000»;
  •         исследование Всемирного банка «Cross-National Data on Government Employment & Wages. 2001»;
  •         данные исследования «The World Competitiveness Yearbook of International Institute Development, 2000», любезно предоставленные нам С.А.Айвазяном.

В Приложении 1 приведены списки стран и характеристик из сформированной нами базы данных.

После предварительного статистического анализа и, помимо прочего, отсева переменных с большим числом пропущенных данных, для углубленного анализа были отобраны переменные, приведенные в Таблице 1.2.1.

Таблица 1.2.1. Список характеристик, использованных в исследовании
Код

Содержание признака

Источник данных

V1

Решения государства не реализуются эффективно

The World Competitiveness Yearbook of International Institute Development, 2000

V5

Бюрократия сдерживает развитие бизнеса

V6

Коррупция и взяточничество существует / не существует в публичной сфере

V7

Таможенная бюрократия необоснованно сдерживает транзит товаров

V8

Меры юридической ответственности не соответствуют содеянному преступлению

V9

Не обеспечиваются личная безопасность и безопасность собственности

V10

Высокий / низкий риск политической нестабильности

V24

Правовая система имеет (не имеет) пагубное влияние на уровень конкурентоспособности страны

V44

Индекс восприятия коррупции

Transparency CPI, 2000

V47

Эффективность управления

World Bank Aggregate Governance Indicators, 2000

V49

Верховенство закона

V50

Степень контроля над коррупцией

V51

Величина валового национального продукта на душу населения

The World Competitiveness Yearbook of International Institute Development, 2000

V40

Отношение общих затрат на заработную плату гражданским и военным служащим (за исключением выплат в натуре) к ВВП

Cross-National Data on Government Employment & Wages. 2001

Рассмотрим первые 12 переменных из этой таблицы с кодами от V1 до V50. В следующей таблице приведены значения линейного коэффициента корреляции, вычисленные между этими переменными.

Таблица 1.2.2. Парные корреляции 12-ти характеристик, использованных в исследовании

 

V6

V7

V5

V1

V44

V50

V24

V9

V8

V10

V49

V47

V6

1

0,91

0,85

0,85

0,97

0,93

0,87

0,83

0,90

0,80

0,88

0,89

V7

0,91

1

0,83

0,81

0,92

0,92

0,83

0,82

0,84

0,85

0,87

0,88

V5

0,85

0,83

1

0,86

0,81

0,77

0,81

0,76

0,79

0,71

0,74

0,74

V1

0,85

0,81

0,86

1

0,83

0,80

0,83

0,79

0,79

0,82

0,74

0,79

V44

0,97

0,92

0,81

0,83

1

0,97

0,87

0,81

0,88

0,86

0,92

0,94

V50

0,93

0,92

0,77

0,80

0,97

1

0,86

0,82

0,87

0,87

0,94

0,96

V24

0,87

0,83

0,81

0,83

0,87

0,86

1

0,82

0,92

0,83

0,82

0,82

V9

0,83

0,82

0,76

0,79

0,81

0,82

0,82

1

0,87

0,74

0,89

0,79

V8

0,90

0,84

0,79

0,79

0,88

0,87

0,92

0,87

1

0,78

0,85

0,79

V10

0,80

0,85

0,71

0,82

0,86

0,87

0,83

0,74

0,78

1

0,81

0,87

V49

0,88

0,87

0,74

0,74

0,92

0,94

0,82

0,89

0,85

0,81

1

0,94

V47

0,89

0,88

0,74

0,79

0,94

0,96

0,82

0,79

0,79

0,87

0,94

1

Значения коэффициентов корреляции колеблются в диапазоне от 0,71 до 0,97, демонстрируя в целом статистически значимую взаимосвязь между всеми указанными переменными. Это подтверждает, в частности, тезис, выдвинутый в одном из предшествующих исследований Фонда ИНДЕМ2[2], о том, что все такие переменные в том или ином виде являются индикатором одной и той же латентной переменной, характеризующей различные страны, которая может быть названа «эффективность системы». Отметим, что все переменные из последней таблицы ориентированы одинаково и построены так, что их большие значения соответствуют большей «эффективности» (чем больше, тем «лучше»).

Возьмем для дальнейшего исследования 3 характеристики: это переменные V5 и V44 (экстремумы корреляционных связей), а также V9 (наименьший разброс корреляций). Рассмотрим их взаимосвязь с характеристикой "Отношение общих затрат на заработную плату гражданским и военным служащим (за исключением выплат в натуре) к ВВП" (V40).

При той величине связей между переменными, которая наблюдается в Таблице 1.2.2, совокупный разброс данных может объясняться двумя-тремя главными компонентами. Это значит, что если между уровнем оплаты труда и некоторыми из отобранных нами переменных существует зависимость, то некоторая линейная комбинация трех переменных из этой группы должна значимо коррелировать с переменной V40. Однако множественная регрессия переменных V5, V9, V44 на переменную V40 не демонстрирует картины значимой линейной статистической взаимосвязи, что видно из следующего рисунка.




 

Рисунок 1.2.1. Диаграмма рассеяния двух переменных: V40 (ось X) и ее регрессионного значения (ось Y)

В этом результате нет ничего удивительного, если учесть, что значения коэффициента линейной корреляции между переменными V5, V9, V44 и переменной V40 составляют соответственно -0,207; -0,278; -0,280. Аналогичные регрессионные связи имеют характеристики "Отношение общих затрат на заработную плату (за исключением выплат в натуре) к показателю расходов государства" (V41) и "Отношение средней заработной платы к уровню ВВП на душу населения" (V42). Другими словами: признаки, определяющие эффективность бюрократии и коррупцию имеют незначимую и отрицательную (!) корреляцию с индексом «зарплаты», а Рисунок 1.2.1. говорит сам за себя.

Вместе с тем изучение диаграмм рассеяния исследуемых переменных привело к формированию следующей гипотезы: невозможность увидеть значимые статистические зависимости объясняется тем, что анализируются группы стран, отличающиеся друг от друга, но внутри групп имеющие и большой разброс значений переменных и собственные закономерности (или отсутствие таковых). На основе этой гипотезы было решено разбить все исследуемые страны на три группы по значению валового национального продукта на душу населения (переменная V51). Границы классов были определены по особенностям эмпирической функции распределения переменной. По смыслу переменной страны, отнесенные к разным классам, были названы «Бедные», «Средние» и «Богатые». Полученное распределение стран по классам приведено в следующей таблице.

Таблица 1.2.3. Распределение исследуемых стран по трем классам, образованным по значениям валового национального продукта на душу населения

Классы

Состав класса

 

Бедные

Индия, Индонезия, Китай, Россия, Эстония, Бразилия, Таиланд, Турция, Колумбия, Польша, Южная Африка, Венгрия, Малайзия, Мексика, Словакия, Аргентина, Словения, Чехия,

Средние

Чили, Корея, Греция, Португалия, Испания, Новая Зеландия, Израиль

 

Богатые

Ирландия, Швеция, Финляндия, Италия, Япония, Австралия, Великобритания, США, Германия, Нидерланды, Канада, Исландия, Франция, Австрия, Дания, Бельгия, Норвегия, Гонконг, Швейцария, Люксембург

Для всех характеристик из базы данных были рассчитаны их средние значения в этих трех группах. В итоге, с каждой характеристикой мы связали 3 числа, соответствующие среднему значению характеристики среди "бедных", "средних" и "богатых" стран. В таблице 1.2.4. приведены значения коэффициента линейной корреляции между переменной «Отношение общих затрат на заработную плату гражданским и военным служащим (за исключением выплат в натуре) к ВВП» (V40), которая ниже для краткости будет именоваться «Зарплата», и остальными переменными из таблицы 1.2.1.

Таблица 1.2.4. Значения линейных коэффициентов корреляции между переменной V40 «Зарплата» (Отношение общих затрат на заработную плату гражданским и военным служащим (за исключением выплат в натуре) к ВВП) и другими характеристиками, вычисленные по трехмерным векторам средних значений указанных переменных внутри групп «бедных», «средних» и «богатых» стран
Код

Признак

Корреляция
с «Зарплатой»


V1

Решения государства не реализуются эффективно

-0,967

V5

Бюрократия сдерживает развитие бизнеса

-0,992

V6

Коррупция и взяточничество существует / не существует в публичной сфере

-0,999

V7

Таможенная бюрократия необоснованно сдерживает транзит товаров

-0,979

V8

Меры юридической ответственности не соответствуют содеянному преступлению

-0,985

V9

Не обеспечиваются личная безопасность и безопасность собственности

-0,999

V10

Высокий / низкий риск политической нестабильности

-0,992

V24

Правовая система имеет (не имеет) пагубное влияние на уровень конкурентоспособности страны

-0,980

V44

Индекс восприятия коррупции

-0,999

V47

Эффективность управления

-0,999

V49

Верховенство закона

-0,998

V50

Степень контроля над коррупцией

-0,998

Теперь мы наблюдаем абсолютно иную картину: корреляции действительно отрицательны, но чрезвычайно высоки, так что мы вполне можем говорить о линейной обратной связи между характеристикой «Зарплата» и основными характеристиками развитости страны, которые обусловливают богатство страны.

Такие значения коэффициента корреляции означают, что два трехмерных вектора связаны почти линейной зависимостью, т.е. соответствующие точки на диаграмме рассеяния ложатся на прямую. Это действительно так, что, в качестве одного из примеров, продемонстрировано на следующем рисунке.

 




Рисунок 1.2.2. Диаграмма рассеяния переменных V6 («Коррупция и взяточничество существует / не существует в публичной сфере») и V40 («Отношение общих затрат на заработную плату гражданским и военным служащим (за исключением выплат в натуре) к ВВП»). Приведено регрессионное уравнение второй переменной на первую

Объяснить «рассогласованность» в выводах по группированным и не группированным данным достаточно легко. Суть в том, что разброс «тенденций» внутри каждой группы стран весьма значителен. Например, все три группы можно разбить на более «скупые» и более «щедрые» страны по отношению к своим чиновникам. В итоге мы будем иметь 6 групп. Приведем средние значения "Зарплаты" по таким специально подобранным 6-ти группам в следующей таблице.

Таблица 1.2.5. Средние значения переменной "Зарплата" внутри групп стран, образованных по признакам «богатство» и «скупость»

Подгруппы по скупости

Группы стран

"Бедные"

"Средние"

"Богатые"

«Скупые»

2,54

2,44

2,4

«Щедрые»

6,028

4,767

4,7

Суммарно

5,645

3,945

2,975

Мы видим, что при таком непропорциональном разбиении зависимость «затрат на зарплату чиновникам» от «богатства» страны практически незаметна. Это и проявляется в результатах общего корреляционного анализа. Тогда как общие средние значения (взвешенные по размеру "Скупых" и "Щедрых» стран в каждой группе) дают вполне отчетливую тенденцию (групповые корреляции).

Вместе с тем разумно поставить вопрос о доверительных интервалах для полученных значений корреляции. Ведь понятно, что большие значения корреляции могут появляться случайно при таких сверхкоротких сравниваемых числовых рядах. Ответ на этот вопрос был получен с помощью статистического моделирования.

Три средних значения переменной «Зарплата» для групп «бедных», «средних» и «богатых» стран считались фиксированными. Для каждой из остальных переменных, с которыми определялась корреляция «зарплаты», предпринимались следующие расчеты. Заданное достаточно большое число раз моделировался трехмерный вектор как выборка из трехмерной случайной величины с независимыми компонентами, распределенными нормально со средними и дисперсиями, равными тем, что были определены для этой переменной по странам, попавшим в группы «бедных», «средних» и «богатых». Для этого вектора вычислялось значение линейной корреляции с фиксированными значениями для переменной «зарплата». В результате получался набор смоделированных значений коэффициентов корреляции, для которого определялась эмпирическая функция распределения, позволявшая дать оценки доверительных интервалов. Поскольку речь идет о значениях коэффициентов корреляции, близких к –1, то строиться должны были односторонние доверительные интервалы.

В таблице 1.2.6. вместе с коэффициентами корреляции даны 80  % доверительные интервалы, т.е. такие значения корреляции, что вероятность произвольному коэффициенту корреляции (в нашей экспериментальной ситуации) оказаться меньше указанного равна 0,8.

Таблица 1.2.6. Значения линейных коэффициентов корреляции между переменной «Зарплата» (Отношение общих затрат на заработную плату гражданским и военным служащим (за исключением выплат в натуре) к ВВП) и другими переменными, вычисленные по трехмерным векторам средних значений указанных переменных внутри групп «бедных», «средних» и «богатых» стран, и определенные для них границы 80  % доверительных интервалов
Код

Признак

Корреляция
с «Зарплатой»


Граница 80- % доверительного интервала

V6

Коррупция и взяточничество существует / не существует в публичной сфере

-0,999

-0,82

V7

Таможенная бюрократия необоснованно сдерживает транзит товаров

-0,979

-0,85

V9

Не обеспечиваются личная безопасность и безопасность собственности

-0,999

-0,79

V44

Индекс восприятия коррупции

-0,999

-0,78

V47

Эффективность управления

-0,999

-0,84

V49

Верховенство закона

-0,998

-0,87

V50

Степень контроля над коррупцией

-0,998

-0,83

 

Некоторые признаки не выдержали испытание проверкой на статистическую значимость, например – переменная V5. Однако большинство исследованных переменных, включая приведенные в Таблице 1.2.6, такую проверку прошли. Следовательно, можно утверждать, что большая часть исследованных переменных дают значимо высокую отрицательную групповую корреляцию с переменной «зарплата». Этот результат следует признать нетривиальным. Однако каких-либо факторов, объясняющих разброс этой переменной внутри той или иной группы стран, установить не удалось.