Книги, научные публикации

Экономические 5(90) Бухгалтерский учет и аудит. Статистика 162 науки 2012

Классификация стран по основным показателям развития алмазного рынка й 2012 С.Ю. Айвазов Московский государственный университет экономики, статистики и информатики (МЭСИ) E-mail: ecsn В статье проведен кластерный анализ стран, играющих ведущую роль в международной торговле алмазами. В результате выделены три группы государств, формирующих в настоящее время меж дународный алмазный рынок, определены их особенности и перспективы дальнейшего разви тия. Определены позиции России на мировом алмазном рынке.

Ключевые слова: рынок алмазов, кластерный анализ, кластер, добыча алмазов, импорт и экспорт алмазов.

вержены влиянию инфляции3. Исходные дан При исследовании развития мирового алмаз ного рынка важное место отводится многомер- ные для кластеризации - это совокупность пока ной группировке стран, участвующих в между- зателей за 2010 г. по 32 странам, играющим наи народной торговле алмазами. Эта задача решает- более заметную роль в международной торговле ся методами кластерного анализа и позволяет алмазами.

выделить группы стран со схожими параметра- Кластеризацию будем проводить с исполь ми развития алмазной отрасли. Кластерный ана- зованием пакета STATISTICA, который предос лиз предоставляет возможность анализировать тавляет для этого значительные вычислительные достаточно большой объем информации и зна- возможности.

чительно сокращать массивы данных, делать их Непосредственно перед началом кластериза компактными и наглядными1. ции исходные статистические данные стандар Задача кластеризации заключается в разбие- тизируются (вычитается среднее и производится нии исследуемого множества объектов на одно- деление на среднеквадратическое отклонение). По родные группы объектов, называемых кластера- лученные в результате переменные имеют нуле вое среднее значение и единичную дисперсию4.

ми. С целью исследования сложившейся в на стоящее время структуры мирового алмазного В современной статистической практике при рынка произведем кластеризацию стран по ос- решении задач кластеризации объектов активно новным показателям его развития. применяются неиерархические методы, которые Существующая в настоящее время обобщаю- показывают достаточно высокую устойчивость щая статистика по добыче и торговле алмазами на по отношению к выбросам и неправильному международном уровне формируется на основе от- выбору метрики. При этом также достигается су четов Кимберлийского процесса, которые находятся щественная гибкость итогов кластеризации.

в открытом доступе на сайте организации2. Ин- Самым востребованным в ряду неиерархи формационная база Кимберлийского процесса ческих методов является метод k-средних. В этом включает ежеквартальные, полугодовые и годовые случае объект относится к тому кластеру, рассто отчеты. В них содержатся данные об объемах до- яние до которого минимально. Предпочтение дан бычи, импорта и экспорта алмазов в натуральном ного метода обусловлено простотой и быстротой и стоимостном выражении (карат и долларов его осуществления, прозрачностью алгоритма при США), а также о стоимости одного карата в дол- достаточно высоком качестве результата.

ларах. Помимо этого публикуются данные серти- В процессе реализации метода k-средних фикатов Кимберлийского процесса, выданных для выдвигается гипотеза относительно полагаемого ввоза или вывоза алмазов, по отдельным странам количества кластеров, которая может быть сфор или территориальным образованиям. мирована на основе теоретических предположе При статистическом исследовании формиро- ний, результатов предшествующих исследований, вания и развития мирового алмазного рынка це- суждений экспертов.

лесообразно использовать, прежде всего, данные На практике кластеризацию начинают, как об объемах добычи, импорта и экспорта алмазов правило, с разбиения исследуемой статистичес в натуральном выражении, так как стоимостные кой совокупности на две группы. В дальнейшем оценки показателей в значительной степени под- количество кластеров постепенно увеличивают.

Экономические 5(90) Бухгалтерский учет и аудит. Статистика науки Производя последовательное разбиение три кластера близко к оптимальному. Величины объектов исследуемой совокупности на различ- межгрупповых дисперсий при такой кластериза ное количество кластеров, можно дать оценку и ции неоднократно превышают значения внутри сравнить качество получаемых решений. групповых дисперсий исследуемых признаков.

Объективную количественную характеристи- Уровень значимости во всех случаях суще ку качества многомерной кластеризации объек- ственно ниже величины 0,05 и свидетельствует, тов можно получить на основе дисперсионного что вклад всех признаков в процесс многомер анализа, по итогам которого определяются зна- ной кластеризации является существенным.

чения межгрупповых и внутригрупповых дис- Результаты дисперсионного анализа, пред персий признаков, значение F-статистики, а также ставленные в табл. 2, отчетливо показывают, что уровень значимости. дальнейшее увеличение числа кластеров не по Чем больше величина межгрупповой дис- зволяет добиться более качественной кластери персии признака и меньше величина внутригруп- зации стран, участвующих в международной тор повой дисперсии, тем лучше признак характери- говле алмазами. Полученные величины изменя зует принадлежность объектов к определенному ются разнонаправленно, не обнаруживая явного кластеру и, следовательно, тем качественнее кла- улучшения качества многомерной кластеризации стеризация5. изучаемых объектов.

Наилучшей кластеризации также соответ- Все вышесказанное позволяет сделать вы ствуют большие значения F-критерия и мень- вод, что многомерную кластеризацию, при ко шие значения уровня значимости. Признаки с торой происходит дробление исследуемой сово большим уровнем значимости (обычно больше купности государств на три кластера, в целом 0,05) часто исключаются из процедуры класте- можно считать оптимальной.

ризации. Первый кластер, являющийся самым мало Результаты дисперсионного анализа в случае численным, содержит только Европейский союз разбиения исследуемой совокупности государств, и Индию.

участвующих в международной торговле алмаза- Второй кластер включает в себя Анголу, Ав ми, на два кластера оказались неудовлетворитель- стралию, Ботсвану, Канаду, Демократическую Таблица 1. Дисперсионный анализ (3 кластера) Межгрупповая Внутригрупповая Уровень Показатель F-статистика дисперсия дисперсия значимости Добыча алмазов 21,47815 9,52185 32,7072 0, Импорт алмазов 29,06734 1,93266 218,0809 0, Экспорт алмазов 17,73945 13,26055 19,3975 0, ными. Показатель добычи алмазов вносит незна- Республику Конго, Россию, Южно-Африканс чительный вклад при разбиении совокупности на кую Республику и Зимбабве.

два кластера. В данном случае внутригрупповая Третий кластер является самым многочис дисперсия показателя существенно превосходит ленным по своему составу и охватывает осталь величину межгрупповой дисперсии. Наряду с этим ные 22 страны, участвующие в международной значение F-критерия мало, а уровень значимости торговле алмазами.

значительно превышает значение 0,05. Для выделенных кластеров рассчитаем Евк Для получения более качественной класте- лидово расстояние между центрами кластеров ризации увеличим количество кластеров до трех, (табл. 3). Над диагональю таблицы приведены оставив первоначальный состав показателей не- квадраты этих расстояний.

изменным. Данные табл. 3 свидетельствуют о том, что Итоги дисперсионного анализа, приведен- максимальное расстояние отмечается между пер ные в табл. 1, позволяют сделать заключение, вым и вторым кластерами, минимальное - меж что разбиение изучаемой совокупности стран на ду вторым и третьим кластерами.

Таблица 2. Дисперсионный анализ (4 кластера) Межгрупповая Внутригрупповая Уровень Показатель F-статистика дисперсия дисперсия значимости Добыча алмазов 28,89769 2,10231 128,2928 0, Импорт алмазов 29,06734 1,93266 140,3739 0, Экспорт алмазов 18,52892 12,47108 13,8670 0, Экономические 5(90) Бухгалтерский учет и аудит. Статистика 164 науки Таблица 3. Евклидово расстояние между кластерами Кластер 1 Кластер 2 Кластер Кластер 1 0,000000 9,091042 8, Кластер 2 3,015136 0,000000 1, Кластер 3 2,878000 1,114137 0, Таблица 4. Средние значения нормированных показателей по кластерам Показатель Кластер 1 Кластер 2 Кластер Добыча алмазов -0,491508 1,418981 -0, Импорт алмазов 3,686060 -0,332253 -0, Экспорт алмазов 2,817660 0,083375 -0, В целях более полной интерпретации ито- тацию результатов кластерного анализа. Поэто гов кластерного анализа для каждого выделен- му определим средние значения для каждого кла ного кластера определим средние значения нор- стера по исходным данным.

мированных показателей (усреднение произво- Анализ рис. 1 и табл. 5 позволяет выявить дится внутри кластера). отличительные особенности каждого кластера.

Данные табл. 4 позволяют сделать вывод, Первый кластер составляют Европейский что по средним значениям показателей импорта союз и Индия. Они являются безусловными и экспорта алмазов Европейский союз и Индия, лидерами по объемам импорта и экспорта алма образующие первый кластер, являются безуслов- зов.

ными лидерами мирового алмазного рынка. Вме- Можно с уверенностью утверждать, что они сте с тем по добыче алмазов они явно уступают играют доминирующую роль на мировом алмаз странам, входящим во второй кластер. ном рынке. Вместе с тем доля этого кластера в Рисунок 1 позволяет просмотреть средние мировой добыче алмазов минимальна, а в Евро значения для каждого кластера на линейном гра- пейском союзе добыча отсутствует совсем.

фике. Второй кластер образуют Ангола, Австралия, В то же время исчисление характеристик по Ботсвана, Канада, Демократическая Республика нормированным величинам затрудняет интерпре- Конго, Россия, Южно-Африканская Республика - - Добыча алмазов Импорт алмазов Экспорт алмазов Кластер 1 Кластер 2 Кластер Рис. 1. График средних значений нормированных показателей по кластерам Экономические 5(90) Бухгалтерский учет и аудит. Статистика науки Таблица 5. Средние значения показателей по кластерам Показатель Кластер 1 Кластер 2 Кластер Добыча алмазов, карат 9042,20 15 560 168,09 173 447, Импорт алмазов, карат 153 491 681,54 237 797,80 4 737 245, Экспорт алмазов, карат 94 329 257,88 15 319 273,48 4 632 254, и Зимбабве. На долю этих стран в настоящее Предварительное исследование позволило время приходится более 90,0 % мировой добычи сделать заключение, что наиболее отчетливые алмазов. По итогам 2010 г. Россия уступила ли- кластеры образуются при использовании в ка дерство по стоимости добываемых алмазов Бот- честве метрики так называемого манхэттенс сване, однако сохранила первенство по объему кого расстояния, или Урасстояния городских их добычи. кварталовФ. При этом расстояние между клас Третий кластер формируют 22 страны: Ар- терами целесообразно определять методом пол мения, Беларусь, Бразилия, Центрально-Афри- ной связи.

канская Республика, Китай, Республика Конго, Рисунок 2 позволяет сделать вывод, что в Гана, Гвинея, Гайана, Израиль, Япония, Ливан, исследуемой совокупности стран, участвующих Лесото, Либерия, Намибия, Сьерра-Леоне, Шри- в международной торговле алмазами, явственно Ланка, Швейцария, Танзания, Таиланд, Объе- выделяются три кластера.

диненные Арабские Эмираты, Соединенные Необходимо отметить, что иерархический и Штаты Америки. неиерархический методы разбиения на кластеры Являясь самым многочисленным кластером исследуемой совокупности государств, функци по количеству стран, по показателям участия в онирующих на международном рынке алмазов, международной торговле алмазами данный кла- в данном случае приводят к аналогичным ре стер не выделяется. зультатам.

Далее проведем кластеризацию стран, фор- Таким образом, проведенный кластерный мирующих мировой алмазный рынок, по основ- анализ позволил отчетливо выделить три груп ным показателям его развития на основе агло- пы государств, формирующих в настоящее вре меративного иерархического метода. мя международный алмазный рынок.

Ангола Зимбабве ЮАР Австралия Канада Ботсвана ДР Конго Россия Армения Шри-Ланка Ливан Таиланд Беларусь Япония Бразилия Либерия Гайана Лесото Танзания ЦАР Гана Республика Конго Гвинея Сьерра-Леоне США Намибия Китай Швейцария Израиль ОАЭ Европейский союз Индия 0 2 4 6 8 10 Рис. 2. Дендрограмма классификации стран Экономические 5(90) Бухгалтерский учет и аудит. Статистика 166 науки В первый кластер входят участники рынка, пективе может оказывать значительное влияние являющиеся безусловными лидерами по объе- на процесс формирования спроса и предложе мам импорта и экспорта алмазов. Они являются ния на мировом алмазном рынке.

центрами международной торговли алмазами.

Второй кластер образует группа алмазодобы- См.: Методы и модели анализа данных: OLAP и Data Mining / А.А. Барсегян [и др.]. СПб., 2004;

вающих стран, куда входит и Россия. Можно ут Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомер верждать, что именно они формируют предложе ные статистические методы : учебник. М., 2003.

ние на мировом алмазном рынке, так как на долю URL: https://kimberleyprocessstatistics.org/ этих стран в настоящее время приходится более public_statistics.

90,0 % добычи алмазов в мире. При этом Россия Айвазов С.Ю., Минашкин В.Г. Эволюция и и Ботсвана на протяжении многих лет сохраняют структура мирового рынка алмазов // Вестн. Рос первенство по объемам добычи алмазов. тов. гос. экон. ун-та (РИНХ). 2012. Июнь ( 2 (38)).

Третий кластер составляют страны, которые Боровиков В.П. Программа STATISTICA для не выделяются по показателям участия в между- студентов и инженеров. 2-е изд. М., 2001. С. 186.

Халафян А.А. STATISTICA 6. Статистический народной торговле алмазами. Тем не менее дан анализ данных : учебник. 3-е изд. М., 2007. С. 250.

ная группа является самой многочисленной по количеству образующих ее государств и в перс Поступила в редакцию 04.04.2012 г.

   Книги, научные публикации