( ) x i ( ) x Пусть = наблюдаемые значения некоторой многомерной i i M ( ) p x i переменной размерности p, i, (i = 1, n), =(,,K, ).
1 2 n А задачей является переход к некоторой многомерной перемен(1) z () (p ) ной размерности p < p : () = M в классе (p ) z () ( j ) (1 ) (1 ) (2 ) (2 ) z = c (x - a )+ c (x - a )+ K + j1 j F = p p 1, j = l ( p ) ( p ) + c (x - a ): c c = j1 jk lk 0, j l k = (i) допустимых преобразований исходных переменных (где a - среднее значение по i-й компоненте) при использовании признака информативности (критерия выбора главных компонент) (p ) (1) Var(z ())+ K + Var(z ()) (p ) I( ())= (p) (1) Var(x )+ K + Var(x ).
(1) Тогда первой главной компонентой z () исследуемой системы показателей называется нормированно-центрированная линейная комбинация этих показателей, которая среди прочих нормированноцентрированных линейных комбинаций данных показателей обладает наибольшей дисперсией.
(k) k-й главной компонентой z (), (k = 2, p) исследуемой системы показателей называется нормированно-центрированная линейная комбинация этих показателей, которая не коррелирована с kЦ1 предыдущими главными компонентами и среди всех прочих нормированно-центрированных и не коррелированых с kЦ1 предыдущими главными компонентами линейных комбинаций данных показателей обладает наибольшей дисперсией.
C C Пусть C = (c c c ), C = и E() = (0), т.е. считаем, j jp j1, j2,K, M C p что матрица центрирована. Тогда первая главная компонента вы(1) T числяется по формуле z () = C1 при условии, что C1C1 = 1. При этом ищется такой вектор C1, что Var(C1) max C, T = C1Cчто является стандартной задачей Лагранжа на нахождение экстремума.
Так как Var(C )= C CT, где - ковариационная матрица 1 1 матрицы (заметим, что является симметричной и неотрицательно определенной, как ковариационная матрица), задача приниT C1C1 max Cмает вид. Легко показать, что данная задача сво T C1C1 = дится к нахождению наибольшего собственного числа, где 1 2 K 0 все собственные числа матрицы (которые p являются неотрицательными в силу симметричности и неотрицательной определенности ). Тогда C1 = (c11, c12,K, c1p) есть собственный вектор, соответствующий собственному значению 1.
Аналогично, C = (c c c ), j = 2, p, являются собственj jp j1, j2,K, ными векторами, соответствующими собственным числам, j = 2, p. Таким образом, матрица C есть собственная матрица j матрицы.
Исходя из вышесказанного, можно переписать критерий выбора главных компонент:
(p ) (1) 1 + K + Var(z ())+ K + Var(z ()) p (p ) I( ())= =.
(p) (1) 1 + K + Var(x )+ K + Var(x ) p (p ) Очевидно, что 0 I( ()) 1.
Обычно выбирают те p главных компонент, которые объясняют (p ) 70% и более дисперсии, т.е. I( ()) 0,7.
Для интерпретации связи главных компонент с исследуемыми показателями используется матрица факторных нагрузок A = (aij), i, j = 1, p, главных компонент на исходные признаки, которая определяется соотношением A = CT, где, очевидно, 1 0 K 0 2 M =.
M O 0 K p Заметим, что при интерпретации главных компонент необходимо учитывать элементы aij > 0,5.
Таким образом, для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов. В нашем случае каждому банку мы поставим в соответствие значения факторов, описывающих профиль деятельности.
На первом шаге мы отобрали 22 относительных показателя, аккумулирующих в себе все значимые статьи банковских балансов5:
1. Отношение собственного капитала к активам (capital).
2. Отношение прибыли до налогообложения к активам (profit).
3. Отношение депозитов частных лиц к обязательствам (deposits).
4. Доля вложений в государственные ценные бумаги в активах (govex).
5. Отношение корреспондентских счетов других банков, кредитов банкам и долговых обязательств банков к активам (bankas).
6. Отношение кредитов небанковскому сектору к активам (crednbs).
7. Доля выданных МБК в активах (mbkg).
8. Доля активов в иностранной валюте в активах (cassets).
9. Доля иностранных активов в активах (fassets).
10. Доля обязательств перед банками в обязательствах (bankliab).
Многие из приведенных 22 относительных показателей соединяют в себе несколько исходных показателей. Кроме того, мы не рассматривали статьи активов и обязательств банков, доля которых в активах/обязательствах незначительна. Наконец, в число 22 показателей не вошла структура расходов банков, так как она не добавляла ничего нового в части интерпретации факторов, однако уменьшала долю объясненной вариации факторов.
11. Доля средств небанковского сектора в обязательствах (nbsliab).
12. Доля обязательств в иностранной валюте в обязательствах (cliab).
13. Доля иностранных обязательств в обязательствах (fliab).
14. Доля доходов по ссудам клиентам в доходах по активам (loaninc).
15. Доля доходов по МБК в доходах по активам (mbkinc).
16. Доля доходов по долговым обязательствам в доходах по активам (bondinc).
17. Доля процентов, полученных от властей и ЦБ РФ, в процентных доходах (govinc1).
18. Доля доходов по банковским кредитам в процентных доходах (bankinc1).
19. Доля доходов по кредитам государственным предприятиям в процентных доходах (gnbsinc1).
20. Доля доходов по кредитам негосударственным российским предприятиям в процентных доходах (nbsinc1).
21. Доля доходов по кредитам индивидуальным предпринимателям в процентных доходах (ipinc1).
22. Доля доходов по кредитам физическим лицам в процентных доходах (consinc1).
Очевидно, что приведенных 22 характеристик слишком много для того, чтобы построить хорошо интерпретируемую классификацию региональных банковских систем. Кроме того, некоторые факторы отчасти повторяют друг друга. Наконец, данные характеристики относятся к разным сторонам деятельности банка и плохо сопоставимы между собой. Нам же хотелось получить несколько факторов, собравших в себе однородные характеристики деятельности банков, и уже на их основе провести кластерный анализ. Для достижения этой цели как нельзя лучше подходит описанный выше алгоритм факторного анализа.
На рис. 8 приведен график, отражающий дисперсии факторов, построенных на базе приведенных выше 22 переменных. Кроме того, в табл. 2 указаны значения дисперсий факторов, являющихся ключевыми характеристиками факторов при проведении факторного анализа, а также доли общей дисперсии исходного признакового пространства, которые объясняет каждый фактор.
Таблица Объясненные дисперсии факторов Объясненная дисперсия % общей дисперсии % общей дисперсии Фактор Дисперсии исходного пространства исходного пространства факторов признаков признаков (накопленным итогом) 1 3.03 13.77 13.2 3.01 13.67 27.3 2.37 10.78 38.4 2.28 10.36 48.5 1.99 9.04 57.6 1.86 8.46 66.7 1.83 8.30 74.8 1.49 6.79 81.1 3 5 7 9 11 13 15 17 19 Номер фактора Рис. 8. Дисперсии главных компонент Дисперсии Как видно из табл. 2 и рис. 8, первые 8 главных компонент объясняют более 80% вариации исходных признаков, т.е., оставив лишь 8 главных компонент, мы практически не потеряем информацию об исходных признаках. Определившись с количеством факторов, перейдем к их интерпретации. Для этого необходимо проанализировать корреляции между факторами и исходными признаками (табл. 3).
Таблица Матрица корреляций между факторами и исходными признаками Исходные Факторы признаки 1 2 3 4 5 6 7 1 DEPOSITS 0.274 Ц0.180 Ц0.011 Ц0.630 0.113 Ц0.210 0.518 0.2 GOVEX 0.164 0.102 0.911 Ц0.018 0.016 Ц0.060 0.064 0.3 BANKAS 0.164 0.119 Ц0.059 0.911 Ц0.048 Ц0.126 0.167 Ц0.4 CREDNBS Ц0.208 Ц0.079 Ц0.174 Ц0.868 0.056 Ц0.046 Ц0.228 0.5 MBKG 0.711 0.426 0.017 0.257 0.114 Ц0.174 0.075 0.6 CASSETS 0.117 0.892 0.124 0.105 Ц0.138 Ц0.151 Ц0.109 Ц0.7 BANKLIAB 0.226 0.120 Ц0.080 Ц0.175 0.008 Ц0.089 Ц0.680 0.8 NBSLIAB Ц0.029 Ц0.071 Ц0.019 0.161 Ц0.022 0.051 0.895 0.9 CLIAB 0.111 0.922 0.119 0.023 Ц0.072 Ц0.103 Ц0.080 Ц0.10 FLIAB 0.057 0.591 Ц0.144 Ц0.033 Ц0.205 0.252 Ц0.284 Ц0.11 LOANINC Ц0.722 Ц0.162 Ц0.602 Ц0.088 Ц0.090 Ц0.028 0.005 0.12 MBKINC 0.913 0.120 0.095 0.075 0.156 0.006 Ц0.041 Ц0.13 BONDINC 0.164 0.088 0.941 0.095 Ц0.031 0.040 Ц0.023 Ц0.14 GOVINC1 Ц0.114 Ц0.064 0.126 Ц0.162 Ц0.100 Ц0.121 Ц0.018 0.15 BANKINC1 0.793 0.029 0.279 0.052 Ц0.078 Ц0.003 Ц0.180 Ц0.16 GNBSINC1 Ц0.143 Ц0.169 Ц0.212 0.070 Ц0.213 0.321 Ц0.130 0.17 NBSINC1 Ц0.251 0.110 Ц0.075 0.076 Ц0.887 Ц0.229 0.083 0.18 IPINC1 0.030 Ц0.276 Ц0.101 Ц0.068 0.715 Ц0.171 0.064 Ц0.19 CONSINC1 Ц0.074 0.039 0.041 Ц0.013 0.676 0.467 0.021 Ц0.20 FASSETS 0.198 0.723 0.189 0.295 Ц0.020 Ц0.266 0.137 0.21 CAPITAL Ц0.259 Ц0.053 Ц0.038 0.053 0.198 0.761 Ц0.053 0.22 PROFIT 0.224 Ц0.229 0.031 Ц0.068 0.043 0.768 0.149 0. В табл. 3 для каждого исходного признака жирным шрифтом выделен наибольший коэффициент корреляции с одним из факторов. В случае первого и одиннадцатого признаков - доли депозитов частных лиц в обязательствах и доли доходов по ссудам клиентам в доходах по активам - выделены два коэффициента корреляции, сильно не различающиеся по абсолютной величине. После этого мы изучаем, с какими из исходных признаков коррелирует каждый фактор, и интерпретируем его.
Первый фактор положительно коррелирует с долей выданных МБК в активах, долей доходов по МБК в доходах по активам и долей доходов по банковским кредитам в процентных доходах, а отрицательно - с долей доходов по ссудам клиентам в доходах по активам. Мы интерпретируем данный фактор как вовлеченность банков региональной системы в межбанковские операции, причем за счет средств населения, так как данный фактор достаточно сильно положительно коррелирован с долей депозитов физических лиц в активах.
Второй фактор положительно коррелирован с долей активов в иностранной валюте в активах, долей обязательств в иностранной валюте в обязательствах, долей иностранных активов в активах и долей иностранных обязательств в обязательствах. Следовательно, можно хорошо интерпретировать этот фактор как индикатор, отражающий участие банков из региональной системы в валютных операциях.
Третий фактор положительно связан с долей вложений в государственные ценные бумаги в активах, долей доходов по долговым обязательствам в доходах по активам и отрицательно - с долей доходов по ссудам клиентам в доходах по активам. Мы полагаем, что третий фактор можно интерпретировать как получение банками региональных систем доходов по долговым инструментам.
Четвертый фактор положительно коррелирован с отношением корреспондентских счетов других банков, кредитов банкам и долговых обязательств банков к активам и отрицательно - с долей депозитов частных лиц в активах и долей кредитов НБС в активах. Приведенные статистические результаты позволяют интерпретировать данный фактор как вовлеченность банков региональной системы в межбанковские операции, финансируемые за счет средств небанковского сектора. Отметим, что данный фактор довольно близок по смыслу к первому фактору, однако он не может быть исключен из числа факторов, так как стабильно входит в первые 5 факторов, объясняющих большую часть вариации исходного признакового пространства, при проведении различных вариантов факторного анализа.
Пятый фактор положительно коррелирует с долей доходов по кредитам индивидуальным предпринимателям в процентных доходах и долей доходов по кредитам физическим лицам в процентных доходах, а отрицательно - с долей доходов по кредитам негосударственным российским предприятиям в процентных доходах. Иными словами, данный фактор отражает степень кредитования банками региональной системы индивидуальных предпринимателей и физических лиц.
Шестой фактор положительно коррелирован с отношением собственного капитала к активам и отношением прибыли до налогообложения к активам. Мы считаем, что этот фактор отражает капитализацию и финансовое состояние региональной банковской системы.
Седьмой фактор характеризуется положительной корреляцией с долей депозитов физических лиц в активах и долей средств небанковского сектора в обязательствах и отрицательно - с долей обязательств перед банками в обязательствах. Мы считаем, что данный фактор отражает участие банков региона в привлечении средств небанковского сектора.
Наконец, последний - восьмой - фактор положительно связан с долей процентов, полученных от властей и ЦБ РФ, в процентных доходах и долей доходов по кредитам государственным предприятиям в процентных доходах. Следовательно, он интерпретируется как уровень участия банков региона в кредитовании органов государственной власти и государственных компаний.
Таким образом, мы получили 8 факторов:
1. Участие в межбанковских операциях, финансируемых за счет средств населения (interban).
2. Участие в валютных операциях (currency).
3. Получение доходов от операций с долговыми инструментами (bonds).
4. Участие в межбанковских операциях, финансируемых за счет средств небанковского сектора (bankcred).
5. Участие в кредитовании небанковского сектора (nbscred).
6. Уровень прибыльности и капитализации региональной банковской системы (sizesol).
7. Степень привлечения средств от небанковского сектора и населения (nbliab).
8. Участие в кредитовании органов государственной власти и государственных компаний (credgov).
Перейдем теперь непосредственно к классификации региональных банковских систем по полученным факторам6.
3.2. Кластерный анализ Для классификации мы воспользовались методом k-средних. Алгоритм реализации данного метода приведен ниже во врезке.
На первом шаге выбирается число кластеров k.
На втором шаге за центры искомых k кластеров принимают случайно выбранные k наблюдений - точки x x,..., xk размерности 1, l, а каждому кластеру присваивают единичный вес.
На третьем шаге находятся расстояния от точки xk до центров +кластеров, построенных на предыдущем шаге, и точку xk относят +к кластеру, расстояние до которого минимально, после чего рассчитывают новый центр тяжести этого кластера (как средневзвешенное по каждому показателю) и вес кластера увеличивают на единицу;
все остальные кластеры остаются неизмененными (с прежними цен В Приложении 1 приведены значения факторов для всех региональных банковских систем.
трами и весами). В качестве метрики используется простое евклидоl во расстояние (xi, xz ) = (xim - xzm )2.
m=На четвертом шаге аналогичную процедуру выполняют для точки xk+2 и т. д.
После определенного достаточно большого числа n классифицируемых объектов или достаточно большого числа итераций пересчет центров тяжести практически перестает приводить к их изменению.
Pages: | 1 | ... | 8 | 9 | 10 | 11 | 12 | ... | 17 | Книги по разным темам