Разработка требований 28 Подбор оптимального решения 31 > Развитие решения 34 Введение

Вид материалаДокументы
5.6 Выбор алгоритма кредитного скоринга
5.6.2 Оценка алгоритмов скоринга
5.6.3 Определение оптимального бала отсечения
6. Процесс внедрения скоринговой системы в банке
Пять этапов создания системы кредитного скоринга
6.1 Постановка задачи
Подобный материал:
1   2   3

5.6 Выбор алгоритма кредитного скоринга

5.6.1 Сравнительный анализ скоринговых алгоритмов


Для проведения сравнительного анализа скоринговых алгоритмов будут рассматриваться те модели, которые широко используются в банковской практике. Из существующего множества математических моделей скоринга наиболее популярными сегодня являются три основных алгоритма. Алгоритмы построенные на основе:
  • логистической регрессии;
  • дерева классификации;
  • нейронной сети.

Основное различие между этими тремя методами заключается в подходах к способам сегментации прецедентов обучающей выборки.

Сама сегментация имеет цель определить значимые факторы, влияющие на вероятности возможных исходов кредитных сделок, что возможно, если между сконструированными сегментами можно выявить статистически значимое различие в соотношении положительных и отрицательных прецедентов.

В методе логистической регрессии сегментация прецедентов осуществляется на основе разбиения факторного пространства n-мерной сеткой, где n - количество значимых факторов (рис.1).





Рис. 1 Сегментация прецедентов в методе логистической регрессии

В качестве исходного предположения принимается, что каждая ячейка сетки (n-мерный прямоугольник) объединяет прецеденты из обучающей выборки, характеризующиеся одинаковой вероятностью исхода.

Координаты узлов этой сетки рассчитываются на основании статистических критериев, исходя из принципа максимальности различия между вероятностями исходов кредитных сделок для смежных сегментов прецедентов.

Соотношение положительных и отрицательных прецедентов в каждом сегменте используется для расчета скоринг-баллов в скоринговой карте, а координаты узлов сетки в факторном пространстве как раз и задают интервалы значений признаков в скоринговой карте.

Логистическая регрессия является, таким образом, адекватным математическим инструментом для расчета скоринговых карт.

Дерево классификаций (дерево решений) является более общим алгоритмом сегментации обучающей выборки прецедентов, чем логистическая регрессия.

В отличие от метода логистической регрессии в методе дерева классификации сегментация прецедентов задается не с помощью n-мерной сетки, а путем последовательного дробления факторного пространства на вложенные прямоугольные области (рис. 2).





Рис. 2 Сегментация прецедентов в методе дерева классификации


При этом соблюдается следующая последовательность шагов (рис. 3).





Рис. 3 Последовательность шагов в методе дерева классификации

На первом шаге разделение выборки прецедентов на сегменты производится по самому значимому фактору. На втором и последующих шагах в отношении каждого из полученных ранее сегментов процедура повторяется до тех пор, пока никакой вариант последующего дробления не приводит к существенному различию между соотношением положительных и отрицательных прецедентов в новых сегментах.

Количество ветвлений (сегментов) на каждом шаге процедуры построения дерева решений выбирается автоматически.

Нейронная сеть позволяет обрабатывать прецеденты обучающей выборки с более сложным (чем прямоугольники) видом сегментов (рис. 4). Геометрическая форма сегментов будет существенно зависеть от внутренней структуры нейронной сети, которая может быть настроена с учетом характера взаимосвязей между учитываемыми факторами.




Рис. 4 Сегментация прецедентов при использовании метода нейронных сетей

Хотя ни дерево решений, ни нейронная сеть не приводят к построению скоринговой карты в ее классическом табличном виде, аналог скоринг-баллов легко может быть получен и для этих методов.

В качестве скоринг-балла может выступать, например, эмпирически рассчитанная доля положительных прецедентов в сегменте. И тогда задача расчета скоринг-балла потенциального заемщика равносильна задаче отнесения потенциального заемщика к одному из построенных сегментов, что и делается в результате применения построенных скоринговых алгоритмов к новому потенциальному заемщику.

5.6.2 Оценка алгоритмов скоринга


Практики использования этих алгоритмов показывает, что ни один из описанных методов не может быть признан «самым лучшим» во всех случаях. И только практическое сопоставление результатов предсказания и полученных фактически может дать оценку эффективности скоринговых моделей.

Для сопоставления можно взять всю или часть имеющейся эмпирической прецедентной выборки.

Само сравнение алгоритмов скоринга может осуществляться по разным критериям. Один из применяемых на практике критериев сравнения состоит в следующем.

Упорядочив выборку прецедентов по возрастанию оценок вероятности положительного исхода, которые получены на основании алгоритма скоринга, можно построить следующий график: на оси Х отражаются значения долей этой упорядоченной выборки (слева направо по возрастанию вероятности положительного и схода), а на оси Y - доля фактически отрицательных прецедентов в подвыборке, отвечающей координате X.

Построенный график будет показывать, какой процент Y действительных отрицательных прецедентов содержится в первых X процентах упорядоченной выборки. А это означает, что чем выше линия графика поднята над осью X, тем более точно алгоритм скоринга решает поставленную задачу.

Теперь для сравнения алгоритмов скоринга по предиктивной мощности достаточно сравнить соответствующие им построенные графики. Если график какого-либо метода «возвышается» над графиками остальных методов, то этот алгоритм и является самым информативным.




Рис. 5 График сравнения трех алгоритмов

Но может оказаться и так, что абсолютного преобладания ни у одного алгоритма нет. Рассмотрим пример такого расположения графиков на рис. 5.

Алгоритм 1 уступает по предиктивной мощности алгоритмам 2 и 3 для малых значений X, но превосходит их на больших.

В свою очередь алгоритм 2 более эффективен для средних значений X, а алгоритм 3 - для малых.

Это может означать, что для реализации более консервативной кредитной политики более адекватным для задачи кредитного скоринга является алгоритм 3, а для реализации политики широкого, но более рискованного кредитования — алгоритм 1.

5.6.3 Определение оптимального бала отсечения


Какой политики банк должен придерживаться, требует дополнительного экономического анализа. Определенную помощь при проведении такого анализа могут оказать сценарные расчеты.

Для примера рассматривается единственный кредитный продукт (кредит с одинаковыми условиями для всех заемщиков). В качестве сценария предусматривается выдача кредита заемщикам, скоринг-балл которых не ниже некоторого значения (так называемого балла отсечения).

Для разных баллов отсечения состав кредитного портфеля банка будет различаться. Чем больше балл отсечения, тем меньше количество выданных кредитов, но тем более вероятен положительный исход кредитной сделки по каждому выданному кредиту. Это означает, что более высокий балл отсечения соответствует более консервативной кредитной политике, и наоборот. Понятно, что чем ниже балл отсечения, тем больше в кредитном портфеле будет находиться кредитов с более низкой вероятностью возврата.

Вводится понятие средней доходности по кредитному портфелю, которая представляет собой разницу между ожидаемыми процентными доходами и ожидаемыми расходами по портфелю, отнесенную на количество выданных кредитов.

Расходы по портфелю состоят из сумм невозвратов, то есть прямых потерь банка по дефолтам. К расходам также следует отнести постоянные издержки по обслуживанию кредитного портфеля (зарплату персонала, арендную плату за офисные площади, накладные расходы и т.п.).

Ожидаемые суммы доходов и расходов напрямую связаны с количеством выданных кредитов, вероятностями положительного и отрицательного исходов кредитных сделок, которые зависят от кредитоспособности заемщиков, а следовательно, и от их скоринг-баллов.





Рис. 6 График средней доходности по кредитному портфелю в зависимости от балла отсечения

Если построить график средней доходности по кредитному портфелю в зависимости от балла отсечения, то теоретически он будет иметь максимум в некоторой точке (рис. 6). Эта точка и определяет оптимальный балл отсечения, который может быть выбран банком для реализации своей стратегии кредитования.


6. Процесс внедрения скоринговой системы в банке

Построение системы кредитного скоринга в банке представляет собой не обособленную функцию оценки надежности заемщика, а часть всего процесса андеррайтинга заемщика.

Пять этапов создания системы кредитного скоринга

1. Постановка задачи и определение желаемого конечного результата.

2. Разработка требований к решению (технических, организационных, экономических и пр.) и определение на их основе критериев для оценки качества решения.

3. Подбор оптимального решения. Проверка по критериям.

4. Тестирование и внедрение решения. Корректировка бизнес-процессов в связи с применением новой технологии.

5. Дальнейшее развитие решения.

6.1 Постановка задачи

От постановки задачи зависит конечный результат. Пример постановки задачи по созданию системы кредитного скоринга.

Задача: Необходимо создать механизм оценки надежности заемщиков на этапе их обращения в банк, при процедуре принятия решения и выдачи кредита, а также в последующем, при оценке сероятности возврата и взыскания кредита на всем протяжении срока действия этого кредита.. При этом процедуру оценки кредитоспособности (андеррайтинг) заемщика необходимо производить быстро (в течение 1-2 дней), привлекая для этого минимальное число специалистов банка, и эта процедура не должна существенно усложнять процесс получения кредитов для клиентов банка.