Национальные особенности кредитного скоринга
Дипломная работа - Банковское дело
Другие дипломы по предмету Банковское дело
?делей, можно сказать, что данные всегда разделены на две части: в первой - все переменные, которые используются для предсказания того или иного события (например, дефолта), во второй - переменная, характеризующая наступление того или иного события.
Количество необходимых данных может быть разным, но в целом оно должно удовлетворять требованиям статистической значимости и хаотичности. На этом этапе точное количество данных не имеет значения, так как это зависит от определения плохого заемщика, которое будет установлено на следующем этапе. Однако по правилам для корректного построения скоринговой карты претендента достаточно приблизительно 2 тыс. плохих записей и 2 тыс. хороших, которые могут быть случайно выбраны для каждой скоринговой карты из набора заемщиков, получивших кредит в течение определенного интервала времени. Для поведенческих скоринговых карт это будет уже другой набор данных, отражающий платежное поведение клиента, а для скоринговых карт должников используются записи со статусом просрочки платежа. Данные об отказах (2 тыс. записей) также могут применяться для построения скоринговой карты. Количество заявлений и отчеты по потерям/просрочкам платежей дают первоначальную идею относительно цели и степени ее достижения. На практике труднее найти достаточное количество плохих записей, чем хороших.
Проектная команда также должна определить, насколько надежны внутренние данные, предназначенные для разработки скоринговой карты. Демографические данные, а также неподтвержденные публичные данные, например доход, указанный самим заемщиком, могут оказаться искаженными, в то время как данные кредитного агентства, сведения о регистрации недвижимого имущества, финансовая отчетность и т.д. являются более достоверными и реально могут использоваться. Если решено, например, что данные о заемщиках, предоставленные филиалами, ненадежны, то скоринговая карта может быть построена исключительно на данных кредитного бюро.
Банк решает самостоятельно - разработать скоринговую карту на основе только внутренних данных или добавить к этим данным еще и внешние источники, такие как кредитные бюро и внешние информационные провайдеры. Предпочтительно иметь эти данные в электронном виде, хотя в российской банковской практике, к сожалению, до сих пор практикуется бумажный вариант анкет заемщика, которые буквально вручную приходится вносить в компьютер. Естественно, это требует дополнительных ресурсов и задерживает процесс разработки. При этом любопытен тот факт, что региональные отделения в этом вопросе зачастую оказываются более подкованными и продвинутыми по сравнению с центром.
Определившись с типом данных, следует переходить к непосредственному их сбору. Собирать их необходимо в строго определенном формате, отражающем параметры проекта разработки скоринговой карты.
Проектные параметры прежде всего включают в себя определение хороших и плохих заемщиков, временной горизонт и ограничения (исключения) в использовании определенных данных при создании выборки и непосредственно в процессе разработки карты.
Есть поля, обязательные к заполнению, а есть опционные. В первую очередь нас интересуют следующие поля, извлеченные из данных:
lномер клиента/идентификационный номер;
lдата обращения/получения кредита;
lдемографические характеристики заемщика;
lистория задолженности в течение жизни скоринговой карты;
lиндикатор заявки заемщика - Одобрить/Отказать;
lпродукт (тип кредита);
lтекущий статус заемщика (например, нет операций по счету/счет закрыт/потеря пластиковой карты/мошенничество и т.д.)
При разработке скоринговой карты поведения заемщика учитывается вся информация на протяжении определенного временного интервала, обычно за последние 6 - 12 месяцев.
В зависимости от бизнес-целей карты в нее могут добавляться всевозможные другие данные, в том числе демографические: возраст, регион, время проведения определенных акций, индикаторы на основе данных бюро и любые другие критерии, которые могут оказаться полезными при создании всестороннего профиля клиентской базы вашего банка.
Данные формируются в структуре, соответствующей задаче проекта. Например, эти банковские данные могут быть размещены с многократными строками для каждой комбинации продукта/учетной записи или с отдельной строкой для каждой учетной записи и многократных столбцов для каждого продукта.
Подготовка данных занимает 90% ресурсов проекта. В принципе, процесс моделирования мог бы принести гораздо большую выгоду, но после изнурительной фазы подготовки данных времени, чтобы провести очистку моделей предсказания, как правило, просто не остается.
Угроза срыва проекта кроется на стадии подготовки данных, когда они идентифицируются, трансформируются и собираются из различных источников, преобразуются и объединяются. Во многих случаях получение данных занимает столько времени, что на выполнение других задач, в том числе и анализа данных, его уже практически не хватает.
Этап: Качество и очистка данных. Определение параметров проекта. Период созревания.
Скоринговые карты строятся исходя из предположения о том, что прошлое отражает будущее. Таким образом, базируясь на данных об открытых ранее кредитах и анализируя имеющуюся информацию, можно предсказать результат (поведение) будущих заемщиков. Для того чтобы корректно выполнить