Оценивание кредитных рисков

Курсовой проект - Компьютеры, программирование

Другие курсовые по предмету Компьютеры, программирование

?редитной организацией, которая представлена рядом вопросов, необходимых для оценки его кредита. Кредитный специалист с помощью разработанной интеллектуальной информационной системы оценивает кредитный риск, связанный с этим заемщиком на основе данных анкеты.

Ресурсами для данной интеллектуальной информационной системы является база данных признаков прошлых выданных кредитов и их оценок и признаков исследуемого кредита.

 

2Взаимодействие инженера по знаниям с экспертом

 

При оценке кредитного риска кредитные аналитики оперируют следующими понятиями: характеристики клиентов (в математической терминологии - переменные, факторы) и признаки - значения, которые принимает переменная. Если представить себе анкету, которую заполняет клиент, то характеристиками являются вопросы анкеты (возраст, семейное положение, профессия и т.д.), а признаками - ответы на эти вопросы.

Исходными данными для интеллектуального анализа являются выборка из большого количества имеющейся информации о выданных кредитах (обучающая выборка) клиентов кредитной организации, о которых уже известно, хорошими заемщиками они себя зарекомендовали или нет.

Таким образом, необходимо решить задачу классификации, где исходя из имеющейся информации, необходимо получить функцию, наиболее точно разделяющее выборку клиентов на плохих и хороших.

Собственно методы классификации весьма разнообразны и включают в себя:

статистические методы, основанные на дискриминантном анализе (линейная регрессия, логистическая

регрессия);

различные варианты линейного программирования;

дерево классификации или рекурсионно-партиционный алгоритм (РПА);

метод ближайших соседей;

логико - вероятностные;

нейронные сети или нейрокомпьютинг;

генетические и эволюционные алгоритмы.

Традиционные методы (наиболее распространенными из них являются регрессионные методы), как правило, чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.

Метод линейного программирования не дает возможности провести абсолютно точную классификацию на плохих и хороших клиентов. Задачу можно сформулировать как поиск весовых коэффициентов, для которых ошибка будет минимальной.

Дерево классификации и нейронные сети представляют собой системы, которые разделяют клиентов на группы, внутри которых уровень риска одинаков и максимально отличается от уровня риска других групп.

Нейронные сети используются главным образом при определении кредитоспособности юридических лиц, где анализируются выборки меньшего размера, чем в потребительском кредите. Но наиболее успешной областью их применения стало выявление мошенничества с кредитными карточками благодаря их способности выявлять нестандартные ситуации. В методах классификации, основанных на нейронных сетях, вводится входной слой узлов, внутренние скрытые слои узлов и выходной узел. Во входном слое число узлов равно числу признаков в объекте. К каждому узлу подходят градации признаков от распознаваемого объекта. При заданной структуре обучение нейронной сети заключается в выборе таких весов ее ребер, чтобы правильно классифицировать как можно больше объектов. Для каждого i-го объекта суммируют веса ребер, входящих в выходной узел, вычисляют вес Ci . В выходном узле используют ступенчатую передаточную функцию с порогом Cad для классификации объектов на хорошие и плохие. На величины Ci, …, N и Cad не накладывают никаких ограничений. Порог Cad должна быть такой, чтобы справа от него находились Nb плохих и слева Ng хороших объектов. Каждый объект находится от Cad на известном расстоянии. Объекты можно сравнивать по этим расстояниям.

Генетический алгоритм основан на аналогии с биологическим процессом естественного отбора. В сфере кредитования это выглядит следующим образом: имеется набор классификационных моделей, которые подвергаются мутации, скрещиваются, и в результате отбирается сильнейший, т. е. модель, дающая наиболее точную классификацию.

При использовании метода ближайших соседей выбирается единица измерения для определения расстояния между клиентами. Все клиенты в выборке получают определенное пространственное положение.

Каждый новый клиент классифицируется исходя из того, каких клиентов - плохих или хороших - больше вокруг него.

На практике, как правило, используется комбинация нескольких методов, и компании хранят свои модели в строжайшем секрете. У каждого из методов имеются свои преимущества и недостатки, кроме того, выбор того или иного метода связан со стратегией банка и с тем, какие требования банк считает приоритетными при разработке моделей. Регрессионные методы показывают значимость каждой характеристики для определения уровня риска, и поэтому особенно важны на этапе разработки анкеты, которую заполняют клиенты. Линейное программирование может оперировать большим количеством переменных и моделировать определенные условия: например, если маркетинговая стратегия банка направлена на молодежь, можно ввести условие, чтобы интегральный показатель молодых людей был выше, чем тех, кому за 60. Нейронные сети и деревья классификации позволяют выявить нелинейные связи между переменными,

которые могут привести к ошибке в линейных моделях.

При вероятностном подходе к оценке риска предполагается, что известен закон распределения возможных изменений стоимост