Оценка кредитоспособности заемщиков БИНБАНК методами нейросетевого моделирования

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



Вµй выходного слоя могут служить линейная, сигмоида, Ле-Кана. Данные функции имеют следующий вид:

сигмоида ;

линейная

Таким образом, используя все возможности нейросимулятора, попытаемся оптимизировать количество нейронов на внутреннем слое [21]. Для этого найдем сначала ошибку обучения для количества нейронов на скрытом слое в интервале от 1 до 10.

Таблица 5

Ошибка обучения при активационной функции сигмоида

Кол-во нейронов12345Ошибка обучения4,02 %3,63 %3,58 %3,06 %3,12 %Кол-во нейронов678910Ошибка обучения5,63 %4,58 %4,17 %3,75 %4,37 %

Видим, что наименьшие ошибки обучения достигнуты при активационной функции сигмоида при 3, 4 и 5 нейронах на внутреннем слое. Чтобы понять, в каком случае сеть обучилась лучше необходимо найти ошибку выборки тестирования. Для этого была взята выборка из 12 заемщиков (Приложение 12).

С помощью тестирующей выборки определим, какая обученная сеть и с каким количеством нейронов на скрытом слое будет обладать наименьшей ошибкой определения кредитного риска.

Таблица 6

Ошибки обучения и тестирования для различного числа нейронов на скрытом слое

Количество нейронов345Ошибка обучения3,58%3,06 %3,12 %Ошибка тестирования1,48 %0,85 %1,57 %

Таким образом, как видим из таблицы, минимальная ошибка обучения и тестирования при 8 входных параметрах и одном выходном параметре наблюдается при четырех нейронах на скрытом слое. При этом активационной функцией выходного параметра должна быть сигмоида. Более того, если мы посмотрим на результаты, которые показала обученная нейронная сеть при данных условиях, то можно сказать, что ошибок практически не наблюдалось. А если произвести округление прогнозируемого значения (Y1) и сравнить с исходными данными (D1), то можно увидеть, что обученный персептрон полностью правильно спрогнозировал кредитный риск.

Рисунок 5. Проверка нейросети с 4 нейронами на скрытом слое на тестирующей выборке

Можно сделать вывод, что обученная нейронная сеть показала высокие результаты прогнозирования кредитного риска. Более того, ошибки обучения и тестирования, которые стремятся к нулю, свидетельствуют нам о том, что риск неправильного определения проблемного заемщика является минимальным. График обучения (нейросеть с 4 нейронами на скрытом слое) отражен на рис.7.

Рисунок 8. График обучения нейросети

Итак, наша программируемая нейронная сеть выглядит следующим образом.

Рисунок 8. Схема обученной нейронной сети

Таблица 7

Характеристики нейронной сети

СлойКоличество нейроновАктивационная функцияВходной8ЛинейнаяСкрытый4СигмоидаВыходной1Сигмоида

При этом получаем, что общее число нейронов составляет 13.

Алгоритм обучения - обратное распространение ошибки.

Скорость - 0,08.

Количество эпох - 10 000.

Инициализация весов - стандартное распределение.

Масштабирование данных - линейное

2.3 Оптимизация и упрощение нейронной сети

Одним из недостатков построенной нами модели является ее громоздкость. Поскольку, iитается, чем проще модель - тем лучше. При этом необходимо, чтобы более простая модель не теряла своих свойств прогнозирования кредитного риска. Таким образом, следующей задачей, стоящей перед нами будет оптимизация модели. Необходимо исключить те факторы, которые не оказывают значительного влияния на конечный результат. Будем несколько видоизменять построенную нейронную сеть за iет сокращения входных параметров. Однако при этом необходимо проследить, чтобы не возрастала ошибка обучения и тестирования. Другими словами, необходимо упростить модель так, чтобы она содержала минимально возможное число входных параметров, но при этом не потеряла своих свойств и не выросла погрешность при прогнозировании кредитоспособности заемщика [21].

Следующим шагом оптимизации построенной нейронной сети будет определение значимости параметров. Для этого воспользуемся опцией программы Нейросимулятор NSim 3, носящей название Значимость входов сети. При этом стоит отметить, что будет проанализирована не только значимость обучения, но и значимость обобщения.

Рисунок 9. Оценка значимости входящих параметров

Максимально возможное значение данного показателя может равняться 1. То есть, чем ближе значение к 1, тем значимее показатель для построенной нейронной сети. Если же показатель значимости входящего параметра составляет 0, то данный финансовый коэффициент не играет никакой роли в определении кредитного риска заемщика. Итак, получаем следующие показатели значимости входящих параметров, отсортированные в порядке убывания (таблица 8).

Таблица 8

Значимость входящих параметров нейросети

параметрыПоказатель значимостиX11X80.682X30,512X60,498X40,379X20,366X50,226X70,045

Анализируя таблицу 13 можно сделать вывод, что показатели, расположенные ниже Х5 значительно уступают в значимости остальным показателям. Таким образом, исключим эти показатели из построенной нейронной сети. В итоге, оставив наиболее значимые показатели, получаем следующие входящие параметры модели (Таблица 9).

Таблица 9

Входные параметры оптимизированной нейросети

Наименование параметра ОбозначениеСрок кредита (месяцы)Х1Сумма кредитаХ2Год заключения кредитного договораХ3Год погашения кредитаХ4Возраст компании (месяцы)Х5Цель кредитованияХ6Тип обеспечения Х8Тип потенциального заемщикаY

Получаем, что количество входящих параметров сократилось с 8 до 7. Т