Сегментація позичальників та прийняття рішення за допомогою карт Кохонена
Контрольная работа - Компьютеры, программирование
Другие контрольные работы по предмету Компьютеры, программирование
даних;
У пропонованому наборі компонентів мається компонент, що реалізує власне самонавчальну карту Кохонена - TDBSOM, що може бути самостійно використаний для рішення задачі аналізу.
Крім того, мається компонент TDBSOM, що дозволяє формувати карту на основі інформації, отриманої зі стандартних компонентів Delphi для роботи з базами даних (такі як TTable і TQuery).
Також мається компонент TSOMVisualizer, що дозволяє відобразити отриману карту в зручному для сприйняття графічному виді.
На рисунку 1 представлені карти, що показують розподіл позичальників по характеристиках “Сума кредиту”, “Термін кредиту”, “Ціль кредитування”(турпоїздки, покупка товарів, покупка та ремонт нерухомості, оплата навчання, оплата послуг, та інше), “Середньомісячний доход”, “Кількість утриманців” і “Вік”. Проведемо аналіз представлених даних.
Рисунок 1 - Карти Кохонена
Спочатку необхідно дати аналіз по кожній характеристиці окремо, а потім вже оцінити їхній загальний звязок.
На карті видна рівна кількість як бажаючих узяти суми до 20 000 гривень так і досить вагомі суми до 80 000 гривень. Причому, виходячи з даних карти середньомісячного доходу, практично всі позичальники мають однаковий прибуток 2 3 тис. грн., з якого випливає подібність карт “суми кредиту” і “терміну кредиту” - з тим самим доходом великі суми беруться на більший період.
По карті “вік” можна судити про затребуваність кредитів серед молоді - половина кредитів беруть позичальники молодше 30 років.
По сукупності карт “кількість утриманців” і “середньомісячний доход” можна судити про питому прибутковість на кожного члена родини позичальника. Зрозуміло, що при однакових доходах до позичальників з меншою кількістю утриманців довіра більше.
Переважна більшість кредитів беруться на покупку товарів тривалого споживання. Причому, навіть тут можна виділити як дешеві, так і дорогі товари:
Рисунок 2 - Виділення групи кредитів на дорогі товари
Цікава також група позичальників з мінімальним доходом (рис. 3). Як видно, їхня активність спостерігається в сфері оплати послуг, а також у сфері оплати за освіту. Також частина позичальників здобуває в кредит дешеві товари.
Рисунок 3 - Область кредитування позичальників з малим доходом
Карти Кохонена також вирішують задачу кластеризації.
На рисунку 4 усі позичальники розбиті на кілька сегментів.
Рисунок 4 - Виявлені сегменти позичальників
Опишемо кожний із представлених сегментів.
- 0 сегмент найбільший, представляє всіх позичальників старше 30 років. Це найбільш консервативна частина всіх позичальників, тому їй властиві подібні риси і, отже, необхідний однаковий підхід при наданні їм послуг кредитування, а також їхньої класифікації. Позичальники ж молодше 30 років поділяються ще на 4 сегменти:
- 1 сегмент більш заможні молоді родини, що бажають облаштувати своє житло. Причому верхня частина сегменту проблемні позичальники, що неадекватно оцінюють свої можливості;
- 2 сегмент працюючі студенти;
- 3 сегмент позичальники, що здобувають у кредит дешеві товари;
- 4 сегмент група позичальників, що бере кредит на ремонт;
- 5 сегмент позичальники, що одержують у кредит освіту і різні послуги.
Кластеризація показала, що на ринку кредитування фізичних осіб існують не тільки різні напрямки - кредитування товарів, освітні кредити і т.д., але і різні сегменти позичальників, що користуються тим самим видом послуг.
Для цих груп потенційних позичальників необхідно дати нечітку оцінку його кредитоспроможності, наприклад, увівши поняття ймовірності повернення кредиту повністю й у строк Для побудови такої моделі необхідно представити рішення про видачу кредиту в числовому виді: 0 - "поганий кредит", 1 - "добрий кредит".
Тоді після побудови моделі на виході вийде саме ймовірність повернення. Керуючому ж залишається лише задати граничне значення ймовірності, і якщо результат вище його, то ухвалювати рішення щодо видачі кредиту, якщо нижче, то відмовляти.
Отримана модель дає можливість прямо управляти рівнем ризику. Можна звести ризик до мінімуму, указавши як поріг 1 або підвищити його при менших значеннях порога (але й, відповідно до практики, що застосовується в банках, перекласти його на позичальників).
Це дозволить залишатися у виграшному положенні перед конкурентами: знизити вартість певних послуг до рівня конкурентів, але також при цьому збільшити поріг, знизивши ризик.
Проведемо апробацію експертної системи. Для цього візьмемо кредитну історію позичальників (150 записів), як з поганими так і добрими характеристиками, а також кілька анкет, заповнених позичальниками для перевірки правильності ухвалення рішення по видачі кредитів. Анкети позичальників візьмемо з зовсім різними вхідними факторами, для того щоб вони потрапили в різні кластери при сегментації на картах Кохонена з підсумковою відповіддю про видачу кредиту.
Проведемо аналіз отриманих результатів.
Рисунок 5 Результат сегментації на картах Кохонена
На рисунку 5 видно, що приклади анкетних даних, узятих для тестування системи були сегментовані з подібними даним з навчальної вибірки за допомогою карт Кохонена, вони на картах позначені мітками.
На виході було отримано 4 кластери, у яких дані сегментовані по подібних вхідних і вихідних факторах.
На карті видно що приклади 1, 3, 4