Сегментація позичальників та прийняття рішення за допомогою карт Кохонена

Контрольная работа - Компьютеры, программирование

Другие контрольные работы по предмету Компьютеры, программирование

даних;

У пропонованому наборі компонентів мається компонент, що реалізує власне самонавчальну карту Кохонена - TDBSOM, що може бути самостійно використаний для рішення задачі аналізу.

Крім того, мається компонент TDBSOM, що дозволяє формувати карту на основі інформації, отриманої зі стандартних компонентів Delphi для роботи з базами даних (такі як TTable і TQuery).

Також мається компонент TSOMVisualizer, що дозволяє відобразити отриману карту в зручному для сприйняття графічному виді.

На рисунку 1 представлені карти, що показують розподіл позичальників по характеристиках “Сума кредиту”, “Термін кредиту”, “Ціль кредитування”(турпоїздки, покупка товарів, покупка та ремонт нерухомості, оплата навчання, оплата послуг, та інше), “Середньомісячний доход”, “Кількість утриманців” і “Вік”. Проведемо аналіз представлених даних.

 

Рисунок 1 - Карти Кохонена

 

Спочатку необхідно дати аналіз по кожній характеристиці окремо, а потім вже оцінити їхній загальний звязок.

На карті видна рівна кількість як бажаючих узяти суми до 20 000 гривень так і досить вагомі суми до 80 000 гривень. Причому, виходячи з даних карти середньомісячного доходу, практично всі позичальники мають однаковий прибуток 2 3 тис. грн., з якого випливає подібність карт “суми кредиту” і “терміну кредиту” - з тим самим доходом великі суми беруться на більший період.

По карті “вік” можна судити про затребуваність кредитів серед молоді - половина кредитів беруть позичальники молодше 30 років.

По сукупності карт “кількість утриманців” і “середньомісячний доход” можна судити про питому прибутковість на кожного члена родини позичальника. Зрозуміло, що при однакових доходах до позичальників з меншою кількістю утриманців довіра більше.

Переважна більшість кредитів беруться на покупку товарів тривалого споживання. Причому, навіть тут можна виділити як дешеві, так і дорогі товари:

 

Рисунок 2 - Виділення групи кредитів на дорогі товари

 

Цікава також група позичальників з мінімальним доходом (рис. 3). Як видно, їхня активність спостерігається в сфері оплати послуг, а також у сфері оплати за освіту. Також частина позичальників здобуває в кредит дешеві товари.

 

Рисунок 3 - Область кредитування позичальників з малим доходом

 

Карти Кохонена також вирішують задачу кластеризації.

На рисунку 4 усі позичальники розбиті на кілька сегментів.

 

Рисунок 4 - Виявлені сегменти позичальників

 

Опишемо кожний із представлених сегментів.

  1. 0 сегмент найбільший, представляє всіх позичальників старше 30 років. Це найбільш консервативна частина всіх позичальників, тому їй властиві подібні риси і, отже, необхідний однаковий підхід при наданні їм послуг кредитування, а також їхньої класифікації. Позичальники ж молодше 30 років поділяються ще на 4 сегменти:
  2. 1 сегмент більш заможні молоді родини, що бажають облаштувати своє житло. Причому верхня частина сегменту проблемні позичальники, що неадекватно оцінюють свої можливості;
  3. 2 сегмент працюючі студенти;
  4. 3 сегмент позичальники, що здобувають у кредит дешеві товари;
  5. 4 сегмент група позичальників, що бере кредит на ремонт;
  6. 5 сегмент позичальники, що одержують у кредит освіту і різні послуги.

Кластеризація показала, що на ринку кредитування фізичних осіб існують не тільки різні напрямки - кредитування товарів, освітні кредити і т.д., але і різні сегменти позичальників, що користуються тим самим видом послуг.

Для цих груп потенційних позичальників необхідно дати нечітку оцінку його кредитоспроможності, наприклад, увівши поняття ймовірності повернення кредиту повністю й у строк Для побудови такої моделі необхідно представити рішення про видачу кредиту в числовому виді: 0 - "поганий кредит", 1 - "добрий кредит".

Тоді після побудови моделі на виході вийде саме ймовірність повернення. Керуючому ж залишається лише задати граничне значення ймовірності, і якщо результат вище його, то ухвалювати рішення щодо видачі кредиту, якщо нижче, то відмовляти.

Отримана модель дає можливість прямо управляти рівнем ризику. Можна звести ризик до мінімуму, указавши як поріг 1 або підвищити його при менших значеннях порога (але й, відповідно до практики, що застосовується в банках, перекласти його на позичальників).

Це дозволить залишатися у виграшному положенні перед конкурентами: знизити вартість певних послуг до рівня конкурентів, але також при цьому збільшити поріг, знизивши ризик.

Проведемо апробацію експертної системи. Для цього візьмемо кредитну історію позичальників (150 записів), як з поганими так і добрими характеристиками, а також кілька анкет, заповнених позичальниками для перевірки правильності ухвалення рішення по видачі кредитів. Анкети позичальників візьмемо з зовсім різними вхідними факторами, для того щоб вони потрапили в різні кластери при сегментації на картах Кохонена з підсумковою відповіддю про видачу кредиту.

Проведемо аналіз отриманих результатів.

 

Рисунок 5 Результат сегментації на картах Кохонена

 

На рисунку 5 видно, що приклади анкетних даних, узятих для тестування системи були сегментовані з подібними даним з навчальної вибірки за допомогою карт Кохонена, вони на картах позначені мітками.

На виході було отримано 4 кластери, у яких дані сегментовані по подібних вхідних і вихідних факторах.

На карті видно що приклади 1, 3, 4