Сегментація позичальників та прийняття рішення за допомогою карт Кохонена
Контрольная работа - Компьютеры, программирование
Другие контрольные работы по предмету Компьютеры, программирование
Сегментація позичальників та прийняття рішення за допомогою карт Кохонена
Кожен позичальник має визначений набір факторів. Для аналізу ринку кредитування необхідно в першу чергу зрозуміти загальну картину. Хто бере кредити, навіщо, які існують причини відмовлень у видачі кредитів або причини неспроможності.
Для цього необхідно наочне представлення всіх наявних даних. Таку задачу можна вирішити за допомогою побудови самонавчальних карт Кохонена.
Для сегментації позичальників алгоритм формування карт ознак вхідних векторів буде наступним:
1. Ініціалізація мережі.
Ваговим коефіцієнтам мережі привласнюються малі випадкові значення.
Загальне число синаптичних ваг дорівнює (NM). Де N кількість вхідних параметрів, M загальна кількість нейронів в мережі.
2. Подача на мережу нового вхідного сигналу.
Обчислення відстані Кохонена між вхідними векторами і нейронами.
Відстань dj від вхідного сигналу до j-го нейрона визначається по формулі:
(1)
де xi - i -й елемент вхідного сигналу в момент часу t,
wi,j(t) - вага звязку від i-го елемента до нейрона j у момент часу t.
- Вибір нейрона з найменшою відстанню.
Вибирається нейрон j* , для якого відстань dj найменше.
5. Настроювання ваг нейрона j* і його сусідів.
Виробляється підстроювання ваг для нейрона j* і всіх нейронів з його зони сусідства NE. Нові значення ваг виходять по формулі :
(2)
де r(t) крок навчання, позитивне число менше одиниці, що зменшується з часом.
6. Повернення до кроку 2.
Навчання складається з двох основних фаз: на первісному етапі вибирається досить велике значення швидкості навчання і радіуса навчання, що дозволяє розташувати вектора нейронів відповідно до розподілу прикладів у вибірці, а потім виробляється точне підстроювання ваг, коли значення параметрів швидкості навчання багато менше початкових. У випадку використання лінійної ініціалізації первісний етап грубого підстроювання може бути пропущений.
Для реалізації методу сегментації за допомогою карт Кохонена був обраний пакет Deductor Studio.
Пакет Deductor Studio містить повний набір механізмів імпорту, обробки, візуалізації й експорту даних для швидкого й ефективного аналізу інформації.
Уся робота з аналізу даних у Deductor Studio базується на виконанні наступних дій:
- Імпорт даних;
- Обробка даних;
- Візуалізація;
- Експорт даних;
Усі механізми уніфіковані і виконуються за допомогою майстрів. Відправною крапкою для аналізу завжди є процедура імпорту даних. Отриманий набір даних може бути оброблений кожним з доступних способів.
Результатом обробки також є набір даних, що у свою чергу знову може бути оброблений. Результати обробки можна переглянути безліччю способів і експортувати.
Послідовність дій, які необхідно провести для аналізу даних є сценарієм, якому можна автоматично виконувати на будь-яких даних.
У Deductor Studio використовуються самі могутні технології, такі як багатомірний аналіз, нейронні мережі, дерева рішень, самонавчальні карти, спектральний аналіз і безліч інших.
При цьому акцент зроблений на самонавчальні методи і машинне навчання, що дозволяє будувати адаптивні системи, тобто здатні реагувати на зміну ситуації.
Використання методів, що самонавчаються, і майстрів для настроювання, дозволяє знизити вимоги до підготовки персоналу, роблячи сучасні технології доступними широкому колу користувачів.
Для того, щоб почати аналіз, необхідно одержати табличні дані зі стороннього джерела.
Природа джерела даних значення не має. Deductor Studio підтримує безліч джерел даних: сховище даних Deductor Warehouse, промислові СУБД (Oracle, MS SQL), текстові файли, офісні програми (Excel, Access), ADO і ODBC джерела.
Наступним кроком є обробка даних. Під обробкою мається на увазі будь-яка дія звязана з перетворенням даних. Механізми обробки можна комбінувати довільним образом. Доступні наступні: нейронні мережі, дерева рішень, самонавчальні карти, асоціативні правила, лінійна регресія і безліч інших.
Переглянути результати можна за допомогою механізмів візуалізації. Візуалізувати можна будь-який обєкт у сценарії обробки. Програма самостійно аналізує, яким образом можна відобразити інформацію, користувач повинний тільки вибрати потрібний варіант статистика, граф нейросети, ієрархічна система правил, карти і т.д..
Завершальним кроком у сценарії обробки найчастіше є експорт даних. Підтримуються наступні формати: сховище даних Deductor Warehouse, Microsoft Access, Microsoft Excel, Microsoft Word, HTML, XML, Dbase, текстової файл із роздільниками.
Переваги системи:
- Одержання даних для навчання з текстового файлу, СУБД;
- Різні способи нормування даних;
- Створення багатошарових нейронних мереж різної конфігурації;
- Настроювання параметрів навчання нейросистеми;
- Можливість зберегти результати навчання;
- Автоматизація навчання системи є можливість використання тестової безлічі як валідаційного, тобто можливість автоматично припинити навчання при зростанні помилок на тестовій безлічі, що дозволяє скоротити ризик перенавчання системи;
- Автоматичне формування навчальної і тестової безлічі. Додатково змінений спосіб формування навчальної безлічі, що також поліпшує якість навчання;
- При навчанні можливість варіювання вхідними параметрами системи;
- Відмінна візуалізація