Контрольная работа: Сегментація позичальників та прийняття рішення за допомогою карт Кохонена

У Deductor Studio використовуються самі могутні технології, такі як багатомірний аналіз, нейронні мережі, дерева рішень, самонавчальні карти, спектральний аналіз і безліч інших.

При цьому акцент зроблений на самонавчальні методи і машинне навчання, що дозволяє будувати адаптивні системи, тобто здатні реагувати на зміну ситуації.

Використання методів, що самонавчаються, і майстрів для настроювання, дозволяє знизити вимоги до підготовки персоналу, роблячи сучасні технології доступними широкому колу користувачів.

Для того, щоб почати аналіз, необхідно одержати табличні дані зі стороннього джерела.

Природа джерела даних значення не має. Deductor Studio підтримує безліч джерел даних: сховище даних Deductor Warehouse, промислові СУБД (Oracle, MS SQL), текстові файли, офісні програми (Excel, Access), ADO і ODBC джерела.

Наступним кроком є обробка даних. Під обробкою мається на увазі будь-яка дія зв'язана з перетворенням даних. Механізми обробки можна комбінувати довільним образом. Доступні наступні: нейронні мережі, дерева рішень, самонавчальні карти, асоціативні правила, лінійна регресія і безліч інших.

Переглянути результати можна за допомогою механізмів візуалізації. Візуалізувати можна будь-який об'єкт у сценарії обробки. Програма самостійно аналізує, яким образом можна відобразити інформацію, користувач повинний тільки вибрати потрібний варіант – статистика, граф нейросети, ієрархічна система правил, карти і т.д..

Завершальним кроком у сценарії обробки найчастіше є експорт даних. Підтримуються наступні формати: сховище даних Deductor Warehouse, Microsoft Access, Microsoft Excel, Microsoft Word, HTML, XML, Dbase, текстової файл із роздільниками.

Переваги системи:

- Одержання даних для навчання з текстового файлу, СУБД;

- Різні способи нормування даних;

- Створення багатошарових нейронних мереж різної конфігурації;

- Настроювання параметрів навчання нейросистеми;

- Можливість зберегти результати навчання;

- Автоматизація навчання системи – є можливість використання тестової безлічі як валідаційного, тобто можливість автоматично припинити навчання при зростанні помилок на тестовій безлічі, що дозволяє скоротити ризик перенавчання системи;

- Автоматичне формування навчальної і тестової безлічі. Додатково змінений спосіб формування навчальної безлічі, що також поліпшує якість навчання;

- При навчанні можливість варіювання вхідними параметрами системи;

- Відмінна візуалізація даних;

У пропонованому наборі компонентів мається компонент, що реалізує власне самонавчальну карту Кохонена - TDBSOM, що може бути самостійно використаний для рішення задачі аналізу.

Крім того, мається компонент TDBSOM, що дозволяє формувати карту на основі інформації, отриманої зі стандартних компонентів Delphi для роботи з базами даних (такі як TTable і TQuery).

Також мається компонент TSOMVisualizer, що дозволяє відобразити отриману карту в зручному для сприйняття графічному виді.

На рисунку 1 представлені карти, що показують розподіл позичальників по характеристиках “Сума кредиту”, “Термін кредиту”, “Ціль кредитування”(турпоїздки, покупка товарів, покупка та ремонт нерухомості, оплата навчання, оплата послуг, та інше), “Середньомісячний доход”, “Кількість утриманців” і “Вік”. Проведемо аналіз представлених даних.

Рисунок 1 - Карти Кохонена

Спочатку необхідно дати аналіз по кожній характеристиці окремо, а потім вже оцінити їхній загальний зв'язок.

На карті видна рівна кількість як бажаючих узяти суми до 20 000 гривень так і досить вагомі суми до 80 000 гривень. Причому, виходячи з даних карти середньомісячного доходу, практично всі позичальники мають однаковий прибуток 2 – 3 тис. грн., з якого випливає подібність карт “суми кредиту” і “терміну кредиту” - з тим самим доходом великі суми беруться на більший період.

По карті “вік” можна судити про затребуваність кредитів серед молоді - половина кредитів беруть позичальники молодше 30 років.

По сукупності карт “кількість утриманців” і “середньомісячний доход” можна судити про питому прибутковість на кожного члена родини позичальника. Зрозуміло, що при однакових доходах до позичальників з меншою кількістю утриманців довіра більше.

Переважна більшість кредитів беруться на покупку товарів тривалого споживання. Причому, навіть тут можна виділити як дешеві, так і дорогі товари:

Рисунок 2 - Виділення групи кредитів на дорогі товари

Цікава також група позичальників з мінімальним доходом (рис. 3). Як видно, їхня активність спостерігається в сфері оплати послуг, а також у сфері оплати за освіту. Також частина позичальників здобуває в кредит дешеві товари.

Рисунок 3 - Область кредитування позичальників з малим доходом

Карти Кохонена також вирішують задачу кластеризації.

К-во Просмотров: 135
Бесплатно скачать Контрольная работа: Сегментація позичальників та прийняття рішення за допомогою карт Кохонена