
Модель потребительских предпочтений клиента розничного банка. Часть 2

Cоберем массив данных по кредитным и депозитным договорам за 2015–2018 годы. Получится 5,6 млн клиентских историй, вобравших 11,3 млн сделок по восьми продуктам (см. рис. 1). Выделим обучающую выборку в размере 7,4 млн взаимодействий, по которой будем строить модели для проверки на оставшихся 3,9 млн сценариев задокументированного обслуживания.
Приступим к построению моделей прогноза покупок:
1) потребительский кредит на моментальную карту в магазине (PIL CSF) – см. рис. 2.
2) потребительский товарный кредит (CSF) – см. рис. 3.
3) кредитная карта на общие цели (СС) – см. рис. 4.
4) потребительский кредит на карту в отделении (PIL BRB) – см. рис. 5.
5) депозит (Depo) – см. рис. 6.
6) овердрафт (Over) – см. рис. 7.
7) автокредит (Auto) – см. рис. 8.
8) ипотека (Mort) – см. рис. 9.
Построенные модели и коэффициенты уравнений оказались значимы на уровне 95% вероятности. Оценим R квадрат Нэйджелкерка – критерий, показывающий долю влияния переменных модели на вероятность «угадывания» сделок, произошедших в контрольной выборке. Чтобы повысить адресность ошибки, разобьем клиентские массивы продуктов на квадранты, сформированные типом потребителей:
1) outgoing – покидающие кредитную организацию после первого опыта сотрудничества
2) subprime – обладающие низким доходом
3) mass – ведущие умеренный образ жизни
4) mass affluent – получающие средний доход
5) affluent – имеющие достаточный уровень обеспеченности
6) high affluent – способные гордиться условной зажиточностью и возрастом в диапазонах лет:
1) 20–30
2) 31–40
3) 41–50
4) 51–60
5) 61–80
Введя обозначения:
1) R квадрат Нэйджелкерка – КН
2) Точность модели для:
- найденных клиентов – НК
- упущенных клиентов – УК
- успешных продаж – УП,
получим следующие оценки предсказания поведения потребителей продуктов:
1) PIL CSF: НК=0,45, НК=77,6%, УК=22,4%, УП=83,0%.
2) CSF: НК=0,54, НК=84,6%, УК=15,4%, УП=63,1%.
3) СС: НК=0,24, НК=75,6%, УК=24,2%, УП=17,3%.
4) PIL BRB: НК=0,31, НК=79,4%, УК=20,6%, УП=20,1%.
5) Depo: НК=0,66, НК=91,1%, УК=08,9%, УП=34,4%.
6) Over: НК=0,33, НК=89,0%, УК=11,0%, УП=01,7%.
7) Auto: НК=0,22, НК=85,1%, УК=14,9%, УП=00,2%.
8) Mort: НК=0,11, НК=84,4%, УК=15,6%, УП=00,1%.
Распределение результатов прогноза по категориям клиентов указывает на отсутствие систематических ошибок моделей: PIL CSF, CSF, CC, PIL BRB. Прочие имеют особенности:
1) Модель Depo:
- предсказывает другое распределение клиентов по уровням доходов
- завышает subprime, mass и занижает affluent, high affluent.
2) В распределении по доходам Over:
- завышает долю для mass
- занижает для outgoing.
3) Auto:
- завышает автокредит для женщин, subprimе, mass, 20–30 лет
- занижает: мужчины, mass affluent, affluent, 31–40 лет.
4) Mort:
- завышает долю: subprime, mass, 51 и более лет
- занижает: affluent, high affluent, 31–40 лет.
Наступил черед установить горизонт временного планирования. Оказалось, что 58,6% клиентов, «зашедших в банк» с продукта PIL CSF, продолжили пользоваться кредитно-финансовым учреждением наибольший срок с максимальным количеством сделок, что согласуется с реальностью и подтверждается моделью (см. рис. 10).
Сведя модели восьми продуктов в единое клиентское путешествие, удалось построить дерево «жизни клиента» в банке (см. рис. 11).
Последний продукт является корнем свершившегося поступка, следующий – потенциальным листом. Каждый лист унаследовал результаты моделирования:
1) наименование продукта;
2) вероятность покупки продукта;
3) срок между предыдущим и последующим продуктами.
Моделируя переходы от корней к листьям дерева, появилась возможность составлять сценарии жизни конкретного клиента в банке. Целевой функцией удержания потребителя, как мы уже отмечали, может стать максимизация:
1) прибыли кредитно-финансового учреждения;
2) временного горизонта пользования банковскими услугами;
3) скорости развития потребителя – проведение между расчетными продуктами.
P.S.
1) Пришлось учесть, что 95% клиентов за период 2015–2018 гг. имеют историю не дольше шести розничных продуктов, поэтому модель адекватно отрабатывает на цепочке из четырех сделок;
2) Наиболее вероятная цепочка продуктов, по которой легче всего «вести» потребителя, выглядит так: PIL CSF (80%, 66 дней) – CSF (61%, 163 дня) – PIL CSF (53%, 65 дней) – CSF.