В предыдущем материале я рассказал о построении системы принятия мгновенных кредитных решений CreditCheck. Теперь пришло время оценить, к чему привела достигнутая скорость. Нет, не к повышенному уровню просрочки! – она-то как раз в процентном отношении снизилась, доказав гипотезу, что при лидирующем росте объема портфеля уровень мошенников начинает за ним не поспевать.
Быстрая выдача займов привела к накоплению громадных объемов разноструктурированной информации, которую просто руки зачесались использовать для Skip Tracing – процесса поиска скрывающихся должников с целью мирного принуждения к погашению долгов. Классическая технология работы с просрочкой обычно выглядела так:
- Вежливый намек заемщику – push-уведомление или SMS.
- Твердое напоминание – звонок или письмо в почтовый ящик.
- Грозный визит – приход в гости с нудным разговором о совести и долгах.
Далее следовали обращение в суд и юридическая канитель, заканчивающаяся решением в пользу банка (проигрышные пакеты документов не подавались), не гарантирующая возврат пропущенных платежей. Затем задолженность списывалась, но разве ради этого затевалась гонка?! Да и резервы из-за ухудшения качества кредитного портфеля банку приходилось наращивать.
Мы решили добавить новый этап в борьбу с просрочкой под названием «Социальная смерть», при котором вознамерились поставить в известность всех, кто когда-либо контактировал со злостным должником, о его непорядочности. Первым делом построили «вселенную» объектов, через которые планировали доставать «негодяев» (см. рис. 1).
[caption id="attachment_466007" align="alignleft" width="750"]
Рис. 1. Вселенная объектов поиска скрывающихся должников[/caption]
Провели анализ информации, предоставленной аппликантами при оформлении кредитных заявок, чтобы оценить полноту, достоверность, актуальность и применимость для розыска. Оценив каждое поле анкеты займа, а также их совокупности, получили теоретический индекс успешности в обнаружении надежных контактов (см. рис. 2).
[caption id="attachment_466008" align="alignleft" width="750"]
Рис. 2. Индексы теоретической успешности использования поисковых полей и их сочетаний[/caption]
Выполнив полные переборы строк кредитных анкет при реальном поиске 10 тыс. «забывчивых», разделили известные текстовые и числовые данные на три категории перспективности поиска:
- Использование обязательно, внедрение в процесс произведено;
- Применение целесообразно, реализация возможна;
- Поиск желателен, недоступен по техническим, юридическим и/или иным соображениям (см. рис. 3).
[caption id="attachment_466013" align="alignleft" width="750"]
Рис. 3. Карта перспективности реального применения полей анкеты в поисковых запросах[/caption]
На коленке сверстали «интерфейс» будущего приложения, назвав его SAGA.Finder и соединив простейшими запросами с SQL-сервером, что позволило немедленно приступить к тестированию поисков по адресам и телефонам (см. рис. 4).
[caption id="attachment_466014" align="alignleft" width="750"]
Рис. 4. Окно Saga.Finder для поисков по телефонам и адресам[/caption]
В единую базу данных стали передавать информацию юридических и физических лиц из CreditCheck, а из вбиваемых в интерфейс текстовых строк принялись формировать массивы с отклонением в единицу по расстоянию Левенштейна – разницей в один знак: пропущенный, вставленный или изменивший позицию. Оператор вбивал несколько известных строк или текстовых фрагментов, а машина перебирала в словарях доступные варианты фамилий, имен, отчеств, названий организаций, улиц, варьировала цифры в номерах телефонов и выводила «полотно» грядущего исследования (см. рис. 5).
[caption id="attachment_466016" align="alignleft" width="750"]
Рис. 5. Окно результатов множественного поиска по телефонам и адресам[/caption]
Каждая из строк ответа SAGA.Finder не на начальный запрос, а на массив потенциальных отклонений снабжалась упреждающими маркерами, которые в зависимости от результативности поиска оставались либо пассивны, что означало «объект не найден», либо активны – «варианты есть»:
- Первый диез – найдены персональные данные;
- Телефон – обнаружены телефонные номера;
- Треугольник – имеются коллеги по работе;
- Мяч – объект присутствует в «цветных» списках;
- Личная карточка – есть фотография;
- Второй диез – найдены данные организации.
Выбором активного маркера можно было переместиться на соответствующее представление, что на айтишном сленге называется Drill Down. Персональная карточка агрегировала информацию, которую можно было явно или косвенно ассоциировать с искомой персоналией (см. рис. 6). Данные приоретизировались таким образом, чтобы первыми строками указывалась наиболее вероятная текущая информация, а после нее шла косвенная и отдаленная, с учетом коэффициентов достоверности.
[caption id="attachment_466017" align="alignleft" width="750"]
Рис. 6. Окно персональной карточки скрывающегося должника[/caption]
«Проваливание» в цветные списки отражало вариации:
- Белый – предыдущий кредит выплачен без пени и просрочек;
- Серый – заем пришлось «выбивать» , или возврат произведен не до нуля;
- Зеленый – организация места работы сотрудничает с банком по кредитованию;
- Синий – предприятие «замерло»: проводит все меньше операций по счетам в банке;
- Красный – организация находится в стадии ликвидации или погрязла в судебных тяжбах;
- Черный – клиент отказывается вернуть долг и пытается скрыться от правосудия (см. рис. 7).
[caption id="attachment_466018" align="alignleft" width="750"]
Рис. 7. Окно нахождения похожих людей в цветных списках[/caption]
Следующим режимом предусмотрели оповещение бывших или действующих коллег по работе, начиная с отдела кадров, бухгалтерии, директоров и акционеров (исключительно для ООО с малыми уставными фондами) – см. рис. 8.
[caption id="attachment_466019" align="alignleft" width="750"]
Рис. 8. Окно нахождения бывших или действующих коллег[/caption]
Естественно, требовалось действовать взвешенно, поэтому разработали «секретный» алгоритм под кодовым названием «Круги по воде», целью которого было концентрически вычислять:
- наиболее подходящих сослуживцев, желательно проживающих неподалеку: в соседних частных домах или квартирах на смежных этажах;
- организации, числящиеся по тем же физическим и юридическим адресам (см. рис. 9).
[caption id="attachment_466020" align="alignleft" width="750"]
Рис. 9. Окно «телефонных» кругов, начиная с приоритетных[/caption]
Особой гордостью стал механизм поиска потенциальных родственников по: фамилии и отчеству, дате рождения, адресам предыдущего совместного проживания (см. рис. 10). Именно благодаря ему удалось войти в контакт с 11,7% людей, которые уговорили должников вернуть деньги и спать спокойно. Наиболее авторитетными оказались контактные лица женского пола: мамы, жены и сестры – их скрывающиеся слушали чаще всего.
[caption id="attachment_466030" align="alignleft" width="750"]
Рис. 10. Окно предположений о вероятном родстве[/caption]
Когда исчерпывались возможности предыдущих вариантов, в дело вступала «тяжелая артиллерия», «ковровое бомбометание»: о нерадивости заемщика сообщали его соседям по подъезду, дому или улице, в зависимости от квартирности здания и количества жителей населенного пункта (см. рис. 11).
[caption id="attachment_466031" align="alignleft" width="750"]
Рис. 11. Окно обзвона соседей по дому[/caption]
Следующим логичным шагом стала пакетная обработка больших массивов должников с выгрузкой кампаний для обзвона через CRM. На рис. 12 приведен пример Excel-версии, которая использовалась во время отладки.
[caption id="attachment_466032" align="alignleft" width="750"]
Рис. 12. Пакетная обработка поиска скрывающихся должников[/caption]
Многие ответственные граждане корректировали операторов call-центра, что позволило исправлять ошибки, часто встречавшиеся в названиях улиц городов (см. рис. 13). Поэтому даже безрезультативные в моменте звонки нередко оказывались полезны в перспективе дальнейших поисков.
[caption id="attachment_466033" align="alignleft" width="750"]
Рис. 13. Окно улиц населенного пункта[/caption]
Мы замеряли количество режимов, которые выбирали операторы при ручных операциях розыска с тем, чтобы совершенствовать средства автоматизации (см. рис. 14).
[caption id="attachment_466034" align="alignleft" width="750"]
Рис. 14. Статистика произведенных поисков[/caption]
Отдельно изучали корреляцию между трудолюбием сотрудников и результативностью обнаружения «негодяев» (см. рис. 15).
[caption id="attachment_466035" align="aligncenter" width="720"]
Рис. 15. Отчет о производительности сотрудников[/caption]
Итогом экспериментов стала универсальная автоматизированная система поисков скрывающихся должников кредитно-финансового учреждения из стандартного браузера, которая за 18 месяцев помогла вернуть 3,1% безнадежно (Безнадежно просроченными принято считать: беззалоговые кредиты – после полугода отсутствия выплат от заемщика, залоговые – после года) просроченных займов крупного банка, что с лихвой окупило процесс проектирования и разработки. Пользователями SAGA.Finder кроме подразделения розыска «пропавших» клиентов стали:
- команда противодействия мошенничеству;
- служба экономической безопасности;
- полевые коллекторы.
В пике нагрузки с системой работали более 2 тыс. человек, а объем знаний к концу второго года эксплуатации составлял 7 млн записей о связанности физических и юридических лиц между собой, документами, телефонами, адресами, прочими идентификаторами. Среднее время поиска информации не превысило 2 секунды. Журналируемый доступ позволил выявлять оптимальные методы работы лучших «сыскарей» и тиражировать на коллективы смен подразделения Skip Tracing.
Открытый протокол взаимодействия с внешними системами не один раз сыграл добрую службу в оказании дружественной помощи силовым структурам при расследовании особо тяжких преступлений.
Да-да, вам не показалось: SAGA.Finder неоднократно демонстрировал алгоритмическое преимущество даже перед более наполненными и централизованными системами хранения данных государственного значения! И не без обоюдной выгоды.