Журнал ПЛАС » Архив » 2018 » ЖУРНАЛ ПЛАС №3 »

Machine Learning станет must have в банкинге уже к 2020 году

О том, насколько сегодня уже востребованы искусственный интеллект и машинное обучение в банкинге, каковы перспективы их развития и каких результатов кредитные организации ожидают от внедрения данных технологий, журнал «ПЛАС» беседует с Александром Сахаровым, руководителем департамента «Цифровой банкинг» Банка УРАЛСИБ.

Machine Learning станет must have в банкинге уже к 2020 году

ПЛАС:Какова сегодня реальная востребованность со стороны розничного банкинга технологий Artificial Intelligence (AI) и Machine Learning (ML)? Какие перспективы открывают перед банками такие решения?

А. Сахаров:Между искусственным интеллектом и автоматизацией есть очень важная грань: особенность машинного обучения – способность программы самостоятельно скорректировать собственный алгоритм в случае возможности сделать результат более эффективным. Можно провести параллель с эволюцией бактерий, которые приобрели способность изменяться, в результате чего обычные антибиотики перестали на них эффективно воздействовать. Соответственно, если раньше были логически строгие алгоритмы, то сейчас они умеют «мутировать» или адаптироваться, тем самым обеспечивая лучший конечный результат.

На сегодняшний день на торговых площадках США более 90% объема всех операций совершается роботами, и при этом ни у кого не возникает вопроса о целесо-образности использования AI – результаты говорят сами за себя.

Существует большое количество примеров применения AI в банках. Любая компания всегда нацелена на решение задач оптимизации своей деятельности – маркетинга, рисков, поиска новых клиентов и т. п. Основным драйвером повышения сложности этих задач является существенный рост объема доступных для анализа данных. Это количество уже невозможно эффективно обработать классическими средствами. Линейные регрессионные алгоритмы гораздо менее эффективны, чем алгоритмы с machine learning. Например, для сегментации посетителей сайта нужно обработать объем данных, который формируется из cookie-файлов, истории общения, внутренних систем, Big Data провайдеров, которые можно купить.

Это касается и процессов борьбы с мошенничеством по банковским картам. Самообучающиеся алгоритмы дают гораздо больший эффект для банка, чем алгоритмы, которые не умеют этого делать. То же самое можно сказать и про прогнозирование рисков. Ежегодно мы проводим пилоты по обогащению клиентских данных из онлайн-анкет с учетом Big Data, но только в 2018 году это дало ощутимые результаты.

Технологии приходят к нам из других, более технологичных областей экономики, поэтому банки будут просто вынуждены со всем этим как-то жить. Да, в ближайшие год-два это еще можно будет как-то игнорировать, но совершенно понятно, что в 2020 году без Machine Learning банкам будет уже не обойтись. Никакие банковские отделения не смогут обеспечить такой объем трафика, который может сгенерировать эффективно работающий сайт.

14

ПЛАС: Будет ли эта тенденция поступательной или можно ждать серьезного рывка?

А. Сахаров:В прошлом году алгоритм AlphaGo победил сильнейшего в мире игрока в го. А два месяца назад появился Machine Learning, алгоритм AlphaZero, который прочитал правила игры и после шести часов игры с самим собой обучился и обыграл AlphaGo. И это лишь один из примеров, демонстрирующий скорость развития технологий AI и ML.

Другой пример – Facebook тестировал алгоритмы торговли, когда два бота торговались между собой (bargaining) на английском языке. В определенный момент они стали говорить на «своем языке», без всякого логического смысла, но с использованием английских слов. При этом они показывали эффективный результат.

То есть, когда машина самообучается, она строит зависимости, но какими получатся эти зависимости, заранее никто не знает. Когда ты только начинаешь, ты все контролируешь, но важно понимать в какой-то момент, что алгоритм, который получится, будет настолько непонятным для тебя как для заказчика, что придется ему довериться. Другого выбора нет, но при этом ты оставляешь за собой возможность контролировать корректность результата как на входе, так и на выходе.

ПЛАС: Существует мнение, что для тестирования таких технологий необходимо задавать некий ИТ-периметр и не выпускать их развитие за его пределы – насколько оно справедливо?

15-2А. Сахаров:В фантастической литературе и кинематографе часто используют сценарии, когда искусственный интеллект выходит из-под контроля человека и пытается все уничтожить. Но даже если гипотетически предположить такой ход событий, то это пока не является проблемой, так как компьютеры работают на кремнии, который имеет предел производительности. Производительность самого мощного суперкомпьютера сегодня не превышает петафлопс (1015 flops), в то время как мозг человека работает с показателями 1018-1020. Причем стоимость такого суперкомпьютера составляет около 120 млн долл. США. Определенные проблемы могут возникнуть с появлением квантового компьютера. Необходимо понимать – как только у вас возникает сеть, которая управляется искусственным интеллектом, она вдруг может перестать работать так, как это изначально вами планировалось. В результате управлять ею будет достаточно сложно. Поэтому, пока квантовые компьютеры еще не получили широкого развития и сети ими полностью не управляются, у нас есть еще порядка 7–10 лет, чтобы подготовиться к этому моменту.

Например, сегодня прокси-серверы управляют интернет-трафиком. В какой-то момент, когда мощность их окажется достаточной, может быть создан искусственный интеллект, который станет управлять этим трафиком. Он сам будет принимать решение, опасный у вас трафик или нет. Сейчас это полностью понятная алгоритмическая модель: если, например, вы употребляете слово «бомба», значит, есть повод заподозрить в вас террориста, а в любом другом случае такого повода нет. Искусственный интеллект же в какой-то момент может записать в террористы всех, причем нам будет непонятно, какими критериями он руководствуется. Второй момент: если система на базе искусственного интеллекта, управляя, например, автомобилем, случайно сбивает пешехода – кто виноват? Вопрос государственного регулирования пока не решен, вопрос ответственности искусственного интеллекта перед человеком также остается открытым, и пока непонятно, как его решать.

ПЛАС: С точки зрения банка, что лучше в плане внедрения Artificial Intelligence и Machine Learning – собственная экспертиза или аутсорсинг?

А. Сахаров:Существует несколько вариантов стратегии. Первая – тактическая – предлагает банку смотреть на готовые работающие решения, которые лежат на поверхности, и пробовать их пилотировать у себя in house либо с кем-то в партнерстве. Можно провести аналогию с программированием – либо специалисты в штате вашей компании, либо на аутсорсинге – это уже вопрос менеджмента, зрелости и эффективности менеджеров, которых нанимает компания.

Особенность ML – способность программы самостоятельно скорректировать собственный алгоритм

Другая стратегия более «длинная». Если банк или любая другая компания думает о своем будущем хотя бы на 5–7 лет вперед, то ей необходимо смотреть на потенциально интересный сегмент. Можно пойти по пути соинвестирования совместно со специализированным профессиональным венчурным фондом или создать собственный венчурный фонд, например, как это сделал Сбербанк. Вопрос в количестве денег, которые банк зарабатывает и готов вкладывать в развитие. Понятно одно: в любом случае этим необходимо заниматься, чтобы владеть профессиональной венчурной аналитикой с доступом к реальным кейсам напрямую, а не через посредников. Реальные кейсы доступны только в том случае, если вы действительно инвестор, в противном случае рискуете лишь получить пыль в глаза.

15

ПЛАС: Какие российские и зарубежные кейсы в этой области сегодня успешно реализованы? Каковы планы УРАЛСИБа по развитию проектов на базе этих технологий и специфика их реализации?

А. Сахаров: В УРАЛСИБе мы внедрили технологию real-time marketing, позволяющую в режиме онлайн отслеживать все действия клиентов и предлагать наиболее актуальные на момент обращения услуги. Это позволит более точно предсказывать текущие потребности клиента и решать проблемы в режиме реального времени. Кейс подготовлен на основе годичной статистики трафика посещения потребителями сайта банка, данных, какими функциями они пользуются и какое количество из них впоследствии становятся клиентами. Мы провели конкурс между несколькими командами, которые применяли различные алгоритмы Machine Learning. Как результат, получили хороший экономический эффект. Сегодня, когда есть много команд по искусственному интеллекту и машинному обучению, писать матрицу (например, если клиент искал машину, то ему нужен автокредит) внутренними силами банка уже нецелесообразно.

Вопрос ответственности искусственного интеллекта перед человеком также остается открытым

Мы также запустили абсолютно новую интегрированную digital-платформу, которая объединила наш сайт, системы ДБО для физических и юридических лиц, систему управления рекламой на сайте, CMS внутри ДБО, маркетплейс для продвижения продуктов для малого и среднего бизнеса, платежные и маркетплейс-механизмы для физических лиц на сайте. Иными словами, если вы являетесь клиентом банка и заходите на сайт, то бесшовно попадаете в систему ДБО. Все выполнено в едином дизайне с универсальным User eXperience, в режиме single-sign-on. Это, в свою очередь, позволяет извлекать существенно больше пользы от Machine Learning. В экосистеме все должно управляться централизованно. Иначе будет просто невозможно собрать все воедино, придется делать большое количество разных интеграций, строить промежуточное хранилище данных и т. д. А внедрение одного такого изменения занимает существенное время.

16

ПЛАС: Насколько затратным по срокам и средствам является переход на новую платформу?

А. Сахаров:Наш ИТ-проект подразумевал создание большого сложного интеллектуально широкого слоя с большим количеством бизнес-функций. В нем должны были быть учтены правильные UX, сохранение данных, возможности по подключению разных внешних площадок.

Если архитектура фронтального ИТ-решения сделана правильно, то тогда и результат от Machine Learning вы получаете хороший. Если вы используете разные системы в нескольких местах, которые интегрированы между собой где-нибудь на АБС, то большой вопрос, как вообще тут можно применять Machine Learning? К сожалению, в России пока не так много команд, которые могут реализовать подобные проекты комплексно. Поэтому возрастает роль ИТ-директора, который должен синхронизировать заказчиков и объединить их подпроекты.

ПЛАС:В каких еще областях банковской деятельности может применяться технология Machine Learning?

А. Сахаров: Однозначно, риск-менеджмент. Если год-два назад модели прогнозирования кредитных рисков с использованием Machine Learning были ненамного лучше, чем просто по обычной анкете, то сейчас мы наблюдаем значимый сдвиг более прогнозируемого поведения заемщика на основании неструктурированного анализа его Big Data.

В 2018 году мы успешно завершили пилот, в результате которого банк получил положительные результаты в части эффективности модели риск-менеджмента. Еще год назад эти же самые проекты такого хорошего результата не показывали.

Другой пример – торговый эквайринг. Это бизнес с очень низкой маржой, но если его рассматривать вместе с синергией по другим продуктам, он становится более интересным. Синергию можно существенно улучшить, если в режиме реального времени анализировать и предлагать правильные продукты.

17

ПЛАС:Какова эффективность технологий AI/ML в решении задач государственного уровня? Как вы в целом видите спектр задач, где данные технологии могут и будут применяться?

А. Сахаров: Государство – это прежде всего инфраструктура. При этом государству важно понимать, где есть проблемы, и решать их. В первую очередь речь идет о законодательном регулировании. Законодательство, которое определяет ответственность искусственного интеллекта сейчас, явно устаревает. Сегодня закон однозначно трактует, что ответственность за действия искусственного интеллекта лежит на том, кто его запустил. Но, например, когда все троллейбусы в Москве перейдут на автоматическое управление, пешеход тоже должен нести не какую-то, а вполне определенную ответственность, поскольку он будет знать, что по этой дороге ездят такие троллейбусы.

Еще один момент, создание песочницы венчурных возможностей. Это как раз тоже государственная тема. И наконец, образование. Откуда брать инженеров по machine learning? Например, я в свое время окончил на мехмате МГУ кафедру математической теории интеллектуальных систем. В России этому учат пока только в одном вузе. В год на всю страну выпускается всего 80 человек. И это так называемые гики, половина из которых пойдет дальше в академическую науку. Поэтому государство должно заниматься образованием: создавать образовательные кластеры, предлагать дополнительные образовательные программы.

Кстати, хотелось бы отметить, что понимание у государства в этом вопросе уже есть. В целом программа «Цифровой экономики» так и построена. Очень хотелось бы верить, что в обозримой перспективе она воплотится в реальные образовательные стандарты. Решением этого вопроса в основном сейчас занимается крупный бизнес, поскольку это нужно в большей степени именно ему. Крупный бизнес и государство должны заниматься образованием, иначе мы столкнемся с проблемой «утечки мозгов», и все перспективные специалисты будут готовиться в вузах других странах. И не потому, что у нас такое плохое образование, а потому что нет качественных образовательных программ.

В настоящее время УРАЛСИБ решает проблему со специалистами путем проведения конкурсов. Такие банки, как Тинькофф, финансируют отдельные вузы и готовят студентов по конкретным специальностям начиная с третьего курса. По-другому просто нельзя.

18

ПЛАС: Какие узкие места могут возникнуть при внедрении технологий AI/ML?

А. Сахаров:У любой новой технологии узкое место всегда одно и то же – кривые руки и кривые головы. Нельзя просто взять каких-то людей с улицы, которые назвались специалистами в искусственном интеллекте, привести их в банк и быть уверенными, что они все сделают. Скорее всего, это будут шарлатаны или мошенники, которые просто возьмут деньги ни за что. Без вовлеченности руководства банка, скорее всего, ничего не получится.

Как показывает наш опыт, даже если вы первые три раза пробовали и у вас не получилось, это не означает, что с четвертого не получится. Необходим очень четкий и взвешенный профессиональный подход, так как на этом пути много различных тонкостей. Можно привести команду, которая построит рисковые модели, которые не будут давать результат. Но это может быть связано, например, с  тем, что команда неправильно ставит или анализирует задачу. И если это исправить, необходимые результаты не заставят себя ждать.

В течение 7–10 лет ОС будут иметь встроенные алгоритмы ML, которые будут между собой связаны через сеть

Нужны профессионализм, вовлеченность и понимание, что с одного раза можно не добиться желаемого результата. И, скорее всего, ваш первый партнер окажется не тем партнером, который лучше всех это делает. А может быть, и второй тоже. Пройдет какое-то время, пока банк найдет правильного партнера, с которым у него все будет получаться. Но если этим вообще не заниматься в ближайшие три года, рынок уйдет слишком далеко.

ПЛАС:Какие вопросы безопасности встают перед банками при внедрении и дальнейшем использовании технологии AI/ML?

А. Сахаров:Во-первых, уже сами технологии machine learning, если их правильно использовать, позволяют выстроить на более высоком уровне систему противодействия мошенничеству и фрод-мониторинга. Например, при анализе «серых» операций, который требует ЦБ. Когда у банка много клиентов и в день совершается большое количество платежей, необходимо улавливать нечеткие взаимосвязи. Их можно программировать алгоритмически, но при этом вы не будете успевать за теми изменениями, которые неизбежно будут происходить в поведении мошенников, которые, как известно, быстро учится. Поэтому имеет смысл постепенно внедрять самонастраивающийся алгоритм.

19Вся диджитализация – это в какой-то мере вопрос безопасности. Любая проблема информационной безопасности заключается в том, что какое-то третье лицо может внедриться в систему, что-то в ней изменить или в нее интегрировать, например, даже в самый простой алгоритм показа страницы html. Приведу два свежих примера. Буквально недавно было объявлено о фатальной для всех уязвимости процессоров Intel. То же самое наблюдалось летом 2017 года (WannaCry, Petya), когда все осознали срочность обновления операционных систем. За совсем короткое время дважды повторилось событие, после которого все начали понимать, что уязвимости имеются на том уровне, где не работает ни один антивирус.

Поэтому вопрос безопасности – вопрос глобальный и к machine learning прямого отношения не имеет. Machine Learning может только где-то усложнить, а где-то упростить такого рода задачи.

ПЛАС: Социальная ответственность бизнеса и реализация технологии AI/ML: как банки намерены решать проблему занятости специалистов, которые неизбежно потеряют работу в результате внедрения новых технологий?

А. Сахаров:С этим ничего нельзя сделать. По данным исследования международной консалтинговой компании McKinsey, проведенного совместно с министерством труда США, если взять только существующие апробированные механизмы и их реализовать, то уже сегодня можно сократить 1 млрд человек. Какое-то количество специалистов, конечно же, можно переобучить, например, в программистов, но далеко не всех. Проблема в том, что раньше было большое количество профессий, которых сегодня уже просто нет.

Пока государство не дошло до решения этого вопроса глобально, отчасти ответственность на себя берет бизнес. Например, бизнесу негде взять подходящих для тех или иных задач людей. Что делает бизнес? Устраивает в специализированном вузе конкурс на свои собственные деньги и выбирает наиболее талантливых ребят. Начинает платить им сначала стипендию, ставит им какие-то задачи и в перспективе берет их к себе на работу. Такая практика должна существовать. Если я этого не делаю, это сделает кто-то другой. Как результат, через 3-5 лет мы получаем колоссальный прорыв. Это не только и не столько ответственность, это просто здравый смысл. Ведь если этого не делать, в какой-то момент можно просто остаться без специалистов.

ПЛАС:Ваша оценка перспектив дальнейшего развития machine learning? В каком временном диапазоне (через сколько лет) может произойти массовое внедрение технологии?

А. Сахаров: Вскоре с помощью таких алгоритмов будет решаться любая оптимизационная задача. Думаю, в течение 7–10 лет операционные системы будут иметь встроенные алгоритмы Machine Learning, которые будут между собой связаны через сеть.

В ближайшие несколько лет мы все будем использовать эти механизмы для того, чтобы справиться с теми объемами данных, которые у нас есть. В ближайшие 3–5 лет мы будем разгребать Big Data с помощью этих алгоритмов. Параллельно будут создаваться все более мощные квантовые компьютеры, которые нас приблизят к следующему шагу.

Подписывайтесь на наши группы, чтобы быть в курсе событий отрасли.

Читайте в этом номере:


Перейти к началу страницы

Подпишитесь на новости индустрии

Нажимая на кнопку "подписаться", вы соглашаетесь с


политикой обработки персональных данных