Сбербанк сохранит редкие языки народов России с помощью ИИ
В России говорят более чем на 160 разных языках, при этом около ста языков малочисленных народов страны могут исчезнуть в течение следующих десятилетий. Сбербанк является крупнейшим банком страны с разветвленной сетью отделений во всех уголках России. Как социально ответственная организация, Сбербанк ищет возможности для сохранения культурных особенностей и самобытности многонационального населения страны. В рамках реализации пилотной версии было выбрано три языка:
- нганасанский — язык коренного населения полуострова Таймыр в Красноярском крае (число говорящих – 125 человек, по данным переписи 2010 года)
- ульчский — язык жителей Хабаровского края (число говорящих – 154 человека, по данным переписи 2010 года)
- ижорский – язык народности населяющей южный берег Финского залива в Ленинградской области (число говорящих – 123 человека, по данным переписи 2010 года).
На специальном сайте sberbank0411.ru пользователи могут изучать выбранные языки с помощью чат-ботов. Чат-боты работают на базе самообучающихся нейросетей, которые объединяют в себе методы математической лингвистики и машинного обучения. Пользователи могут воспользоваться тремя чат-ботами, каждый из которых поможет им изучить один из выбранных языков. Общение с ними строится в игровой форме, коммуницировать можно с помощью иконок или выбирать слова и фразы из предложенного списка.
При разработке проекта применялись дедуктивный и индуктивный метод машинного обучения. С привлечением лингвистов был собран языковой материал от носителей, определены общие закономерности и разработаны обучающиеся алгоритмы.
По материалам Сбербанка