05.09.2023, 11:35
Количество просмотров 851

BSS ускорила STT в речевой аналитике в 5 раз

Ускорение позволит экономить клиентам порядка 1 млн рублей на закупке серверов или около 520 тыс. рублей в год на аренде серверов из расчета на каждые 100 операторов.
BSS ускорила STT в речевой аналитике в 5 раз

STT (Speech To Text) – это подсистема распознавания устной речи, которая в системе «Речевой аналитики» компании BSS отвечает за получение текстовой расшифровки телефонного разговора или диалога, записанного на микрофон в офисе обслуживания.

В основе STT лежит специальная нейросеть, которая переводит аудиозаписи в текст. Как и любая технология на базе нейросетей, STT очень требовательна к вычислительным мощностям. Например, в системе «Речевой аналитики», развернутой на 200 операторов, около 95% серверных мощностей будут обслуживать именно STT.

Соответственно, оптимизация и ускорение STT позволят сократить издержки и оптимизировать внедрение и использование речевой аналитики. RND-команда BSS активно прорабатывала этот вопрос, опираясь на собственные передовые разработки и мировой научно-исследовательский опыт.

В итоге удалось найти и реализовать «рецепт» нейросети, который позволил ускорить работу STT сразу в 5 раз. Это значит, что серверных мощностей при том же объеме нагрузки потребуется в 5 раз меньше. В денежном выражении выгода будет составлять порядка 1 млн рублей экономии на закупке серверов или около 520 тыс. рублей в год на аренде серверов из расчета на каждые 100 операторов.

«Ускорение в 5 раз – это осторожная, «гарантированная» оценка. В некоторых случаях мы выходим на ускорение в 13 раз. Причем наша конфигурация не требует GPU. Это важно, т.к. часто у заказчиков просто нет серверов с GPU, а закупка таких серверов может занимать недели и месяцы», – прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.

Рубрика:
{}Технологии
Теги:
Новости в вашей почте
mail

PLUSworld в соцсетях:
telegram
vk
dzen
youtube
ЕЩЁ НОВОСТИ