Яндекс представил третье поколение больших языковых моделей YandexGPT 3
Кроме того, бизнес-пользователи смогут дообучить новую нейросеть самостоятельно. В ближайшее время нейросети третьего поколения YandexGPT появятся и в сервисах Яндекса для широкой аудитории.
YandexGPT 3 Pro можно встроить в продукты бизнеса через API. Перед этим качество работы нейросети можно оценить в демо-режиме. Зарегистрированным пользователям доступно 100 бесплатных запросов в час.
● YandexGPT 3 — третье поколение языковых моделей Яндекса.
● YandexGPT 3 Pro — первая нейросеть, которая вошла в линейку YandexGPT 3. В дальнейшем их станет больше: каждая будет ориентирована на решение задач определённого типа
Новые возможности YandexGPT 3 Pro
YandexGPT 3 Pro эффективнее решает сложные задачи и лучше понимает контекст беседы по сравнению с YandexGPT 2. Языковая модель хорошо обрабатывает инструкции с несколькими условиями, а ещё — корректнее работает с фактами, даёт более точные и полные ответы и допускает меньше стилистических ошибок. При этом YandexGPT 3 Pro может обрабатывать существенно больше запросов за единицу времени, чем языковые модели прошлого поколения YandexGPT
Новая нейросеть особенно хорошо проявляет себя в таких сферах, как клиентская поддержка, онлайн-продажи, цифровые коммуникации, маркетинг, реклама и управление персоналом. Также языковая модель лучше работает с документами: например, составляет договоры, счета, нормативную документацию, должностные инструкции и не только. Задачи, связанные именно с перечисленными отраслями, составили значительную часть набора данных для обучения YandexGPT 3
Стоимость использования новой нейросети снизилась почти в два раза. Заказчики смогут самостоятельно дообучить YandexGPT 3 Pro в сервисе ML-разработки Yandex DataSphere для того, чтобы она ещё лучше соответствовала потребностям конкретного бизнеса. Чтобы запустить процесс дообучения, нужно загрузить в DataSphere файл с примерами запросов и эталонными ответами на них. Такая нейросеть будет доступна только дообучившей её компании.
Качество ответов YandexGPT 3
Для оценки качества работы YandexGPT 3 Pro разработчики использовали несколько тестов. Первый из них — YaMMLU_ru, локализованная на русский язык версия международного бенчмарка MMLU.
Также разработчики применили методику Side by Side (SBS) тестирования для того, чтобы оценить, как новая модель справляется с генерацией идей, обобщением информации, задачами классификации, созданием контента и другими бизнес-задачами. В среднем YandexGPT 3 отвечала лучше, чем YandexGPT 2 в 67% случаев. При работе с пользовательскими запросами и обработке бизнес-запросов новая нейросеть отвечала лучше в 69% и 60% случаев соответственно.
SBS-сравнение качества работы языковых моделей с разными классами задач
Новый стандарт в следовании формату запроса
Для проверки того, насколько хорошо ответы первой нейросети из линейки YandexGPT 3 соответствуют заданному в запросе формату, разработчики создали русскоязычный тест на базе бенчмарка IFEval. При этом они значительно расширили список решаемых задач и усложнили их.
В сравнении с YandexGPT 2 качество ответов YandexGPT 3 улучшилось на 10 процентных пунктов, а их консистентность увеличилась в два раза. Это значит, что нейросеть научилась лучше понимать, какими именно должны быть ответы на одинаковые по сути, но сформулированные по-разному запросы.
Кроме того, новая языковая модель значительно реже ошибается. По сравнению с YandexGPT 2 количество фактических ошибок сократилось с 16,4% до 13,5%, а доля неподтверждённой информации в ответах снизилась с 6,4% до 5%. Количество ситуаций, когда модель не дает ответ на вопрос пользователя, уменьшилось в 5 раз. Все эти проверки проводились с помощью специального набора особенно сложных запросов, применимых в реальном бизнесе.