«Сбер» раскрыл подробности о «нейросетевом ансамбле» GigaChat
Расскажите, пожалуйста, есть ли у модели принципиальное отличие от зарубежных аналогов, кроме того факта, что часть ансамбля будет выложена в открытый доступ? Чем GigaChat отличается от моделей OpenAI и разработок других игроков?
Денис Филиппов: В первую очередь я скажу, что GigaChat — это название сервиса, в котором можно протестировать нашу новую нейросетевую модель, которая называется NeONKA. Чем она принципиально отличается от зарубежных аналогов типа ChatGPT или GPT-4? В первую очередь, очевидно, что мы сфокусировались на русском языке, поэтому наша модель знает русский язык лучше. То есть иностранные тоже русский язык знают, но для них это скорее побочный продукт, потому что основной фокус на английском языке, у нас основной фокус на русском языке. Второе большое отличие — это то, что наша модель умеет генерировать изображение, то есть мы добавили сразу две модальности. Наша модель генерирует очень хорошо текст на русском языке, и можно модель попросить сгенерировать по текстовому описанию картинку. Мы сразу интегрировали туда другую нашу модель Kandinsky 2.1. Кроме того, наверное, еще третий фактор назову, который нас отличает: мы сразу модель оптимизировали под высокие нагрузки. С точки зрения качества, то есть сочетания качества, скорости и цены, нам было сразу важно сделать модель, которая смогла бы работать в этих сервисах. Пожалуй, это основные отличия на данный момент.
На каких материалах училась модель? Можете ли вы раскрыть тип, объем и датировку данных?
Денис Филиппов: Модель училась на разных данных, основные типы данных — это открытые данные из сети интернет в первую очередь. Это огромный объем данных, больше 1 терабайта текстов. Там есть материалы с различных сайтов, соцсетей, это литература, энциклопедия, изображения различные. Скажем так, программный код для того, чтобы модель умела генерировать код. Но, кроме этого, это внутренние данные. Например, у нас есть «Сберэксперт» в финансах, мы добавляли знания про финансовую отрасль и различные наши экосистемные компании. А дальше модель постоянно обучается, и поэтому у нас есть технологии, которые позволяют обеспечивать постоянное обучение модели.
Будет ли у GigaChat доступ к сети интернет и сможет ли она отвечать на вопросы по актуальным событиям, как Bing? Или же объем доступных моделей знаний будет ограничен, как это было у ChatGPT на момент запуска?
Денис Филиппов: Во-первых, сейчас модель обладает актуальными знаниями, то есть не так давно ее обучили, и на самом деле процесс обучения бесконечный, то есть он идет регулярно. Кроме того, в архитектуру самой модели, или, правильнее сказать, ансамбля моделей, мы сразу заложили инструменты, которые позволяют обращаться к различным источникам. В качестве источника может быть при определенных вопросах сеть интернет. У нас есть технологии, которые позволят обеспечить свежесть и актуальность данных и знаний нашей модели.
И последний вопрос: есть ли прогнозы о том, когда доступ к сервису получат первые пользователи? Можно ли получить доступ для СМИ, потестировать?
Денис Филиппов: На самом деле мы открываем доступ сейчас в первую очередь ученым, которые работают в области искусственного интеллекта. Потому что модель буквально с пылу с жару, первая версия, нам важно получить обратную связь от профессионалов в этой области. Сейчас мы в режиме сбора заявок на тест, то есть мы от всех желающих принимаем заявки и очень сами хотим как можно быстрее предоставить этот доступ, потому что модель действительно интересная получается. Я уверен, что в ближайшее время все, кто хочет, этот доступ получат.
Пока проект находится в состоянии закрытой бета-версии. Записаться в лист ожидания можно в телеграм-канале GigaChat. Позднее «Сбер» намерен интегрировать модель в свои многочисленные сервисы.
По материалам Business FM