Новая линейка включает мощную языковую модель Pro и облегчённую версию Lite.
По заверениям разработчиков, они превосходят по качеству ответов предыдущие версии, способны рассуждать и обрабатывать в четыре раза более длинные запросы - порядка 60 страниц текста, что позволит использовать нейросети для решения более сложных и разнообразных бизнес-задач, от анализа обращений клиентов до автоматизации закупок.
В пресс-службе компании рассказали "РГ", что модели четвёртого поколения уже доступны по API в Yandex Cloud, часть функций пока работают в тестовом режиме. Новые модели, согласно обещаний инженеров, применимы в разных сферах бизнеса - с их помощью можно сортировать письма и заявки клиентов, анализировать резюме и решать другие задачи, связанные с обработкой текста. По задумке создателей, версия Pro больше подходит для сложных трудоёмких задач - например, анализа продаж, а Lite будет полезна в более простых сценариях, где важна скорость ответа.
Попробовать новые модели можно в демоверсии - в чате на платформе Yandex Cloud. В будущем они появятся в сервисах российского поисковика для широкой аудитории. Первым таким сервисом станет "Алиса" с опцией "Про".
Качество ответов
Как утверждают авторы проекта, по качеству ответов YandexGPT 4 Pro выигрывает у модели прошлого поколения в среднем в 70% случаев, а в некоторых типах задач - например, в ответах на открытые вопросы - вплотную приближается к GPT-4o. Версия Lite отвечает не хуже самой мощной модели "Яндекса" прошлого поколения. Это стало возможным благодаря улучшению процесса обучения. В частности, разработчики научили нейросеть рассуждать - на примерах с пошаговым решением задач.
Рассуждения
Разработчики поделились, что модели нового поколения способны рассуждать (поддерживать функцию chain-of-thought). Прежде чем ответить на сложный вопрос, они разбивают задачу на более простые и решают их пошагово, выстраивая цепочку рассуждений. Это не только улучшает качество ответов, но и помогает нейросети отвечать на вопросы, которые требуют анализа. Например, новая модель способна изучить жалобу клиента, разобраться в проблеме и предложить выход из ситуации. В будущем в API появится возможность включать скрытые рассуждения для всех запросов.
Обработка данных
Нейросети нового поколения, как рассказали в офисе отечественного IT-гиганта, обрабатывают в четыре раза больше текста, чем модели третьего поколения. В итоге они гораздо дольше удерживают контекст беседы, могут отвечать на сложные длинные вопросы и анализировать порядка 60 страниц текста. Новые модели лучше отвечают на вопросы с опорой на внешние источники (применяется в системах RAG, Retrieval Augmented Generation). Такими источниками могут быть, например, документы компании или статьи. Доля ошибок, в том числе выдуманных фактов, снизилась в таких сценариях почти в два раза - с 4% до 2,1%. Кроме того, новые модели в среднем в два раза быстрее предыдущих отвечают на вопросы.
Работа с внешними приложениями
YandexGPT 4 умеет генерировать команды для сторонних приложений. Например, если попросить нейросеть найти билет на самолет, она напишет команду для сервиса авиабилетов, чтобы он запустил функцию поиска мест. Генерация команд станет доступна в Yandex Cloud в ближайшее время, и разработчики смогут использовать новые модели для работы с внешними приложениями. Для этого им нужно будет описать функции и правила составления команд, а модель будет сама определять, когда ими воспользоваться.