Представлено большое обновление искусственного интеллекта GigaChat

По словам представителей Сбера, команда разработчиков GigaChat обновила и расширила обучающие датасеты, что значительно повысило качество ответов моделей в таких областях, как экономика, право и медицина. Также модели прошли обучение на базе знаний реальных экспертов, в том числе редакторов и художников, благодаря чему улучшился навык создания изображений с помощью Kandinsky.

"Размер контекста GigaChat Lite и GigaChat Pro увеличен в два раза - с 4 тыс. до 8 тыс. токенов. Если раньше в один запрос можно было загрузить объём текста, сопоставимый с 6 страницами A4 (шрифт 14 pt), то теперь максимальный объём запроса вырос до 12 страниц. Увеличение контекста позволяет моделям поддерживать более длинные диалоги с пользователем и получать в одном запросе больший объём полезной информации", - сообщили в пресс-службе.

При этом GigaChat Lite подойдет для решения более тривиальных задач, требующих при этом максимальной скорости работы модели и меньших требований к "железу". А новая модель GigaChat Lite+ по всем метрикам совпадает с GigaChat Lite, но размер ее контекста расширен до 32 тыс. токенов, что окажется особенно полезным для бизнеса. GigaChat Pro лучше следует сложным инструкциям и может выполнять более комплексные задачи.

Важное обновление произошло и в GigaChat API - там появилась возможность формировать векторное представление текстов - эмбеддинги. Эмбеддинги используются для оценки смысловой схожести текстов, повышения точности ответов языковой модели и упрощения решения задач поиска и классификации информации.

Ранее стало известно, что нейросеть Яндекса YandexGPT 2 опередила GPT 3.5 по качеству ответов на русском языке. Проведенное исследование показало, что в 63% случаев собственная языковая модель Яндекса отвечает на запросы лучше, чем нейросеть компании OpenAI. Исследование проводилось методом сравнения Side by Side (SBS). Обе нейросети отвечали на один и тот же запрос, а AI-тренеры выбирали лучший ответ, не зная, какая именно модель его сгенерировала. Корзину запросов сформировали из обезличенных обращений пользователей сервисов Яндекса к YandexGPT 2. Она учитывает реальные потребности людей и охватывает множество тем.

"Сравнения нейросетей нужны не для того, чтобы получить абстрактные цифры в бенчмарке, а для решения задач продукта, создания новых функций и развития бизнеса", - говорит технический директор «Яндекс Поиска» Алексей Гусаков. "Именно поэтому значительную часть корзины для сравнения составили настоящие запросы из наших сервисов", - добавил он.

Возможно, расклад сил вновь изменится после выхода крупного апдейта языковой модели GPT-4 Turbo, направленного на улучшение работы ChatGPT. По словам разработчиков из Open AI, патч должен не только повысить производительность фирменного ИИ-бота, но и сделать его более «трудолюбивым».