В отличие от ChatGPT сервис GigaChat изначально уже поддерживает мультимодальное взаимодействие и более грамотно общается на русском языке. Доступ к системе пока только по приглашениям.
Как рассказали в Сбере, архитектура GigaChat основана на нейросетевом ансамбле модели NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающей различные нейросетевые модели и метод supervised fine-tuning, reinforcement learning with human feedback. Благодаря этому новая нейросеть Сбера может решать множество интеллектуальных задач: поддерживать беседу, писать тексты, отвечать на фактологические вопросы. А включение в ансамбль модели Kandinsky 2.1 даёт нейросети навык создания изображений. Входящую в состав NeONKA ru-GPT 3.5 с 13 млрд параметров мы планируем выложить в открытый доступ в целях ускорения развития open-source сообщества и технологий в области искусственного интеллекта. Нам важно, чтобы как можно больше талантливых студентов, учёных и разработчиков могли использовать самые современные технологии в своей работе.
«GigaChat уникален своей открытостью архитектуры, в то время, как мировые аналоги нашей модели придерживаются курса Closed AI. Важно, что GigaChat могут использовать не только массовые пользователи, которые любят экспериментировать с инновациями, но студенты и даже исследователи для серьезных научных работ», - сообщил глава Сбербанка Герман Греф.
Как пояснили в Сбере, виртуальный ассистент Салют — один из первых продуктов, который получит в ближайшее время все возможности новой модели. Первая версия модели NeONKA была оптимизирована по размеру и скорости для применения в высоконагруженных сервисах.
Обучение нейросети происходило на суперкомпьютере Christofari Neo. Сейчас модель работает в режиме закрытой бета-версии. Чтобы оказаться в числе первых, кто бесплатно протестирует новую нейросеть, надо вступить в закрытое сообщество в телеграм-канале.