Создание нового алгоритма ознаменует начало нового этапа в развитии ИИ компанией, поскольку система окажет влияние почти на все ее продукты. Более того, на сегодняшний день Gemini представляет собой самую мощную и универсальную ИИ-модель Google, рассказал гендиректор корпорации Сундар Пичаи.
По его словам, технология получилась мультимодальной - она умеет одновременно понимать, обобщать, комбинировать и оперировать разными типами информации, в том числе изображениями и текстами. Так, Gemini способен извлекать данные из сотен тысяч документов.
"Эта новая эра моделей представляет собой одно из крупнейших научных и инженерных усилий, предпринятых нашей компанией", - подчеркнул Пичаи.
Уточняется, что разработчики научили модель отвечать даже на сложные вопросы, а также понимать и генерировать код на следующих языках программирования: Python, C++, Java и Go. Помимо этого, у Gemini есть возможность работать, например, на оборудовании центров обработки данных и мобильных устройствах.
Реализация нового ИИ будет происходить сразу в нескольких вариантах: Gemini Nano - версия для смартфонов на базе Android, Gemini Pro - версия для широкого спектра задач, Gemini Ultra - самая мощная версия, которая будет справляться со сложными запросами.
Если говорить о "присутствии" Gemini в продуктах Google, то в чат-боте Bard уже начала использоваться усовершенствованная версия Gemini Pro. С помощью нее, в частности, значительно улучшились навыки понимания и рассуждения системы. На первом этапе новая версия станет доступна на английском языке более чем в 170 странах, однако в будущем разработчики, вероятно, расширят географию и поддержку языков.
Что касается Gemini Nano, то эта модель появится в смартфоне Google Pixel 8 Pro. Таким образом, он станет первым мобильным устройством, имеющим такую технологию. Кроме того, Google планирует в ближайшие месяцы добавить поддержку Gemini в браузер Chrome, поиск, рекламу и ряд других своих сервисов.