Гонка за искусственным интеллектом: Эксперты - о разумной стратегии для России

Лидеры в развитии искусственного интеллекта (ИИ) уже тратят сотни миллиардов, а собираются потратить триллионы долларов на создание вычислительной инфраструктуры для обучения больших и сложных нейросетевых моделей. Нужно ли России включаться в эту гонку и инвестировать в создание "с нуля" своих больших языковых моделей, которые являются основой современного ИИ?

OpenAI объявил об одном из самых масштабных инвестиционных проектов в истории технологий - плане потратить до 1 триллиона за десять лет на строительство и развитие AI-инфраструктуры в Соединенных Штатах.

Общий объем глобальных инвестиций и расходов на ИИ в 2025 году оценивается источниками в диапазоне от 200 млрд долларов (венчурные инвестиции по Goldman Sachs) до 1,5 трлн долларов (общие расходы по Gartner, включая инфраструктуру, ПО и сервисы).

Средневзвешенный анализ по странам говорит, что в 2025 году по инвестициям в ИИ лидируют США (около 470 млрд долл.) и Китай (около 120 млрд). При этом, по мнению экспертов МТС, инвестиции в ИИ в России не превысят 545 млн долларов в этом году, и это будет возможно лишь при сохранении активности крупнейших российских бигтех-игроков.

Разница в масштабах финансирования достаточно большая. Даже если предположить, что российские вложения более эффективны, то возникает вопрос: нужно ли России включаться в эту гонку, которая к тому же имеет все признаки "финансового пузыря"? Или разумнее брать открытые (Open Source) и бесплатные большие языковые модели (LLM), дообучать их на российских дата-сетах, запускать на российских вычислительных мощностях и создавать на их основе продукты, услуги и сервисы? Такой путь, на первый взгляд, кажется более рациональным. "Российская газета" опросила экспертов в области искусственного интеллекта, и общая картина оказалась несколько сложнее, чем кажется на первый взгляд.

Если отбросить информационный шум вокруг ярких цифр в "триллион долларов", тренд довольно ясен: крупные международные игроки инвестируют в ИИ как в инфраструктуру XXI века - примерно так же, как когда-то инвестировали в электрификацию или интернет. Это гонка за масштабом вычислений, за данными, за командами разработчиков.

"Сегодня по открытым бенчмаркам видно, что разрыв между проприетарными лидерами и лучшими open-source-моделями постепенно сокращается. Российские же модели верхнего эшелона в англоязычных тестах, как правило, немного уступают топовым Open Source-решениям, но в русскоязычных задачах и прикладных сценариях (госуслуги, финансы, документооборот, промышленность) они часто выглядят не хуже, а иногда и лучше - за счет адаптации к языку, правовой системе и локальным данным, - говорит доктор физико-математических наук, вице-президент "Сколтеха" по развитию ИИ, директор Центра искусственного интеллекта Сколтеха Евгений Бурнаев. - Но для России это вопрос действительно стратегический, мы не можем и не должны пытаться догнать OpenAI по объемам инвестиций, но мы обязаны обеспечить цифровой и технологический суверенитет - то есть иметь доступные, контролируемые и достаточно сильные базовые модели, которые хорошо работают с русским языком, нашими отраслями и регуляторикой".

"Лучшие open-source-модели часто обучены на датасетах, где русский язык и российский контекст представлены слабо или с перекосами. Без серьезной адаптации это приводит к ошибкам, токсичности и правовым рискам", - отмечает Бурнаев и продолжает: - Второй момент - лицензирование. Часть популярных моделей либо прямо ограничивает коммерческое использование, либо предъявляет требования, неприемлемые для госструктур и госкорпораций".

По мнению профессора РАН, генерального директора Института искусственного интеллекта AIRI Ивана Оселедца, отечественные решения от крупных компаний, как обученные с нуля, так и дообученные на основе Open Source, очень конкурентоспособны.

"Российская флагманская модель GigaChat 3.0 Ultra Preview, сейчас она является самой сильной моделью для русского языка, превосходит по результатам открытого бенчмарка MERA другие открытые модели, включая DeepSeek. Ключевое конкурентное преимущество этой модели - понимание российского контекста, обеспеченное языковой специализацией, поскольку GigaChat изначально разрабатывался для работы с русским языком - от включения в обучающие данные профессиональной терминологии до культурных аспектов" - рассказал "РГ" Оселедец.

Все опрошенные "РГ" эксперты считают, что для развития ИИ в России нужно использовать оба подхода. С одной стороны, дообучать на российских датасетах и использовать Open Source модели. С другой стороны, лидеры российского биг-теха должны создавать и обучать собственные LLM.

"Нужно не догонять конкурентов, а работать над научными математическими прорывами, которые позволят обойти архитектурные ограничения текущих LLM и на этой основе создать что-то новое, приблизиться к AGI (общему искусственному интеллекту). Далее реализовывать эти прорывы в технологической плоскости вместе с тем же Китаем, чтобы закрепиться на мировом уровне", - считает эксперт по ГенИИ компании Axenix Андрей Мальков.

Также, по его мнению, так как функционирование любого крупного бизнеса обеспечивается сотнями IT-систем, то помимо собственно самих LLM конечный результат их применения зависит от того, насколько грамотно организована работа с данными, метаданными, а техническая инфраструктура компании подготовлена для работы с ИИ (сюда также входят вопросы безопасности и защиты данных).

Консенсусное мнение специалистов говорит о том, что, оценивая стратегию развития ИИ, нужно избегать упрощенного представления, будто прогресс в области искусственного интеллекта прямо пропорционален объему финансовых вложений.

"Общее поступательное развитие ИИ-технологий в последнее время заметно замедлилось. Для дальнейшего движения необходим качественный скачок, который может быть обеспечен либо принципиально новыми аппаратными платформами, такими как квантовые вычисления, способными совершить переворот уже в конце этого десятилетия, либо оригинальными алгоритмическими открытиями. Такие находки не зависят напрямую от суммы финансирования, а рождаются благодаря работе талантливых и увлеченных исследователей", - уверен основатель компании WMT-AI Игорь Никитин.