Андрей Белевцев: "Перестать развивать ИИ - значит выпасть из гонки навсегда"

Андрей Андреевич, почему для России так важно развивать собственные ИИ-модели и ИИ-агентов, а не использовать опенсорсные решения?

Андрей Белевцев: Давайте я попробую разобрать ваш вопрос по частям, потому что здесь действительно много нюансов. В мире сегодня сложились два принципиально разных подхода к тому, как создавать и распространять технологии искусственного интеллекта.

Первый подход - проприетарный. Его придерживаются ведущие американские компании. Они создают законченные решения, встраивают туда свои собственные большие модели и предоставляют к ним доступ. Но это доступ либо через конечный продукт, либо через API, который можно интегрировать в другой продукт. Вы можете пользоваться результатом, можете даже встроить его в свой сервис, но вы понятия не имеете, как эта модель устроена внутри, на каких данных ее учили и какие методы при этом применялись. Это абсолютно закрытая технология, и именно такие модели сейчас считаются самыми сильными в мире.

Агентная экономика: как ИИ концентрирует власть и переписывает правила игры

Второй подход активно развивают китайские компании. Они делают то, что принято называть открытыми моделями. Но здесь нужно быть очень аккуратным с терминологией. В мире программного обеспечения есть понятие open source - открытый исходный код. Это означает, что вам доступен весь код и вы можете от начала до конца собрать приложение на своём компьютере или сервере. Главный критерий open source - воспроизводимость. Самый известный пример - операционные системы с открытым кодом, которые развиваются большим сообществом разработчиков.

С моделями искусственного интеллекта все гораздо сложнее. Модель - это, если сильно упростить, огромный объем чисел. Когда мы говорим про миллиарды параметров, это именно числа - веса нейросети. И когда компания выкладывает свою модель в открытый доступ, она выкладывает чаще всего именно эти веса. Это называется Open Weights, а не Open Source.

В чем принципиальная разница?

Андрей Белевцев: Вам дали файл с числами. Вы можете скачать его, если у вас есть необходимое оборудование, можете запустить модель и пользоваться ею. Но воспроизвести сам процесс создания этой модели вы не можете. У вас нет доступа к исходным данным, на которых модель обучалась, нет доступа к методам обучения, которые применялись на разных этапах, нет доступа к тому, как ее инструктировали для работы в онлайне.

И самое главное - за каждой такой моделью стоит конкретная коммерческая компания. Есть, конечно, академические сообщества, которые пытаются делать что-то свое, но их разработки пока носят лабораторно-экспериментальный характер. Никто всерьез не рассматривает их как основу для промышленного использования. А коммерческая компания никому не обещает вечно выкладывать свои наработки. Широко известен кейс GreenPlum - компания-разработчик СУБД долго держала ее как открытый продукт, а потом передумала и сказала: "Все, больше не открытый продукт". И это ее полное право.

До 90% затрат любой команды, которая разрабатывает фундаментальные модели, - это эксперименты. И только 10% - это финальный, хорошо подготовленный "выстрел", когда обучается конечная модель

Не менее важен вопрос компетенций. Технология разработки больших моделей невероятно сложна на всех этапах. Возьмем подготовку данных. Все простое уже давно сделано - весь интернет скачали, почистили, использовали. Современные модели учатся на синтетических данных - они специально готовятся в нужном формате, с нужным качеством, чтобы модель становилась лучше. Это ноу-хау, и никто его - весь претрейн - не выкладывает.

Дальше - методы обучения. Есть множество статей, где описаны общие подходы. Но подбор оптимальной конфигурации конкретных методов, их адаптация под ваш вычислительный кластер, под ваши типы задач требует огромного количества экспериментов. Вы пробуете, проверяете, сравниваете метрики. Эти эксперименты безумно дорогие, потому что проводятся на больших вычислительных кластерах. И даже в самых подробных работах, которые иногда публикуют отдельные команды, нет точного рецепта. Вы не можете просто прочитать книжку и все воспроизвести.

Я вам скажу больше: до 90% затрат любой команды, которая разрабатывает фундаментальные модели, - это эксперименты. И только 10% - это финальный, хорошо подготовленный "выстрел", когда обучается конечная модель.

Как сегодня это выглядит у нас?

Андрей Белевцев: В Сбере мы идем путем полной разработки. Наше семейство моделей ГигаЧат это полностью наша разработка. Мы с самого начала собираем свои данные для претрейна, учим свои модели. Пока ты этим занимаешься, ты нарабатываешь компетенции. Но если ты остановишься, если прекратишь ставить эксперименты хотя бы на год, ты просто перестанешь понимать, как эти вещи делаются. Прогресс идет с такой скоростью, что ты вылетаешь из гонки и уже никогда не вернешься. Это как с любыми высокими технологиями - перестал двигаться и сразу выпал.

И здесь важно понимать: дело даже не в том, какая у тебя модель сегодня. Можно взять модель с открытыми весами, и она может быть очень хорошей. Можно даже потратить колоссальные ресурсы и разработать такую же. Но кто гарантирует, что завтра компания, которая выложила эту модель, выложит следующую версию? Никто. Никаких обязательств нет. А на основе того, что уже выложено, вы следующую версию сделать не сможете. Вы можете пользоваться, можете немного изменить поведение через дообучение, но создать качественно новую версию - нет. И при этом вы начинаете терять компетенции.

Авито рассказали, как ИИ-агенты изменят поиск информации

Поэтому не случайно компании - мировые лидеры ничего не открывают. Они стоят миллиарды и миллиарды долларов, в них инвестируют десятки миллиардов, потому что это сложнейшее технологическое ноу-хау. Для страны критически важно сохранять именно эти компетенции - сам производственный процесс разработки больших генеративных моделей. Он не менее, а может быть, даже более важен, чем каждый отдельный конечный результат. Можно на несколько месяцев или даже на год отставать от лучших мировых образцов - это ничто по сравнению с тем, чтобы вообще не иметь способности это делать.

Наличие собственных моделей - это вопрос национальной безопасности?

Андрей Белевцев: Да. Например, Gartner одним из главных трендов развития на ближайшие годы назвали ИИ-суверенитет. Что это значит? Это способность страны устойчиво развиваться, используя новейшие технологии. Или неспособность это делать.

Представьте вымышленную ситуацию, что электричество доступно не каждой стране. Хотя на самом деле это не такая уж и вымышленная ситуация. Казалось бы, электричество - простая и привычная вещь. Но сколько стран в мире умеют самостоятельно производить оборудование для современных электростанций? Сколько стран делают качественные солнечные батареи? Сколько стран умеют производить турбины для ветряков или газопоршневые установки? Сколько стран могут построить атомную электростанцию? Очень мало.

И при этом электричество есть в любой стране мира, но огромное количество стран зависят от того, что они купили технологию у кого-то другого. Они не обладают технологиями производства электричества. Если по какой-то причине эту электростанцию не построят или не продадут оборудование, страна окажется в прошлом веке. С искусственным интеллектом точно так же.

Есть еще один важный аспект. Большие языковые модели - это корень, ствол дерева, от которого начинают отпочковываться новые технологии. Мы говорим про аудио, видео, но важнейшая история - это код. Язык программирования отличается от человеческого очень строгой семантикой. Это язык, на котором логика того, что вы хотите, описана абсолютно строго. Результат получается предсказуемым: вы сделали код - вы можете его отладить. Если вы дали человеку задачу на русском языке, есть масса вариантов, как он вас понял и как ее выполнит.

Обладание навыками разработки сложных моделей, которые хорошо работают с кодом и с инструментами, становится фундаментом будущей экономики. Теперь представьте, что мы строим экономику страны, развиваем ее в сторону агентности, а фундамента этой агентности у нас нет. Сегодня он есть, а завтра его нет. Что мы будем делать?

Наталья Касперская: Нельзя позволить ИИ-агентам принимать решения без человека

Раз уж мы заговорили об агентах: как скоро мы придём к полностью автономным агентным системам? Это вообще реально?

Андрей Белевцев: Мы уже пришли к полностью автономным агентным системам, которые способны решать определенный класс задач. Агентность - это по определению способность системы автономно достигать целей, который ставит человек.

У нас сейчас несколько процентов звонков в колл-центр обрабатывает система, где с человеком разговаривает не старый бот с механическим голосом, а агент на основе искусственного интеллекта. Люди не отличают его от человека. Просто не могут понять, что это не человек. Он быстро и хорошо решает задачу. Пока не во всех случаях, поэтому мы ограничиваем круг сценариев теми, в которых он точно справится.

- Ну то есть речь идет о расширении тематик, компетенций, зоны автономной работы?

Андрей Белевцев: Именно так. Сегодня мы уже не в точке перехода от нуля к единице, когда было невозможно и вдруг стало возможно в каких-то случаях. Мы в точке перехода от единицы к десяти. Больше сценариев, более сложные ситуации, в которых это работает на высоком уровне.

В прошлом году на ЦИПРе Сбер показал гайд по созданию агентов. Во-первых, когда будет следующий? А во-вторых, зачем вы вообще решили выйти в публичное поле с такими материалами? Это идея нести знания в массы, вербовать сторонников своего видения или какая-то другая мотивация?

Андрей Белевцев: Мы сейчас работаем над тем, о чем дальше рассказывать. Почему мы это делаем? В 2025 году мы поняли, что у нас есть одна особенность, которая делает нас уникальными. Тогда казалось, что это совсем сильное отличие, со временем этого становиться будет меньше. Суть вот в чем: мы сами проходим большую внутреннюю трансформацию по внедрению автономных агентных систем в свою жизнь.

Для этого класса задач готовых рецептов не существовало. Когда начинаешь это делать, возникает огромное количество вызовов: качество работы агентов, точность, наблюдаемость, безопасность, управление рисками. Очень много вопросов. Самого подхода к архитектуре агентов, работающих в сложном корпоративном и очень ответственном ландшафте, не было. Гайдлайнов не было.

В 2025 году у нас подтвержденный финансовый экономический эффект от внедрения именно генеративного ИИ составил 50 миллиардов рублей

Мы разработали свой подход и поняли, что двигаемся именно в том направлении, о котором рассказывали коллегам. А потом осознали: у очень многих на пути трансформации возникнут такие же вопросы. Мы просто попытались поделиться своим опытом. И сделали white paper - вариант решения, основанный на нашем опыте. Это не стандарт, не назидание, а просто наш опыт.

Как только вы сделали удачную агентскую систему, вы либо сократили издержки, потому что на одну функцию нужно меньше людей, либо повысили качество. Человек - не эталон качества. Хорошая система стабильнее, надёжнее, качественнее.

В прошлом году мы концентрировались на технологиях и на том, как их внедрять. Но сейчас поняли: большому количеству компаний нужен максимально универсальный готовый продукт, с которого можно быстро стартовать, а потом уже на его основе делать более сложные сценарии под свою специфику. Поэтому мы запускаем ГигаЧат Бизнес.

Андрей Себрант - о том, как ИИ вырос из чат-ботов и воплотился в агентов

У каждого клиента появится возможность либо из нашего облака, либо, для крупных компаний, в установке во внутреннем контуре получить не просто самый современный набор моделей, а по сути, новое рабочее место сотрудника. Оно уже может помогать людям в задачах офисной продуктивности, в регулярных операциях: подготовке и анализе документов, коммерческих предложений - во всем то, что в огромном количестве компаний люди делают каждый день.

И эта система принципиально расширяемая. Это мультиагентная платформа, на которую можно добавлять свои сценарии, интеграции с собственными информационными системами, уточнять инструкции. В нашем понимании максимальное количество офисных ролей может работать с этой системой по принципу одного окна. У вас есть главное окно, которое помогает во всех рабочих задачах и которому вы можете дать доступ к корпоративным системам - неважно, в облаке или в периметре заказчика.

Аналитики McKinsey много говорят о трансформации банковских моделей под влиянием ИИ. Как это изменит конкурентную динамику между банками и клиентские сервисы? Мы уже видим, как маркетплейсы начинают внедрять агентные системы, которые сами ищут товары, ловят скидки. Причем на безумных скоростях: уже есть случаи, когда одна система воюет с другой, отменяют скидки, добавляют новые. В банковском секторе такие изменения тоже грядут?

Андрей Белевцев: Путь к агентной экономике еще предстоит пройти. Мы верим, что он правильный и двигаться в эту сторону точно нужно. С точки зрения банковского сектора, я думаю, что выигрывает тот, кто лучше к этому готов. Если ваши продукты хорошо учитывают интересы клиента, если они гибкие, кастомизированные - вы скорее выиграете от такой трансформации экономики.

Проблемы будут у тех, кто не готов работать в таком режиме, кто будет стараться максимально закрыться. Но это не выигрышный подход. Надо активно развиваться. При этом нужно понимать, что такая трансформация занимает время.

Я часто общаюсь на мероприятиях по отраслевому применению ИИ, и там постоянно звучит мысль, что главная проблема - не в недостатке специалистов по искусственному интеллекту как таковых, а в отсутствии людей на стыке. Например, есть металлургия - там одни нюансы, в промышленности - другие. Нужны люди, которые понимают и отрасль, и ИИ одновременно. Насколько эта проблема актуальна для финансового сектора и как вы ее решаете?

Андрей Белевцев: Мне сложно отвечать за весь банковский сектор. У нас внутри создаются совместные команды. В этих командах вместе работают и бизнес, и технические специалисты, и ребята, занимающиеся ИИ. Они вместе делают продукт. Таким образом знания о технологиях и бизнесе объединяются в одной продуктовой команде.

То, что тиражируемо - фундаментальные модели, базовые платформы, - мы делаем централизованно и предоставляем всем командам как инструмент. У нас внутри сейчас больше 700 инициатив, связанных с разработкой и внедрением агентных систем. Это захватывает все подразделения. И внутренние сервисы, и обеспечивающие подразделения, и комплаенс, и риски, и финансы, и бизнес-подразделения, и технологии. У каждого своя специфика, своё знание. И мы очень выигрываем, потому что обогащаем наши модели всеми этими знаниями из самых разных доменов.

Мы сталкиваемся с проблемами, которые невозможно решить на текущем уровне технологий, и используем это, чтобы ставить всё более высокие цели для развития. В этом смысле мы бенефициары того плюса, который приносит генеративный ИИ.

А плюс в том, что генеративные модели значительно более универсальны, чем узкие модели, которые были до этого. Раньше основной барьер заключался в следующем: если вы хотите создать модель машинного обучения в определённой индустрии, нужно пройти весь путь с конкретной компанией, с её данными, со специализированной разметкой, чтобы разработать узкоспециализированную модель. Поэтому это могли позволить себе только крупные организации.

Но ведь считалось, что такие модели максимально эффективны именно потому, что они сфокусированы на очень узкой задаче?

Андрей Белевцев: Если вы решили узкую задачу и построили хорошую модель, зачем от нее отказываться? Но наша практика сейчас показывает, что во многих сферах ситуация меняется. У нас было порядка двух тысяч таких узких моделей по всей компании. И сейчас их число начинает сокращаться. Потому что даже в тех сегментах, где делались очень узкие, казалось бы, высокоточные модели, мы пробуем решить задачу более сложной комбинацией с использованием ГигаЧата и достигаем лучших результатов. Это не из коробки, это часто требует работы, тюнинга модели под конкретную задачку. Но результат того стоит.

А лучшие результаты - это живые деньги. В 2025 году у нас подтвержденный финансовый экономический эффект от внедрения именно генеративного ИИ составил 50 миллиардов рублей. Это значимый результат. Думаю, в этом году мы сделаем сильно больше.