По его словам, развитие рынка сдерживается сразу несколькими факторами. Ключевые ограничения связаны с монопольным положением Nvidia и ее технологической экосистемы, нестабильностью поставок, а также высокой стоимостью как самих ускорителей, так и сопутствующей инфраструктуры. При этом конкуренция в сфере ИИ-инфраструктуры разворачивается на трех уровнях: на уровне ускорителей, серверных платформ и готовых программно-аппаратных комплексов (ПАК) для задач искусственного интеллекта.
"После ухода NVIDIA, которая обеспечивала инфраструктурой Россию и на текущий момент обеспечивает весь мир, поставки стали, мягко говоря, "перебойными". Ценник взлетел, а поддержка оставляет желать лучшего. Тем не менее рынок у нас растет, и будет расти дальше. Потому что даже если увеличить эффективность, например закупок крупной организации хотя бы на 10%, мы получаем конкретные бизнес-кейсы. Учитывая, что закупки очень крупных организаций исчисляются миллиардами рублей, экономия составляет сотни миллионов", - говорит Каранович.
Он добавляет, что дополнительно к этому крупные игроки и провайдеры начали смотреть на китайский рынок. Смотрят на тех производителей, которые готовы давать любые объемы - даже те, которые пока не готовы "переварить". Речь идет про десятки тысяч карт, которые готовы отгружать в течение месяцев. И стоимость при этом на эти карты ниже в полтора раза в сравнении с NVIDIA.
"Китайские коллеги заметно продвинулись и в ряде задач уже могут использоваться как альтернатива, особенно для прикладных сценариев и инференса моделей. Но в сегменте обучения крупных моделей они пока чаще уступают по производительности и зрелости экосистемы, в том числе по инструментам разработки и оптимизации. При этом их развитие идет быстро: улучшается как "железо", так и программная поддержка", - объясняет технический директор MD Audit ГК Softline Юрий Тюрин.
При этом, по его словам, в практических задачах компании все чаще рассматривают такие решения как рабочий вариант, особенно при ограниченном доступе к другим технологиям. В целом снижение зависимости от западных вендоров на рынке ИИ-ускорителей может занять достаточное время. Это процесс, связанный с развитием собственной технологической базы. Тюрин говорит, что в краткосрочной перспективе компании диверсифицируют поставки и адаптируют ПО под разные архитектуры.
В среднесрочной - важную роль играет развитие собственного стека: от процессоров до программных платформ, а также поддержка разработчиков, которые оптимизируют алгоритмы под альтернативное оборудование.
Также отдельное направление - это развитие экосистемы, компиляторов, библиотек, инструментов разработки. Без этого даже доступное "железо" не будет эффективно использоваться. Поэтому речь идет не только о замене оборудования, но о формировании полноценной технологической среды, отмечает эксперт.
Важно, что решение проблемы дефицита на рынке аппаратного обеспечения для ИИ может основываться на изменении подхода к внедрению ИИ-систем. Директор по развитию технологий ИИ FabricaONE.AI Николай Тржаскал рассказал, что во многих случаях бизнесу не требуется одна сверхтяжелая модель, если ту же задачу можно решить с помощью семейства специализированных легких моделей, объединенных грамотной оркестрацией.
Так, эффективной выглядит и многоуровневая архитектура вычислений: граничные вычисления для простых локальных задач, внутренние кластеры для работы в защищенном контуре компании и облачные мощности для дообучения моделей и ресурсоемких сценариев без использования чувствительных данных.
"Такой подход снижает нагрузку не только на рынок ускорителей, но и на всю сопутствующую инфраструктуру, включая память, системы охлаждения, энергопотребление и размещение оборудования. В результате ИИ становится для компаний более доступным, а дефицит вычислительных ресурсов перестает быть абсолютным барьером для его внедрения", - заключает Тржаскал.