Как зарабатывать на искусственном интеллекте

Следующий этап нейросетевой эстафеты принимают продукты на стыке LLM и прикладных технологий. Встроиться в гонку успеют стартапы и корпорации, которые смогут обогатить существующие модели с помощью агентов. Этот тренд прямо сейчас создает колоссальный задел для развития российской ИТ-индустрии.

За последние два года качество ответов больших языковых моделей заметно улучшилось. Они успешно справляются с самыми разнообразными задачами - от поисковых запросов до генерации осмысленного кода и реалистичных изображений. Но для полноценного коммерческого применения все еще требуются доработки и корректировки примерно в 90 процентах случаев.

OpenAI продолжает лидировать на рынке языковых моделей. Новая ChatGPT o1 Pro превосходит предыдущие в математических операциях, кодировании, обработке текстов и других задачах. Sora выделяется в генерации видео. В Поднебесной лидирует Qwen от Alibaba Cloud с моделью QwQ-32B-Preview, считающейся конкурентом OpenAI в области рассуждающего ИИ.

В то же время в арабских странах и в России развитие крупных языковых моделей затруднено. Первые разработали модель Falcon и инвестировали 300 миллионов долларов в ее развитие, но конкурентного качества так и не добились. Среди отечественных разработчиков лидируют Сбер и "Яндекс". Однако тестирование в нашей области показало, что их качество все еще уступает зарубежным аналогам, хотя и не критично.

Тем временем замедление темпов прогресса традиционных моделей ИИ уже замечают в работе OpenAI, а один из основателей компании Илья Суцверкер рассказал, что возможности предобучения LLM достигли предела.

Грядущая волна инноваций будет связана с развитием нишевых стартапов, которые решают конкретные бизнес-задачи

Такая ситуация стимулирует поиск инновационных подходов. Например, fine-tuning - настройка и превращение языковых моделей общего назначения в нишевые, специализированные решения, устраняющие разрыв между предварительно обученными моделями и требованиями конкретных областей применения.

Крупнейший инвестор в области AI - исследовательский фонд Andreessen Horowitz - утверждает, что наблюдается сдвиг от простого использования больших языковых моделей к созданию комплексных продуктов и интеграций второго уровня на их основе.

Начинается новый этап зрелости в применении генеративного AI в корпоративном секторе. Так появляются компании, специализирующиеся на адаптации языковых моделей под конкретные бизнес-задачи. Они пытаются найти способы довести качество генерации до уровня, полностью удовлетворяющего потребности рынка, в том числе путем комбинирования LLM с собственными технологиями с человеческим трудом.

По данным Gartner, от 60 до 85 процентов проектов по внедрению ИИ нерезультативны либо вообще не доходят до реализации. А 85 процентов российских компаний не готовы взаимодействовать с генеративным ИИ в облаке.

Одна из проблем использования больших языковых моделей в бизнесе состоит в том, что без дополнительной настройки их сложно интегрировать.

Так, продукт Explyt Test занимается генерацией тестов с помощью AI для программистов, работающих на языках Java и Kotlin, которые популярны в корпоративной среде. Для достижения эффективной генерации тестов на уровне 80-90 процентов кроме использования языковых моделей мы внедрили формальные методы, сделали интеграцию со средой разработки IntelliJ IDEA Community Edition для более интеллектуального сбора контекста. Кроме того, мы научили ПО автоматически исправлять ошибки компиляции и исполнения с помощью итерактивного взаимодействия между агентом и моделью.

Качественная работа LLM требует обучения на больших объемах размеченных данных и корректного промпт-инжиниринга. Вопросы безопасности и потребность в инфраструктуре для локального развертывания подразумевают значительные инвестиции. Например, для локального развертывания популярных Open Source моделей необходимы дорогостоящие видеокарты A100 или H100. Все это подводит компании к вопросу окупаемости таких инвестиций. Поэтому внедрение чаще всего начинается с решения небольших прикладных задач по минимализации рутинной работы и повышению производительности сотрудников.

Грядущая волна инноваций будет связана с развитием нишевых стартапов, которые решают конкретные бизнес-задачи с использование LLM.

На этом рынке есть еще примеры. SpeechXplore - решение для онлайн-анализа клиентской коммуникации. Искусственный интеллект извлекает необходимые данные из неструктурированных диалогов. Или Voximplant - облачная платформа для автоматизации голосовых, видео- и текстовых коммуникаций. Она поддерживает синтез и распознавание речи более чем на 80 языках.

Существующие крупные игроки - Сбер, "Яндекс", МТС и группа "Т-Технологии" - уже создают сервисы на основе собственных и открытых языковых моделей. Однако также появится множество небольших стартапов, которые займут свои ниши. За счет использования открытых и сторонних решений, а также доступа к широкому кругу клиентов они смогут составить конкуренцию крупным корпорациям. Хотя у последних больше ресурсов, они не всегда быстро адаптируются к изменяющимся условиям, что дает стартапам преимущество в гибкости и скорости реагирования.