Смогут ли нейросети "убить" рекламный бизнес Google и Яндекса
23 января 2023 года компания Microsoft официально объявила о своих многомиллиардных инвестициях в OpenAI. В Bloomberg оценили размер этих вложений в $10 млрд. Microsoft заинтересовалась лабораторией OpenAI еще в 2019 году, но сейчас их партнерство вышло на новый уровень. Для некоммерческой организации, а именно так позиционирует себя OpenAI, это экстраординарные инвестиции.
OpenAI была создана двумя звездами бизнеса Илоном Маском (в представлении не нуждается) и Сэмом Альтманом (президентом венчурного фонда Y Combinator). В 2018 году Маск подал в отставку со своего места в совете директоров, сославшись на потенциальный конфликт интересов в связи с разработкой Tesla AI, ПО для автомобилей с автоматическим управлением, но остался донором лаборатории.
Эксперты считают, что главная причина бизнес-ажиотажа вокруг ChatGPT, заключается в том, что этот продукт показал, как технологии машинного обучения смогут бросить вызов "вечной" гегемонии Google в области интернет-поиска. По мнению Евгения Колбина, генерального директора компании Cloud современные GPT-модели в области работы с естественным языком во многом превосходят традиционные методы обработки и систематизации текстовой информации.
Средства интерактивного взаимодействия (например, чат-боты) на основе этих моделей способны поддерживать разговор на уровне взрослого образованного человека. Недавно вышло серьёзное научное исследование Mack Institute for Innovation Management, которое показало, что модель ChatGPT может набрать проходной балл на выпускном экзамене в одной из ведущих бизнес-школ. Мировые ИТ-гиганты очень серьезно относятся к использованию таких моделей если не для замены, то для дополнения результатов работы традиционных поисковых машин.
Как это работает
Пользователь может узнать у ChatGPT ответы на вопросы, которые часто задают в поисковиках: "рецепт курицы с овощами", "что посмотреть в городе N", "кто лучший художник эпохи Возрождения", " каков средний расход бензина у автомобиля X", "какой фильм посмотреть с 10-летним ребенком" и пр. Уже сейчас, часть таких ответов ChatGPT не менее точна, чем в классическом поиске Google, но превосходит стандартную выдачу поисковика по скорости и удобству получения и чтения.
Но и это не главное. Самое "страшное", что пользователь не видит рекламу в поисковой выдаче, которая размещается над релевантными ответами. При этом надо понимать, что Google получает 80% своего текущего дохода от рекламного от сервиса Google Ads. В 2021 году доход составил более $209 млрд. И хотя реклама показывается не только в поиске но и в видеохостинге YouTube принадлежащим Google , основной доход генерирует именно поисковик.
В Google очевидно увидели в технологиях используемых в ChatGPT "прямую и явную угрозу". В конце декабря глава Google Сундар Пичаи провел серию совещаний, чтобы определить дальнейшую стратегию работы над искусственным интеллектом, и реорганизовал работу многочисленных групп внутри компании, чтобы отреагировать на угрозу, которую представляет ChatGPT.
Проблема заключается в том, что Microsoft в партнерстве с OpenAI сможет без ущерба для своих основных бизнесов (Windows, MS Office, облака) интегрировать эту технологию в свой поисковик Bing. Доход Microsoft от поисковой рекламы согласно декабрьскому финансовому отчету составляет всего 5%.
Для Google решения аналогичные Chat GPT представляет экзистенциальную проблему, так даже если инженеры Google создадут собственное, не менее эффективное решение, оно каннибализирует их основной источник дохода. В Google всерьез опасаются, что искусственный интеллект, машинное обучение и продукты созданные на их основе могут разрушить их основной бизнес.
"У Google есть большая проблема с бизнес-моделью, - сказал Амр Авадаллах, гендиректор AI-стартапа Vectra, работавший ранее в Yahoo и Google . "Если чатбот Google даст вам идеальный ответ на запрос, вы не кликните ни на одну рекламную ссылку".
Не все так однозначно
Пока ChatGPT оперирует информацией до 2021 года. То есть не может отвечать на актуальные запросы типа "Какая сейчас погода" и научить генеративные нейросети оперировать постоянно обновляемой информацией сложная и дорогая задача.
По словам директора по исследованиям MTS AI OpenAI Никиты Семенова, OpenAI не раскрывают подробности своей архитектуры.
"Скорее всего, там просто обученная на данных на период до 2021 года, большая нейросеть-трансформер. В этом случае очень сложно поддерживать, актуальность данных. Без глубокой переработки каких-то отдельных компонентов этой самой нейросети, ее дальнейшее развитие скорее всего, будет трудозатратно и вряд ли будет возможно", - считает Семенов.
А что в России
Россия одна из немногих стран, где есть собственная поисковая система, как минимум не уступающая Google по качеству поиска в кириллическом сегменте интернета.
После того, как Google в 2022 году перестал вести бизнес в России, Яндекс оказался без своего главного конкурента на рынке поисковой рекламы. И хотя Яндекс более диверсифицированная компания, рекламный бизнес и для нее является ключевым.
В этом случае аналогии между доминирующем положением Google на международном рынке интернет-рекламы и Яндексом на российском рынке напрашиваются сами собой
При этом в России также есть очень сильные компании, занимающиеся машинным обучением и нейросетями аналогичными GPT. Есть сообщество квалифицированных датасайнетистов.
Например, Сбер инвестировал значительные ресурсы в технологии машинного обучения, разработку нейросетевых моделей, таких как ruGPT-3 13B и создание суперкомпьютеров, необходимых для обучения больших генеративных нейросетевых моделей.
Собственные ИИ-лаборатории сейчас есть практически у всех крупных российских телеком- и ИТ-компаний (включая Яндекс), а также в крупнейших российских банках.
Само обучение нейросетевых моделей пониманию вопросов и генерации ответов на русском языке не является неразрешимой проблемой.
"Обучить GPT3.5(нейросетевая модель на которой базируется ChatGPT) на русских текстах не проблема. Некоторые предыдущие версии GPT у OpenAI понимали десятки языков, в том числе русский. Я считаю, что мультиязычные подходы лучше моноязычных, ведь чем больше текстов и языков будут использованы в обучении нейросети, тем "умнее" она может быть в итоге", - говорит Андрей Иванов Технический лидер группы машинного обучения MTS AI
Так ли все страшно для поисковых-гигантов
Если относительно фантастического коммерческого потенциала генеративных нейросетей ни у кого нет сомнений, то относительно их конкуренции с поисковиками в ближайшем будущем мнения расходятся.
Известный венчурный инвестор Чамат Палихапития (Slack, Yammer) считает, что 2023 год может стать годом окончания доминирования Google на международном рынке поиска.
При этом OpenAI не раскрывает финансовую составляющую проекта и стоимость обучения. Известно, что лишь одна итерация обучения нейросетевой модели GPT3 (более простой версии GPT3.5) стоила $5 млн, а для полного обучения требуются несколько таких итераций, вычислительные ресурсы на работу модели, затраты на интеграцию в уже существующие системы.
Российские датасайентисты и представители бизнеса смотрят на возможности ChatGPT более осторожно и практично
"Основные потенциальные проблемы широкого публичного использования моделей класса GPT3.5 - это значительные вычислительные ресурсы: для полноценного обучения нужны мощные суперкомпьютеры, которые доступны не всем", - говорит Евгений Колбин.
Также по его мнению значительной проблемой является вопрос этики и фактической корректности предоставляемых ответов: модели пока не научились достоверно отличать ложь от истины и могут качественно и правдоподобно описывать несуществующие факты или события.Никита Семенов уверен, что поисковики все поисковики рано или поздно придут к новой модели поиска.
"Вопрос, смогут ли привыкнуть пользователи к ней, потому что уже сейчас появляются какие-то нюансы. Мы видим потенциальные подводные ямы этого решения, когда нейросеть начинает придумывать и сочинять несуществующие вещи, несуществующие статьи существующих авторов и пр. С точки зрения целостности информационного пространства, это довольно серьёзная история, - считает директор по исследованиям MTS AI и добавляет. - Мое интуитивное предположение, что подобная сеть будут претерпевать изменения, модернизацию, оптимизацию, прежде, чем она в том или ином виде появится как готовый продукт. Так что хотя все активно начинают в эту сторону смотреть и думать, и пытаться развивать такие системы, повсеместное использование таких сетей, проблема не завтрашнего дня для интернет-поисковиков.