Искусственный интеллект стал рассуждать и имитировать человеческую логику

Компания-разработчик OpenAI представила нейросеть ChatGPT-o1, предназначенную для "сложных рассуждений" и более тонкого понимания задач. В чем отличие ChatGPT-o1 от GPT-4o - самой мощной нейросети - и других нейросетевых моделей и как ее можно использовать?
iStock

Новая нейросетевая модель реализована в виде двух чат-ботов o1-preview и o1-mini. Главная их особенность, что это большие языковые модели, обученные с помощью метода машинного обучения с подкреплением, который учит модель принимать оптимальные решения и который базируется на имитации процесса обучения "человеческим" методом проб и ошибок. Действия модели, направленные на достижение цели, усиливаются, а действия, отвлекающие от цели, игнорируются.

По сути, инженеры OpenAI на стадии обучения реализовали алгоритм, которым пользовались пользователи ChatGPT для того, чтобы добиться от него более содержательных ответов. Это метод заключался в том, чтобы получать лучшие решения за счет специальных запросов, которые заставляли нейросеть думать пошагово. То есть, один вопрос разбивался на несколько последовательных. А вот ChatGPT-o1 делает это сама.

Отличаются o1-preview и o1-mini тем, что o1-preview предназначена для решения задач с использованием более широких общих знаний о мире, а o1-mini для узких задач программирования, математики, физики, химии, где не требуется столь обширная общая информация. При этом, согласно планам OpenAI ChatGPT-o1 не заменит предыдущую модель GPT-4o. С базовыми вопросами общего характера GPT-4o справляется эффективнее , так как она получила более обширные знания о мире.

Особенность ChatGPT-o1 в том, что она тратит больше времени на "размышления" перед ответом, имитируя человеческое мышление. Это позволяет ей решать более сложные задачи, чем предыдущие модели, такие как GPT-4о.

Так как ChatGPT-o1 развивает и улучшает свои рассуждения, используя метод проб и ошибок, то благодаря этому процессу модель развивает и свои стратегии мышления. По мере того, как o1 отвечает на запросы она выявляет свои ошибки и исправляет их, точно также как это делает человек, когда рассуждения заводят его в тупик. Также o1 использует классический "человеческий" метод "съесть слона по частям", то есть разбивает сложные задачи на более простые и выполнимые, что упрощает нахождение правильного решения. ChatGPT-o1 умеет адаптировать стратегии. Если используемый подход не работает, модель меняет тактику рассуждений пробует другие методы для более эффективного решения задачи.

Первые пользователи ChatGPT-o1 отмечают, что она особенно эффективна для решения STEM-задач, то есть в области естественных наук, технологий, инженерии и математики. На Олимпиаде по математике (AIME) - престижном соревновании для учащихся старших классов в США - o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. o1 превзошла уровень доктора наук.

Один из пользователей ChatGPT-o1 рассказал, что на один из его вопросов нейросеть ответила, что ей нужно подумать, затем ушла на многочасовые размышления, а в итоге сообщила, что у нее нет ответа на заданный вопрос. Такое "человеческое" поведения модели многими комментаторами было воспринято как некий прорыв, однако опрошенные "РГ" эксперты настроены более сдержанно.

По мнению директора лаборатории FusionBrain Института AIRI Андрея Кузнецова, согласно открытой информации, новизны в подходе к обучению новой GPT не очень много, однако есть качественная реализация наиболее актуальных подходов к обучению больших ИИ-моделей (LLM). Среди них - цепочки, деревья и токены рассуждений, а также агенты.

"Их использование помогает в решении определенного пула задач - в первую очередь таких, как математические примеры, научные знания, олимпиадные задания. Улучшение метрик осведомленности модели о разных темах вместе с ощущением более наивного диалога благодаря дополнительному временному слоту на ожидание ответа делает взаимодействие с моделью более естественным. Однако, это стандартный этап работы с пользовательским опытом, который нельзя ассоциировать с "одушевлением" искусственного интеллекта и появлением у него зачатков "сознания", - подчеркнул Кузнецов.

Он также отмечает тот факт, что OpenAI скрывает реальные цепочки рассуждения модели от пользователя, а при любых попытках заставить модель их показать сервис выдает предупреждение о нарушении условий использования.

Значит ли это, что рассуждения ChatGPT-o1 менее выровненные, чем финальный ответ, или что в процессе их изучения могут "утечь" какие-то уникальные подходы разработчиков к написанию промптов - пока непонятно, но, очевидно, пользователи будут совершать попытки "разговорить" модель.

Менеджер продуктов Innostage Евгений Сурков, оценивая яркие примеры использования ChatGPT-o1 отмечает, что указанные сценарии применения нежизнеспособны для полезной коммерциализации системы, так как тесты созданы для проверки усвоения знаний людьми, а не для понимания способностей искусственного интеллекта".

"Прохождение таких тестов машинами не является свидетельством осознания ей корпуса данных. К тому же никто не отменял феномен "Китайской комнаты", когда при достаточно развитом алгоритме есть возможность поддерживать иллюзию осмысленной подачи информации без наличия ее структурированного осмысления. Для оценки настоящего потенциала моделей применяемые сейчас маркетинговые приемы не годятся: необходимы с одной стороны - специальные тесты для понимания внутренней структуры моделей, с другой - прикладные тесты в тех областях и реальных сценариях, для которых происходило создание модели и в которых в конечном итоге предполагается ее применение. Применять же модель, чтобы освободить человека от возможности пройти оценку своих знаний - это антипаттерн с точки зрения вопросов развития общества и возможностей человек", - заключает Сурков.

Эксперт в области ИИ компании Axenix Александр Стрельников уверен, что ChatGPT-o1 будет применяться в целом для тех же задач что и GPT-4o, но для более сложных кейсов. Он также считает, что несмотря на то, что ChatGPT-o1 склонна к длительным по времени рассуждениям, стоимость использования всех версий ChatGPT, включая o1, останется низкой.

Доступ к o1-preview и o1-mini предоставляется платным подписчикам ChatGPT Plus с 12 сентября. Подписка стоит 20 $ в месяц, но оплатить ее картой российского банка нельзя.