Знаток передачи "Что? Где? Когда?" Сергей Николенко - о победах ИИ в интеллектуальных играх: В этом нет ничего апокалиптического, сплошные плюсы

Нейросети уже побеждают человека в интеллектуальных играх
В абсолютном большинстве интеллектуальных игр искусственный разум уже сильнее человека. Пожалуй, последним оплотом человечества можно считать российскую викторину "Что? Где? Когда?" (ЧГК), которая отличается от иностранных аналогов тем, что требует не знаний, а умений находить ответ логическим путем. А для этого нужны и чувство юмора, и эмпатия, и способность к языковым играм. Каковы наши шансы в противостоянии с машинами, мы разбирали с известным знатоком и специалистом в области искусственного интеллекта (ИИ) Сергеем Николенко.
Искусственный разум давно научился обыгрывать человека в шахматы, но пока еще плохо шутит и не проявляет эмпатии.
Искусственный разум давно научился обыгрывать человека в шахматы, но пока еще плохо шутит и не проявляет эмпатии. / iLexx / iStock

Он регулярно тестировал программы на способность отвечать на вопросы ЧГК. Переломным моментом называет октябрь 2024 года, когда появилась o1-preview - первая модель, которая специально обучена "думать" перед ответом. Она успешно решала сложные задачи олимпиадной математики. Когда ей предложили вопросы ЧГК, программа вдруг начала щелкать и их.

Этим летом Николенко устроил для передовых нейросетей целый чемпионат: предложил им традиционные загадки "Что? Где? Когда?", разбавив их визуальным и звуковым форматом.

- Идея была в том, чтобы сделать такой квиз, в котором ИИ сможет соревноваться с людьми, и ни у людей, ни у "роботов" не будет заведомого преимущества. Например, всем ИИ сложно с игрой в буквы, - говорит Сергей Николенко.

С восприятием звуковых заданий у нейросетей также возникли трудности. А вот с распознаванием изображений они справились хорошо. Самая "умная" на сегодня нейросеть o3-pro по сумме трех раундов победила даже людей.

- Картинки рукописей o3-pro, скорее всего, подгугливала, и запретить ей это не получалось, - отметил Николенко. - Но очевидно, что этот фронтир тоже потихоньку движется вперед. Надеюсь, что ИИ скоро все-таки смогут и юмор понимать, и буквы переставлять. В этом уж точно нет ничего апокалиптического, сплошные плюсы.

Пока не было тестирования в формате сильнейших против сильнейших. Все-таки команда из лучших игроков пусть и уступит в эрудиции всезнающей машине, но заметно превзойдет ее в умении рассуждать. Но при существующих темпах прогресса такой матч не за горами.

С новейшими разработками взаимодействуют специалисты. А вот с общедоступными нейронками можем позаниматься и мы. Какая же из бесплатных моделей самая "башковитая"?

Возьмем американские ChatGPT и Perplexity, китайский DeepSeek, отечественные Gigachat и всем знакомую "Алису". Вопросы лежат у них "под носом" - в интернете. Выбираем чемпионат Израиля 2009 года.

Для наглядности автор статьи сам пытается отвечать на те же загадки. И с огромным перевесом побеждает Gigachat - 12 из 20. "Алиса" показала догадливость вдвое меньше, и это наравне с человеком. Остальные слабее.

Разумеется, искусственные системы хорошо справляются с поиском по фактам, но и момент логического рассуждения тоже присутствует. При этом машина может проверять свои версии, сравнивая их с информацией в источниках. Любопытно, что победитель в качестве подтверждения несколько раз ссылался на сам вопрос, который он находил в Сети. Тут вспомнилась одна очень слабая и нечестная команда, которая в чемпионате одного из вузов Волгограда всегда из рук вон плохо играла первый тур, в перерыве нагугливала, откуда сегодня вопросы, и во втором туре отвечала на все подряд, уже подсмотрев ответы. Но нейросеть до этого не дошла. Она всякий раз начинала "раздумья" с нуля, хотя в предыдущих попытках уже натыкалась на страницу с конкретным турниром.

Усложним задачу. Теперь зададим ИИ загадки, которых нет в интернете. Автор их подготовил сам. Процент "озарений" снизился. Но нейронки все равно смогли дать несколько верных ответов. Три из десяти - это чемпионский результат "Алисы". Вот как она отвечает на вопрос, написанный по материалу с сайта "РГ".

Вопрос: В интервью летчик рассказал, что выпускные экзамены сдавал на самолете Ан-2. Журналист сострил, что его собеседника с самого начала тянуло к НЕЙ. Назовите ЕЕ.

Ответ (в сокращении): Поскольку экзамены сдавал на Ан-2, может быть, "ОНА" - это авиация, небо, полеты. Но журналист сострил, значит, игра слов. Может быть, игра на слове "двойка"? Или "ОНА" - это "кукуруза", так как Ан-2 называют "кукурузником" из-за использования в сельском хозяйстве, особенно при обработке кукурузных полей. Проверю, есть ли такие шутки в авиационном контексте. Да. "Кукуруза" - женского рода, подходит. Тогда ответ: кукуруза.

Команда из лучших игроков пусть и уступит в эрудиции всезнающей машине, но заметно превзойдет ее в умении рассуждать. Фото: Первый канал
История противостояния

Шашки, 1995

Программа Chinook обыграла чемпиона мира Дона Лафферти. Правда, из 32 партий соперники сыграли вничью в 31. В 2007 году разработчик Chinook Джонатан Шеффер объявил, что шашки полностью "решены": алгоритм может просчитать все возможные позиции и гарантировать ничью или победу из любой начальной расстановки.

Шахматы, 1997

Компьютер Deep Blue выиграл у чемпиона мира Гарри Каспарова (признан в России иноагентом. - Ред.) в матче из шести партий.

Викторины, 2011

Суперкомпьютер Watson победил звезд телевикторины Jeopardy! (в России она известна под названием "Своя игра"). Watson обрабатывал 200 миллионов страниц данных локально, без интернета.

Го, 2016

Программа AlphaGo переиграла чемпиона мира Ли Седоля со счетом 4:1. А ведь до этого считалась неподдающейся компьютеру из-за огромного числа возможных позиций и необходимости интуитивной оценки. Но есть и хорошая новость: в 2023 году американец Келлин Пелрин обыграл систему KataGo в 14 из 15 партий. Он предварительно проанализировал игру машины и воспользовался нестандартными тактиками.

Покер, 2017

ИИ Libratus обыграл четырех профессионалов в техасский холдем - игру с неполной информацией и блефом. За 20 дней он выиграл 1,8 миллиона долларов. Нейросеть ночью совершенствовала стратегию на основе дневных игр.

Компьютерные игры, 2019

AlphaStar одолел профессионалов игры StarCraft II со счетом 10:1, используя тот же интерфейс, что и люди. OpenAI Five победил 2:0 чемпионов в командном режиме в Dota 2.

Бридж, 2023

Программа NooK выиграла 83 процента партий у восьми чемпионов мира.

Мнение

Борис Белозеров, обладатель "Хрустальной совы" (из подкаста "Внимание, вопрос!"):

- Зачастую ИИ придумывает способы сделать что-то лучше, чем мы. Интересно, придумала бы нейросеть оптимальный способ взаимодействия с ведущим? Это невероятно сложная задача. Мне как капитану было бы интересно взаимодействовать с цифровым знатоком. Ты не понимаешь, что может происходить в его условной голове. Но очевидно, что-то из того, что он говорит, будет полезно. Я бы с киберзнатоком с удовольствием поиграл.