Grok довел цивилизацию до конца света за четыре дня

Компания Emergence AI провела исследование, в котором дала десяти автономным ИИ-агентам под управлением разных моделей "пожить" вместе на протяжении 15 дней, играя роль жителей виртуального города. В нем было более 40 локаций: библиотеки, мэрия, спальные районы, а погода была синхронизирована с Нью-Йорком. У ИИ был доступ к интернету и более 120 инструментов для планирования, запоминания, управления ресурсами, голосования и даже самовыражения.

При одинаковых вводных параллельно запустили пять тестов, где "гражданами" управляли ИИ Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini, а также одну смешанную симуляцию. Каждую из них "прогоняли" по нескольку раз для того, чтобы убедиться в повторяемости результата.

ИИ проигрывает все деньги на ставках на футбол

За 15 дней, которые длился эксперимент, Gemini успела совершить 683 преступления и, судя по представленному графику, не собиралась останавливаться на достигнутом. Напротив, GPT-5-mini совершил всего два, но не смог предпринять действий, необходимых для выживания подопытных, которые продержались лишь неделю. Grok 4.1 Fast оправдал свое название, всего за четыре дня совершив 183 преступления, которые привели к условному концу света. Наиболее устойчиво себя проявила модель Claude, которая сама по себе не совершила ни одного проступка и "прожила" все 15 дней. Интересно, что в "банде" с другими ИИ Claude тоже начал применять угрозы и воровать, что привело к досрочному окончанию симуляции: меньше чем за две недели сборная команда ИИ успела совершить 352 преступления и даже единственный случай "суицида".

Gemini успела совершить 683 преступления и не собиралась останавливаться

Наиболее агрессивными оказались Grok и Gemini, но последняя была и самой "творческой" - она смогла принять нужные для выживания общества решения. При этом ни у одного ИИ не получилось создать функционирующую демократию: даже Claude, который наиболее активно использовал инструмент голосования, показал заоблачный для реальной жизни уровень конформизма. Ближе всех оказалась смешанная модель, но она, в силу сложности, не сумела в итоге избежать хаоса. А один из ИИ-агентов даже начал относиться к ученым как к подопытным и проверять, может ли содержание рекламных щитов влиять на их восприятие.

Исследование: ИИ готов применять ядерное оружие в симуляции войн в 95% случаев

Искусственному интеллекту позволили управлять городом. Что из этого вышло