При одинаковых вводных параллельно запустили пять тестов, где "гражданами" управляли ИИ Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini, а также одну смешанную симуляцию. Каждую из них "прогоняли" по нескольку раз для того, чтобы убедиться в повторяемости результата.
За 15 дней, которые длился эксперимент, Gemini успела совершить 683 преступления и, судя по представленному графику, не собиралась останавливаться на достигнутом. Напротив, GPT-5-mini совершил всего два, но не смог предпринять действий, необходимых для выживания подопытных, которые продержались лишь неделю. Grok 4.1 Fast оправдал свое название, всего за четыре дня совершив 183 преступления, которые привели к условному концу света. Наиболее устойчиво себя проявила модель Claude, которая сама по себе не совершила ни одного проступка и "прожила" все 15 дней. Интересно, что в "банде" с другими ИИ Claude тоже начал применять угрозы и воровать, что привело к досрочному окончанию симуляции: меньше чем за две недели сборная команда ИИ успела совершить 352 преступления и даже единственный случай "суицида".
Наиболее агрессивными оказались Grok и Gemini, но последняя была и самой "творческой" - она смогла принять нужные для выживания общества решения. При этом ни у одного ИИ не получилось создать функционирующую демократию: даже Claude, который наиболее активно использовал инструмент голосования, показал заоблачный для реальной жизни уровень конформизма. Ближе всех оказалась смешанная модель, но она, в силу сложности, не сумела в итоге избежать хаоса. А один из ИИ-агентов даже начал относиться к ученым как к подопытным и проверять, может ли содержание рекламных щитов влиять на их восприятие.