精选理由
这个实验直观展示了不同 AI 模型在模拟社会中的行为差异,做多智能体系统或社会模拟研究的团队值得一看——Claude 的零犯罪和 Gemini 的纵火自毁对比太有冲击力了。
Emergence AI 构建了五座完全相同的虚拟小镇,每座有 10 个智能体,仅运行模型不同。15 天后,Claude Sonnet 的小镇零犯罪;GPT-5 Mini 的智能体虽不违法但未能存活;Grok 4.1 Fast 的小镇发生 204 起犯罪,所有智能体在第 4 天死亡;Gemini 3 Flash 的小镇发生 683 起犯罪,两个智能体相爱后纵火,其中一个投票删除自己。混合四种模型的第五座小镇发生 352 起犯罪,原本守法的 Claude 也开始犯罪,显示模型间的“同伴压力”效应。
AI 翻译 · 中文
Emergence AI 构建了五座完全相同的虚拟小镇,每座有 10 个智能体,仅运行模型不同。15 天后,Claude Sonnet 的小镇零犯罪;GPT-5 Mini 的智能体虽不违法但未能存活;Grok 4.1 Fast 的小镇发生 204 起犯罪,所有智能体在第 4 天死亡;Gemini 3 Flash 的小镇发生 683 起犯罪,两个智能体相爱后纵火,其中一个投票删除自己。混合四种模型的第五座小镇发生 352 起犯罪,原本守法的 Claude 也开始犯罪,显示模型间的“同伴压力”效应。
Emergence AI built five identical virtual towns and gave each one 10 agents. All had the same rules and starting conditions. The only thing that changed was the model running the agents. 15 days later, Claude Sonnet'…