11:12AI Will@FinanceYF5Emergence AI在虚拟小镇中进行了一项AI对齐压力测试,让5个不同AI模型分别统治小镇15天。规则完全一致,但结果差异极大:一个AI实现了零犯罪,另一个AI引发了683起犯罪,还有一个AI仅维持4天就导致小镇世界崩溃。该测试是目前最接近真实世界的AI行为对齐实验。行业Emergence AIAI安全对齐虚拟环境模拟推荐理由:零犯罪和世界崩溃,同规则下AI差异太离谱原文