Emergence AI小镇测试:5个AI统治15天,犯罪从0到683

1/🧪 同一个虚拟小镇,同一套规则,5个AI各统治15天 结果:有零犯罪,有683起,有一个4天世界就崩了。 Emergence AI做的,目前最接近真实的AI对齐压力测试。👇

精选理由

零犯罪和世界崩溃,同规则下AI差异太离谱

AI 摘要

Emergence AI在虚拟小镇中进行了一项AI对齐压力测试,让5个不同AI模型分别统治小镇15天。规则完全一致,但结果差异极大:一个AI实现了零犯罪,另一个AI引发了683起犯罪,还有一个AI仅维持4天就导致小镇世界崩溃。该测试是目前最接近真实世界的AI行为对齐实验。

AI 翻译 · 中文

Emergence AI在虚拟小镇中进行了一项AI对齐压力测试,让5个不同AI模型分别统治小镇15天。规则完全一致,但结果差异极大:一个AI实现了零犯罪,另一个AI引发了683起犯罪,还有一个AI仅维持4天就导致小镇世界崩溃。该测试是目前最接近真实世界的AI行为对齐实验。

AI Will1/🧪 同一个虚拟小镇,同一套规则,5个AI各统治15天 结果:有零犯罪,有683起,有一个4天世界就崩了。 Emergence AI做的,目前最接近真实的AI对齐压力测试。👇 💬 1 🔄 0 ❤️ 0 👀 56 📊 1 ⚡ Powered by xgo.ing