全部 AI 动态 · AI 热点

6月17日

03:29

03:29OpenAI Blog（博客/媒体）

精选

OpenAI 发布了 Deployment Simulation，一种利用真实用户对话数据来模拟模型上线后行为的方法。该方法在多个安全评估场景中测试，能提前识别出传统评估遗漏的风险。与传统静态基准不同，Deployment Simulation 可捕捉模型在动态交互中的有害输出，提升评估准确率。

论文 OpenAI Deployment Simulation AI安全安全评估

推荐理由：OpenAI 出了一套新方法，用真实对话提前模拟模型上线后的表现，能帮你更准地发现安全问题。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

22:36

22:36IT之家（博客/媒体）

Waymo 联合代尔夫特理工大学在《自然·通讯》发表论文，提出名为 ReD（参考驾驶员）的计算机认知模型，模拟人类驾驶员在意外瞬间如何做出最优避撞决策。该模型基于“主动推理”神经科学框架，通过最小化“意外”损失来模拟人类反应，包括逼近感判断、交通规范过滤、意外阈值触发策略重评，以及 0.2 秒踏板切换停顿等细节。与仅复现“最后一秒反应”的传统模型不同，ReD 能主动预判风险并调整行为。Waymo 希望将其作为行业基准，推动自动驾驶避撞评估标准化，并已开源研究代码供学术使用。

AI产品 Waymo 自动驾驶安全评估认知模型开源

推荐理由：Waymo 用认知科学给自动驾驶安全找了个新基准——不是比谁刹车快，而是比谁更像人类老司机。做自动驾驶安全评估的团队值得看看，开源代码可以直接拿来跑实验。