03:29OpenAI Blog(博客/媒体)精选OpenAI 发布了 Deployment Simulation,一种利用真实用户对话数据来模拟模型上线后行为的方法。该方法在多个安全评估场景中测试,能提前识别出传统评估遗漏的风险。与传统静态基准不同,Deployment Simulation 可捕捉模型在动态交互中的有害输出,提升评估准确率。论文OpenAIDeployment SimulationAI安全安全评估10 个信源在谈推荐理由:OpenAI 出了一套新方法,用真实对话提前模拟模型上线后的表现,能帮你更准地发现安全问题。原文
22:36IT之家(博客/媒体)Waymo 联合代尔夫特理工大学在《自然·通讯》发表论文,提出名为 ReD(参考驾驶员)的计算机认知模型,模拟人类驾驶员在意外瞬间如何做出最优避撞决策。该模型基于“主动推理”神经科学框架,通过最小化“意外”损失来模拟人类反应,包括逼近感判断、交通规范过滤、意外阈值触发策略重评,以及 0.2 秒踏板切换停顿等细节。与仅复现“最后一秒反应”的传统模型不同,ReD 能主动预判风险并调整行为。Waymo 希望将其作为行业基准,推动自动驾驶避撞评估标准化,并已开源研究代码供学术使用。AI产品Waymo自动驾驶安全评估认知模型开源推荐理由:Waymo 用认知科学给自动驾驶安全找了个新基准——不是比谁刹车快,而是比谁更像人类老司机。做自动驾驶安全评估的团队值得看看,开源代码可以直接拿来跑实验。原文