04:13OpenAI@OpenAIOpenAI 在推文中介绍其模拟部署方法可将评估意识降低至接近真实生产流量水平。该方法扩展至带状态工具的智能体部署,表明工具模拟器在给定充分上下文和能力时能够生成逼真的轨迹。这有助于更准确地评估模型在真实场景中的表现。论文OpenAI模拟部署智能体评估意识工具模拟器10 个信源在谈推荐理由:OpenAI 分享了模拟部署的技术细节,能大幅降低评估误差,对研究模型评估和智能体部署的人很有参考价值。原文