22:22Decoder@Maximilian Schreiner保险公司开始使用扩散模型等生成式AI技术进行灾难建模,可生成数万个历史数据中不存在的合理天气事件。他们希望借此进行更精确的风险评估。然而研究人员警告称,AI生成的模拟事件可能存在幻觉和销售逻辑误导,影响实际决策准确性。行业保险公司生成式AI灾难建模幻觉风险评估推荐理由:保险公司用生成式AI做灾害建模,能补历史数据缺漏,但小心AI幻觉和销售套路,实际效果还得看验证。原文
13:58marktechpost@Michal Sutter精选OpenAI于2026年6月16日推出Deployment Simulation方法,通过回放历史对话让新候选模型生成完成并评分,以估计部署时不良行为率。该方法报告了1.5倍中位数乘法误差,将预部署风险评估扩展至智能体编码场景。文章还讨论了该方法的局限性,如无法覆盖所有风险类型。AI模型OpenAIDeployment SimulationAI安全风险评估10 个信源在谈推荐理由:OpenAI搞了个新方法,用历史对话模拟测试模型,能估算不良行为率,误差才1.5倍,做AI安全评估的朋友可以看看。原文
21:52rohanpaul_ai@rohanpaul_ai一篇论文提出,AI Agent 可能从根本上改变软件的本质,使代码不再是核心产物。传统软件是“冻结的意图”,而 Agent 能在运行时将意图转化为行动,生成代码作为一次性工具。这种转变是从预设计行为到协商行为的转变,系统会随条件变化持续解释目标。但这也带来新风险:静态程序在边界内失败,而 Agent 可能因漂移、过度自信或错误累积而失败。未来工程师不再是提示词写手或数字实习生监督者,而是定义意图、约束自主性、设计评估和检查推理轨迹的人。论文AI Agent软件范式代码生成自主系统风险评估推荐理由:这篇论文点出了 AI Agent 对软件范式的根本冲击——代码不再是最终产品,做架构设计或系统开发的团队值得一读,看完会对 Agent 的风险和工程师的新角色有更深理解。原文