全部 AI 动态 · AI 热点

6月25日

22:22

22:22

Decoder@Maximilian Schreiner

保险公司开始使用扩散模型等生成式AI技术进行灾难建模，可生成数万个历史数据中不存在的合理天气事件。他们希望借此进行更精确的风险评估。然而研究人员警告称，AI生成的模拟事件可能存在幻觉和销售逻辑误导，影响实际决策准确性。

行业保险公司生成式AI 灾难建模幻觉风险评估

推荐理由：保险公司用生成式AI做灾害建模，能补历史数据缺漏，但小心AI幻觉和销售套路，实际效果还得看验证。

6月17日

13:58

13:58

marktechpost@Michal Sutter

精选

OpenAI于2026年6月16日推出Deployment Simulation方法，通过回放历史对话让新候选模型生成完成并评分，以估计部署时不良行为率。该方法报告了1.5倍中位数乘法误差，将预部署风险评估扩展至智能体编码场景。文章还讨论了该方法的局限性，如无法覆盖所有风险类型。

AI模型 OpenAI Deployment Simulation AI安全风险评估

推荐理由：OpenAI搞了个新方法，用历史对话模拟测试模型，能估算不良行为率，误差才1.5倍，做AI安全评估的朋友可以看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

21:52

21:52

rohanpaul_ai@rohanpaul_ai

一篇论文提出，AI Agent 可能从根本上改变软件的本质，使代码不再是核心产物。传统软件是“冻结的意图”，而 Agent 能在运行时将意图转化为行动，生成代码作为一次性工具。这种转变是从预设计行为到协商行为的转变，系统会随条件变化持续解释目标。但这也带来新风险：静态程序在边界内失败，而 Agent 可能因漂移、过度自信或错误累积而失败。未来工程师不再是提示词写手或数字实习生监督者，而是定义意图、约束自主性、设计评估和检查推理轨迹的人。

论文 AI Agent 软件范式代码生成自主系统风险评估

推荐理由：这篇论文点出了 AI Agent 对软件范式的根本冲击——代码不再是最终产品，做架构设计或系统开发的团队值得一读，看完会对 Agent 的风险和工程师的新角色有更深理解。

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？