AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:风险评估×
6月25日
22:22
22:22Decoder@Maximilian Schreiner
保险公司开始使用扩散模型等生成式AI技术进行灾难建模,可生成数万个历史数据中不存在的合理天气事件。他们希望借此进行更精确的风险评估。然而研究人员警告称,AI生成的模拟事件可能存在幻觉和销售逻辑误导,影响实际决策准确性。
行业保险公司生成式AI灾难建模幻觉风险评估

推荐理由:保险公司用生成式AI做灾害建模,能补历史数据缺漏,但小心AI幻觉和销售套路,实际效果还得看验证。
原文
6月17日
13:58
13:58marktechpost@Michal Sutter
精选
OpenAI于2026年6月16日推出Deployment Simulation方法,通过回放历史对话让新候选模型生成完成并评分,以估计部署时不良行为率。该方法报告了1.5倍中位数乘法误差,将预部署风险评估扩展至智能体编码场景。文章还讨论了该方法的局限性,如无法覆盖所有风险类型。
AI模型OpenAIDeployment SimulationAI安全风险评估

推荐理由:OpenAI搞了个新方法,用历史对话模拟测试模型,能估算不良行为率,误差才1.5倍,做AI安全评估的朋友可以看看。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
21:52
21:52rohanpaul_ai@rohanpaul_ai
一篇论文提出,AI Agent 可能从根本上改变软件的本质,使代码不再是核心产物。传统软件是“冻结的意图”,而 Agent 能在运行时将意图转化为行动,生成代码作为一次性工具。这种转变是从预设计行为到协商行为的转变,系统会随条件变化持续解释目标。但这也带来新风险:静态程序在边界内失败,而 Agent 可能因漂移、过度自信或错误累积而失败。未来工程师不再是提示词写手或数字实习生监督者,而是定义意图、约束自主性、设计评估和检查推理轨迹的人。
论文AI Agent软件范式代码生成自主系统风险评估

推荐理由:这篇论文点出了 AI Agent 对软件范式的根本冲击——代码不再是最终产品,做架构设计或系统开发的团队值得一读,看完会对 Agent 的风险和工程师的新角色有更深理解。
原文
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
精选全部日报登录