全部 AI 动态 · AI 热点

6月26日

11:37

11:37

arXiv cs.AI@Fabiana Fournier, Lior Limonad

论文提出进程架机制，在不替换底层工作流引擎的前提下，用策略治理的智能体层包裹确定性工作流。作者开发了任务-决策-流（TDF）模型，定义数据模式和执行语义，将LLM推理分解为三类策略治理的智能体：TaskAgent（知识密集型任务）、DecisionAgent（逐案例网关路由）和FlowAgent（运行时流适应）。在CUGA FLO中实现该设计，并通过贷款审批工作流演示三种智能体类型及挂钩驱动的监管覆盖。进程架通过确定性工作流执行强制结构合规，同时通过策略框架的智能体自主性满足规范需求。

论文 CUGA FLO TDF Agentic BPM 工作流论文

推荐理由：这篇论文提出了一个很实用的思路：在现有工作流引擎上加一个智能体层，不用重写系统就能让工作流更灵活。用贷款审批的例子讲清楚了三种智能体怎么协作，技术方案具体可落地。

09:31

09:31

arXiv: OpenAI@Drew Johnston, David Holtz, Alex Martin Richmond, Christopher Ong, Prasanna Tambe, Aaron Chatterji

76°

OpenAI发布基于Codex使用数据的分析，展示Agentic AI技术如何改变工作方式。2026年上半年，Codex活跃用户数增长超过五倍，其中非软件开发者的增长最快。OpenAI内部Codex几乎完全替代了ChatGPT用于业务工作。超过10%的用户每周管理三个以上并发Codex代理，26.6%使用技能共享复杂工作流。请求复杂度上升：估算需要资深人类8小时以上的任务请求比例增长近十倍。2026年6月，OpenAI法律岗位员工通过Codex和ChatGPT的月输出Token中位数是2025年11月的13倍，研究人员则超过50倍。

论文 Codex OpenAI Agentic AI 智能体工作流

推荐理由：OpenAI内部数据揭示Agentic AI如何改变工作方式：Codex活跃用户半年增5倍，研究人员月产出增50倍。看真实采用率与工作流变化。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

12:55

12:55

arXiv cs.AI@Sara Fish

该研究以EC 2025论文中一个关于公共物品稳定菜单的开放问题为测试平台，评估不同AI研究工作流的效果。实验发现：(1)在提示中加入人类直觉能提升LLM的“品味”；(2)多轮交互工作流在鼓励“大胆步骤”时更有效。与一名一年级博士生比较，LLM在解决该问题上的效果略逊一筹。研究尚未公开博士生参与前的原始手稿对比细节。

论文 EconCS LLM 公共物品工作流 AI研究

推荐理由：这篇论文告诉你，用AI做经济学研究时，喂它人类直觉比纯指令好使，但别指望它比刚入行的博士生强多少。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

11:52

11:52

arXiv cs.AI@Wesley Pegden

精选

Trellis 是一个自动形式化系统，利用 LLM 智能体在确定性约束的工作流中，通过迭代优化自然语言证明，逐步推进 Lean 自动形式化任务。该系统受数学家对“严谨证明”的直觉启发——即证明的任何部分都可以被进一步详细阐述。Trellis 在有限预算下使用通用智能体实现了可靠的自动形式化，其专业化来自“严谨性”含义驱动的工作流，而非特定任务训练。论文还展示了该系统生成的 Ramsey 理论最新突破的端到端 Lean 形式化证明。

论文自动形式化 Lean LLM智能体定理证明工作流

推荐理由：Trellis 解决了自动形式化中可靠性与成本之间的平衡问题，做定理证明或形式化验证的开发者可以直接用这个工作流来生成 Lean 证明，值得关注其开源实现。