11:37arXiv cs.AI@Fabiana Fournier, Lior Limonad论文提出进程架机制,在不替换底层工作流引擎的前提下,用策略治理的智能体层包裹确定性工作流。作者开发了任务-决策-流(TDF)模型,定义数据模式和执行语义,将LLM推理分解为三类策略治理的智能体:TaskAgent(知识密集型任务)、DecisionAgent(逐案例网关路由)和FlowAgent(运行时流适应)。在CUGA FLO中实现该设计,并通过贷款审批工作流演示三种智能体类型及挂钩驱动的监管覆盖。进程架通过确定性工作流执行强制结构合规,同时通过策略框架的智能体自主性满足规范需求。论文CUGA FLOTDFAgentic BPM工作流论文推荐理由:这篇论文提出了一个很实用的思路:在现有工作流引擎上加一个智能体层,不用重写系统就能让工作流更灵活。用贷款审批的例子讲清楚了三种智能体怎么协作,技术方案具体可落地。原文
09:31arXiv: OpenAI@Drew Johnston, David Holtz, Alex Martin Richmond, Christopher Ong, Prasanna Tambe, Aaron Chatterji76°OpenAI发布基于Codex使用数据的分析,展示Agentic AI技术如何改变工作方式。2026年上半年,Codex活跃用户数增长超过五倍,其中非软件开发者的增长最快。OpenAI内部Codex几乎完全替代了ChatGPT用于业务工作。超过10%的用户每周管理三个以上并发Codex代理,26.6%使用技能共享复杂工作流。请求复杂度上升:估算需要资深人类8小时以上的任务请求比例增长近十倍。2026年6月,OpenAI法律岗位员工通过Codex和ChatGPT的月输出Token中位数是2025年11月的13倍,研究人员则超过50倍。论文CodexOpenAIAgentic AI智能体工作流10 个信源在谈推荐理由:OpenAI内部数据揭示Agentic AI如何改变工作方式:Codex活跃用户半年增5倍,研究人员月产出增50倍。看真实采用率与工作流变化。原文
12:55arXiv cs.AI@Sara Fish该研究以EC 2025论文中一个关于公共物品稳定菜单的开放问题为测试平台,评估不同AI研究工作流的效果。实验发现:(1)在提示中加入人类直觉能提升LLM的“品味”;(2)多轮交互工作流在鼓励“大胆步骤”时更有效。与一名一年级博士生比较,LLM在解决该问题上的效果略逊一筹。研究尚未公开博士生参与前的原始手稿对比细节。论文EconCSLLM公共物品工作流AI研究推荐理由:这篇论文告诉你,用AI做经济学研究时,喂它人类直觉比纯指令好使,但别指望它比刚入行的博士生强多少。原文
11:52arXiv cs.AI@Wesley Pegden精选Trellis 是一个自动形式化系统,利用 LLM 智能体在确定性约束的工作流中,通过迭代优化自然语言证明,逐步推进 Lean 自动形式化任务。该系统受数学家对“严谨证明”的直觉启发——即证明的任何部分都可以被进一步详细阐述。Trellis 在有限预算下使用通用智能体实现了可靠的自动形式化,其专业化来自“严谨性”含义驱动的工作流,而非特定任务训练。论文还展示了该系统生成的 Ramsey 理论最新突破的端到端 Lean 形式化证明。论文自动形式化LeanLLM智能体定理证明工作流推荐理由:Trellis 解决了自动形式化中可靠性与成本之间的平衡问题,做定理证明或形式化验证的开发者可以直接用这个工作流来生成 Lean 证明,值得关注其开源实现。原文