12:46arXiv cs.AI@Kan Zhu, Mathew Jacob, Chenxi Ma, Yi Pan, Stephanie Wang, Arvind Krishnamurthy, Baris Kasikci华盛顿大学发布了TraceLab数据集,收录约4,300个编码Agent会话、350,000个LLM步骤和430,000次工具调用,数据来自日常使用的Claude Code和Codex。分析显示,工作负载具有长自主循环、长上下文短输出、多样且长尾的工具调用等特征,前缀缓存命中率虽高但存在不完美之处。基于这些发现,研究者提出了低开销工具调用、追加长度感知的预填充、语义感知工具延迟预测以及改进KV缓存管理四项优化方向。数据集和分析代码已开源在GitHub。论文TraceLabClaude CodeCodex编码Agent工作负载推荐理由:想看看编码Agent真实的调用模式?TraceLab用4300个会话告诉你Claude Code和Codex的工作负载细节,还指明了KV缓存优化的具体方向。原文
02:21rohanpaul_ai@rohanpaul_ai顶级AI实验室突然放弃视频模型和对话角色等边缘消费者功能,转而专注于编码Agent,以模仿Anthropic的成功。Salesforce CEO Marc Benioff指出,这些实验室现在只做编码Agent。这一趋势反映了AI行业从通用功能向专业化、高价值应用的转变,编码Agent被视为更可持续的商业方向。行业编码AgentAI实验室Anthropic行业趋势Salesforce6 个信源在谈推荐理由:AI行业正在从花哨功能转向务实应用,做AI产品决策的团队值得关注这一风向标,看看自己的路线图是否需要调整。原文