全部 AI 动态 · AI 热点

6月24日

06:54

06:54

Aadit Sheth@aaditsh

Zeb Evans分享其公司在1000人团队中部署5000个智能体，人工与智能体比例达1:5，通过压缩上下文节省token。他强调AI能真正了解你的工作比更聪明的模型更有效，大多数公司用相同工具却因上下文量不同结果天差地别。团队通过Process Miner代理处理每天约10万条公司活动事件，从预处理、摘要和组织的上下文开始工作，而非每次从头搜索。

技巧智能体上下文 Agent token节省流程优化

推荐理由：Zeb Evans用5000个agent给1000人干活，重点不是模型多强而是上下文给够。他们自己公司内部就是这么干的，效率飞升。

6月18日

17:40

17:40

Geek@geekbb

Pi coding agent 发布了一个名为 pi-vcc 的会话压缩工具，完全基于纯算法实现，无需调用任何 LLM。该工具可压缩编码会话上下文，从而减少 token 消耗。项目源代码托管在 github.com/sting8k/pi-vcc，目前获得 2 次点赞和 193 次查看。

AI产品 Pi coding agent pi-vcc 会话压缩 token节省

推荐理由：Pi coding agent 出了个纯算法压缩工具 pi-vcc，不用 LLM 就能压缩会话，省 token 神器。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

10:27

10:27

arXiv cs.AI@Yu Xia, Zhouhang Xie, Xin Xu, Byungkyu Kang, Prarit Lamba, Xiang Gao, Julian McAuley

精选72°

ACTS提出了一种新方法，通过智能体控制器自适应地引导冻结的推理模型，在推理过程中动态调整思考策略和预算，从而在保持生成连续性的同时大幅节省token。该方法将推理引导建模为马尔可夫决策过程，控制器根据推理轨迹和剩余预算发出策略动作。实验表明，ACTS在全思考性能下实现了显著的token节省，并支持不同推理器和任务间的可控精度-效率权衡。代码已开源。

论文推理模型 token节省智能体可控推理开源/仓库

推荐理由：ACTS解决了LLM推理中token浪费和缺乏控制的问题，做推理优化或部署大模型的开发者可以直接用开源代码尝试，实现更经济的推理。

5月29日

08:36

08:36

berryxia@berryxia

精选

Firecrawl 新推出 /monitor 功能，允许用户用自然语言描述监控目标（如“当有 ADHD 最新论文时提醒”），自动检测网页实质变化并通过 webhook 推送。相比传统全量抓取，它只摄取变动部分，最多节省 90% 的 LLM token。支持 API、CLI、MCP 或 dashboard 初始化，调度频率从 5 分钟到自定义。该功能解决了 AI agent 在监控任务中 token 浪费和噪声干扰的痛点，让 agent 专注于决策和执行。

AI产品 AI agent 网页监控 Firecrawl token节省 webhook

推荐理由：做生物或科研监控的 AI agent 开发者终于不用再为全量抓取烧 token 了——Firecrawl 的 /monitor 用自然语言定义目标，只抓变化部分，省 90% 成本，建议做信息聚合的团队直接集成。