06:54Aadit Sheth@aaditshZeb Evans分享其公司在1000人团队中部署5000个智能体,人工与智能体比例达1:5,通过压缩上下文节省token。他强调AI能真正了解你的工作比更聪明的模型更有效,大多数公司用相同工具却因上下文量不同结果天差地别。团队通过Process Miner代理处理每天约10万条公司活动事件,从预处理、摘要和组织的上下文开始工作,而非每次从头搜索。技巧智能体上下文Agenttoken节省流程优化推荐理由:Zeb Evans用5000个agent给1000人干活,重点不是模型多强而是上下文给够。他们自己公司内部就是这么干的,效率飞升。原文
17:40Geek@geekbbPi coding agent 发布了一个名为 pi-vcc 的会话压缩工具,完全基于纯算法实现,无需调用任何 LLM。该工具可压缩编码会话上下文,从而减少 token 消耗。项目源代码托管在 github.com/sting8k/pi-vcc,目前获得 2 次点赞和 193 次查看。AI产品Pi coding agentpi-vcc会话压缩token节省推荐理由:Pi coding agent 出了个纯算法压缩工具 pi-vcc,不用 LLM 就能压缩会话,省 token 神器。原文
10:27arXiv cs.AI@Yu Xia, Zhouhang Xie, Xin Xu, Byungkyu Kang, Prarit Lamba, Xiang Gao, Julian McAuley精选72°ACTS提出了一种新方法,通过智能体控制器自适应地引导冻结的推理模型,在推理过程中动态调整思考策略和预算,从而在保持生成连续性的同时大幅节省token。该方法将推理引导建模为马尔可夫决策过程,控制器根据推理轨迹和剩余预算发出策略动作。实验表明,ACTS在全思考性能下实现了显著的token节省,并支持不同推理器和任务间的可控精度-效率权衡。代码已开源。论文推理模型token节省智能体可控推理开源/仓库推荐理由:ACTS解决了LLM推理中token浪费和缺乏控制的问题,做推理优化或部署大模型的开发者可以直接用开源代码尝试,实现更经济的推理。原文
08:36berryxia@berryxia精选Firecrawl 新推出 /monitor 功能,允许用户用自然语言描述监控目标(如“当有 ADHD 最新论文时提醒”),自动检测网页实质变化并通过 webhook 推送。相比传统全量抓取,它只摄取变动部分,最多节省 90% 的 LLM token。支持 API、CLI、MCP 或 dashboard 初始化,调度频率从 5 分钟到自定义。该功能解决了 AI agent 在监控任务中 token 浪费和噪声干扰的痛点,让 agent 专注于决策和执行。AI产品AI agent网页监控Firecrawltoken节省webhook推荐理由:做生物或科研监控的 AI agent 开发者终于不用再为全量抓取烧 token 了——Firecrawl 的 /monitor 用自然语言定义目标,只抓变化部分,省 90% 成本,建议做信息聚合的团队直接集成。原文