全部 AI 动态 · AI 热点

AITOP

6月28日

04:31

Harrison Chase@hwchase17

社区成员推出3小时深度课程，系统讲解Deep Agents构建。课程覆盖任务规划模块、文件系统用于上下文管理、子代理生成机制以及长期记忆实现。适合想深入掌握Agent开发流程的学习者。

技巧 Deep Agents 智能体任务规划上下文管理子代理

推荐理由：想学Deep Agents实战吗？3小时从任务规划讲到长期记忆，社区大神亲自带，比硬啃文档快多了。

原文

6月25日

07:27

Weaviate@weaviate_io

精选

Engram 是 Weaviate 的记忆系统，能主动协调冲突信息。当用户从机器学习工程师晋升为 CEO，Engram 不会简单叠加两条记忆，而是先用 LLM 工具调用判断行动：重写旧记忆为“用户曾是工程师，现升为 CEO”，并删除新重复记忆。这样避免了记忆冗余，保持历史连贯，防止智能体上下文被矛盾事实污染。

AI产品 Engram Weaviate 记忆协调智能体上下文管理

推荐理由：Weaviate 的 Engram 解决了 AI 记忆的一大致命伤——信息冲突。不是简单存两笔，而是主动合成新版本，对做多角色 Agent 的朋友很实用。

原文

6月23日

12:04

arXiv: DeepSeek@Aman Mehta, Anupam Datta

该论文提出replay pairing诊断方法，测量LLM代理中计划信号随上下文步数的衰减。在Llama-3.1-70B上，计划信号在计划后一步骤达到0.453，随后单步动作-观察步骤下降4.1倍。推理模型如DeepSeek-R1-Distill-Llama-70B存在推理痕迹混淆，严格剥离后恢复+153%信号。计划驱逐导致ALFWorld成功率下降34.7个百分点。研究显示代理关键信息依赖上下文存在而非持久化。

论文 Llama-3.1-70B DeepSeek-R1-Distill-Llama-70B ALFWorld 上下文管理推理模型

推荐理由：这篇论文用实验证明LLM代理离了上下文里的计划就抓瞎，不是脑子记住了。对做多步任务代理的人很有启发。

原文

02:28

02:28OpenAI Blog（博客/媒体）

Jason Liu分享了如何利用Codex的上下文机制管理长期运行的工作。他将任务分解为多个互相关联的子任务，让Codex保持对项目整体的理解。这种方法使得工作能在单个提示之外持续进行，有效提升复杂项目效率。

技巧 Codex OpenAI 提示词工程上下文管理工作流

推荐理由：想用Codex做复杂项目？看看Jason Liu的实操技巧，手把手教你保持上下文、拆分任务，让AI帮你干大活。

原文

6月17日

00:58

LangChain@LangChainAI

LangChain 发布 Deep Agents 深度解析第二部分，讲解上下文管理关键能力。Sydney Runkle 在不到2分钟视频中演示如何控制 Agent 长期记忆与状态。该方法可让 Deep Agents 在连续多轮对话中保持一致性，避免遗忘。

技巧 LangChain Deep Agents 智能体上下文管理提示词工程

推荐理由：如果你在用 LangChain 做智能体，这个2分钟视频教你怎么管理上下文，让 Agent 不跑偏。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

10:31

宝玉@dotey

Claude Design 现在支持 CLAUDE.md 文件，用户可以通过左侧聊天窗口初始化该文件。CLAUDE.md 用于存放需要反复叮嘱的指令或上下文，类似于 Claude Code 中的用法。这一功能让用户能更高效地管理对话中的固定要求，减少重复输入。对于频繁使用 Claude Design 的开发者或团队，这能显著提升工作流的一致性和效率。

AI产品 Claude Design CLAUDE.md 效率工具工作流上下文管理

推荐理由：用 Claude Design 做重复性任务的开发者，可以靠 CLAUDE.md 省去每次手动叮嘱的麻烦，建议直接初始化试试。

原文

6月9日

04:53

rohanpaul_ai@rohanpaul_ai

精选

一篇新论文提出 AdaCoM，通过一个独立的小模型来清理和组织 Agent 的上下文，从而提升其在长任务中的表现，无需重新训练 Agent 本身。AdaCoM 在 Agent 每一步行动前，对任务历史进行重写、合并、剪枝或保留，然后让原始 Agent 基于清理后的上下文行动。与简单摘要不同，AdaCoM 能学习不同 Agent 需要何种上下文——强 Agent 可保留更多原始历史，弱 Agent 则需要更简洁的笔记。在网页搜索和深度研究任务上，AdaCoM 将平均搜索性能提升了 39%。

论文 AdaCoM 上下文管理长任务 Agent 性能提升

推荐理由：做长任务 Agent 开发的团队终于有了一个不碰模型权重就能提升性能的方案——AdaCoM 用一个小模型当上下文管家，实测搜索任务提升 39%，值得在项目里试试。

原文

6月5日

02:08

LangChain@LangChainAI

LangChain 发布了一篇由 Sydney Runkle 撰写的指南，强调智能体的性能高度依赖于所提供上下文的准确性和时机。文章详细介绍了如何为特定用例构建定制化的“框架”（harness），以确保模型在正确的时间获得正确的上下文。该指南旨在帮助开发者优化智能体的表现，避免因上下文不足或错误导致的失败。对于正在构建或改进 AI 智能体的团队来说，这是一份实用的技术参考。

AI产品智能体上下文管理 LangChain 框架构建开发者指南

推荐理由：智能体开发者常因上下文问题导致效果不佳，这篇指南直接给出了构建定制化框架的方法论，做智能体应用的团队值得收藏实践。

原文

6月3日

16:04

Ate-a-Pi@svpino

精选

开发者 Santiago 分享了一个 Claude Code 的使用技巧：当上下文利用率超过 60% 时，模型性能会下降，且自动压缩可能丢失重要信息。他建议通过 /statusline 命令实时监控上下文百分比，并在超过阈值时手动运行 /compact 命令，附带提示词指定保留内容（如项目描述和变更指令）。这样能更精准地控制上下文压缩，避免关键信息丢失。

技巧 Claude Code 上下文管理压缩技巧效率提升编程助手

推荐理由：Claude Code 重度用户经常遇到上下文溢出导致模型变笨的问题，这个 60% 规则和手动压缩技巧能帮你精准控制保留内容，避免自动压缩丢失关键信息，建议试试。

原文

6月2日

10:32

AI Will@FinanceYF5

本周7篇顶级论文集中攻克AI Agent的三大核心问题：prompt设计依赖猜测、推理成本高昂、上下文无限膨胀。每篇论文都提供了可落地的工程启示，旨在降低AI Agent的部署和运行成本。这些研究有望推动AI Agent从实验走向实际应用，尤其对开发者和研究者具有重要参考价值。

论文 AI Agent 论文周报 prompt优化推理成本上下文管理

推荐理由：做AI Agent开发的团队终于有了解决prompt猜测和推理烧钱的工程方案，7篇论文直击痛点，值得逐篇拆解。

原文

09:55

LangChain@LangChainAI

精选

LangChain 发布了 Managed Deep Agents，该工具保留了开发者熟悉的项目结构（AGENTS.md、skills/、subagents/ 和 tools.json），同时引入了 Context Hub 功能。Context Hub 为智能体提供了一个托管环境，使其能够在不同会话间保留和更新上下文，从而让智能体的定义随时间演进。这解决了智能体长期运行中上下文丢失的问题，提升了开发效率和智能体的连续性。

AI产品 LangChain 智能体上下文管理开源/仓库开发工具

推荐理由：LangChain 的 Managed Deep Agents 解决了智能体跨会话上下文丢失的痛点，做多轮对话或长期任务编排的开发者可以直接用上，保持项目结构不变，上手成本低。

原文

6月1日

01:56

elvis@omarsar0

精选

这篇论文提出了一种部署感知的上下文策略选择方法，将检索、压缩和全上下文等策略统一建模为成本-性能优化问题。通过引入对数效用函数和复用参数 N，揭示了不同策略在不同部署条件下的最优切换点。在 5000 个 HotpotQA 实例上，该方法在相同性能下减少了约 25% 的有效 Token 使用，高性能场景下压缩策略比全上下文便宜 50% 以上。这项工作为 AI 代理的上下文管理提供了理论指导，避免了孤立基准测试的误导。

论文上下文管理效率前沿检索/压缩 AI代理成本优化

推荐理由：做 AI 代理和长上下文应用的团队终于有了选策略的理论依据——不用再盲从基准测试结果，直接按自己的复用频率和成本预算选最优方案，建议点开看看怎么算你的 N 值。

原文

5月29日

18:55

rohanpaul_ai@rohanpaul_ai

一篇新论文提出“效率前沿”框架，系统比较 LLM 在不同部署场景下的上下文策略。研究发现，在保持答案质量的前提下，选择合适的方法可将 token 消耗降低约 25%，在重复使用记忆的场景下甚至可节省超过 50%。该框架将答案质量与 token 成本联合优化，而非分开评估。实验基于 5000 个 HotpotQA 问题，结果表明：低复用场景轻量检索最优，高复用场景记忆压缩更佳，而全上下文提示仍是追求最高准确率的必要手段。

论文 LLM 上下文管理效率优化 token成本检索增强

推荐理由：做 LLM 部署优化的团队终于有了量化工具——这篇论文告诉你何时该用检索、何时该用记忆压缩，直接帮你省 token 成本，建议做推理优化的工程师点开看具体方法。

原文

08:11

LangChain@LangChainAI

精选

LangChain 发布了 Deep Agents v0.6，新增 ContextHubBackend 功能。该功能为驱动智能体行为的文件提供了一个版本化的存储空间，基于 LangSmith Context Hub 实现。它允许开发者从一次运行到下一次运行持续改进上下文，提升智能体的一致性和表现。这对于需要精细控制智能体行为的团队来说是一个实用更新。

AI产品智能体 LangChain LangSmith 版本控制上下文管理

推荐理由：做智能体开发的团队终于有了版本化的上下文管理工具，能避免每次调试都从头开始，建议用 LangChain 的开发者直接升级试试。

原文

5月28日

09:49

LangChain@LangChainAI

精选

LangChain 发布了 LangSmith Context Hub，为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。

AI产品 LangSmith Context Hub Agent 上下文管理开源/仓库

推荐理由：做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题，建议做 AI 应用架构的开发者点开视频看看。

原文

03:03

Harrison Chase@hwchase17

LangChain 发布了 Context Hub，一个用于管理智能体所需上下文文件（如 skills、AGENTS.md 等）的集中式平台。它支持存储、编辑、版本控制和检索 markdown 文件，并能作为虚拟文件系统在 deepagents 中使用。该工具旨在解决智能体上下文管理混乱的问题，提升团队协作效率。官方已发布视频教程和 GitHub 示例，方便开发者快速上手。

AI产品智能体上下文管理 LangChain 开源/仓库开发工具

推荐理由：做智能体开发的团队终于有了正经的上下文管理方案——Context Hub 解决了 skills 和 AGENTS.md 文件散落难维护的痛点，用 LangChain 的开发者可以直接集成试试。

原文

5月26日

00:47

Ate-a-Pi@svpino

精选

开发者 svpino 分享了一个 Claude Code 中被低估的技巧：“Summarize from here”，用于处理不断增长的上下文。传统方法使用 /compact 会压缩整个会话，但该技巧允许用户通过 Esc+Esc 或 /rewind 打开检查点菜单，选择一个关键检查点后，保留该点之前的重要上下文（如规格、决策、约束），而将之后的内容压缩为简洁摘要。这有效去除了噪音，保留了有价值信息，特别适合长会话场景。

技巧 Claude Code 上下文管理技巧开发效率 AI编程助手

推荐理由：Claude Code 重度用户终于有了优雅的上下文管理方案——保留早期关键决策，压缩后期冗余对话，做复杂项目的开发者建议立刻试试。

原文

5月24日

11:13

@zarazhangrui@zarazhangrui

这是一条面向在上下文管理技术方面有成功经验的开发者或研究者的活动邀请。活动将在湾区举行，由 NotionHQ、radicalvcfund 等联合主办，旨在展示 Gbrain、LLM Wiki 等智能体上下文管理技术的实际应用。参与者有机会进行现场演示，分享经验。该活动对于关注智能体上下文管理、提升 AI 系统效率的从业者具有重要价值。

行业智能体上下文管理 Gbrain LLM Wiki 活动

推荐理由：如果你在智能体上下文管理上有实战经验，这是展示成果、与同行交流的绝佳机会，建议在湾区的开发者点开 RSVP 链接报名。

原文

5月15日

00:57

berryxia@berryxia

腾讯AI团队经过6个月研发，开源了一套Agent记忆系统，针对长会话中上下文丢失问题提出三招解决方案：实时压缩过期上下文（token消耗降低61%）、用Mermaid语法生成结构化任务地图（减少30多步复杂流程中的丢轨概率）、建立Persona记忆（人格一致性从48%提升至76%）。这套系统已在GitHub开源，旨在解决Agent记忆的核心难题——让模型在正确时间用正确方式想起正确信息。

AI产品智能体记忆系统开源/仓库腾讯AI 上下文管理

推荐理由：做Agent开发的团队终于有了开箱即用的记忆方案，不用再靠堆token硬扛长上下文——腾讯这套系统直接开源，建议立刻去试。

原文

5月13日

00:33

00:33Google Developers Blog（博客/媒体）

70°

Google 在 Gemini CLI 中引入了子代理(Subagents)功能，这是一种专门化的专家代理，可在隔离的上下文窗口中处理复杂或高容量任务，从而保持主会话快速且专注。用户可通过 Markdown 文件自定义子代理，并支持并行运行以提升生产力，调用时使用 @agent 语法进行定向委托。这种架构通过将复杂的多步骤执行简化为主协调器的摘要，防止了“上下文腐烂”问题。这是 AI 辅助编程工具在任务分解和上下文管理方面的重要进展。

AI产品编程助手子代理/多代理 Gemini CLI 上下文管理 Google

推荐理由：对于开发者而言，子代理功能提供了一种模块化、可扩展的方式来管理复杂任务，减少主会话的上下文负担，有望提升 AI 编码助手的实用性和效率。

原文