全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

23:52

23:52

LangChain@LangChainAI

LangChain 推出 LangSmith Engine，允许开发者审查 Agent 的追踪记录，从而发现提示词和代码中的 Bug 及改进点。Agent 能在运行间隔中回顾对话、从实际使用中学习，并自动更新 Context Hub 文件。这有助于提升 Agent 的可靠性和性能，减少人工调试工作量。

AI产品 LangSmith Engine Agent 追踪调试工具提示词优化 LangChain

推荐理由：做 Agent 开发的团队终于有了自动化的调试工具——LangSmith Engine 能直接从追踪中学习并优化提示词和代码，建议正在维护复杂 Agent 的开发者试试。

6月3日

01:16

01:16

Philipp Schmid@_philschmid

开发者Phil Schmid分享了一种使用GEPA自动优化任何CLI Agent提示词的方法。GEPA接受任何`(str) -> str`的可调用对象，兼容自定义CLI、本地模型或API Agent。只需将Agent封装在Python函数中，即可让其自我优化提示词。该方法可显著提升Agent的响应质量和效率，减少手动调优的工作量。

AI产品 GEPA 提示词优化 CLI Agent 自动化开源/仓库

推荐理由：做Agent开发的团队终于有了自动化提示词优化的工具——GEPA支持任何CLI Agent，封装成函数就能自优化，省去反复手动调参的麻烦，建议试试。

5月21日

08:01

08:01

LangChain@LangChainAI

LangChain 的 Palash Shah 分享了一种针对长时运行 AI Agent 的评估方法。核心思路是将复杂的评估任务拆解成更小、更易处理的子任务，这样不仅便于人类理解，也更容易让 LLM 自身进行评估。他举例说明，对于运行超过 30 分钟的 Agent，通过从追踪中提取推理过程，找出特定行为的根本原因，然后重建简化版的评估场景。这种方法可以快速测试提示词调整的效果，而无需每次都运行完整的长时间评估。

AI产品 LangChain AI Agent 评估方法提示词优化长时任务

推荐理由：做长时 AI Agent 评估的开发者终于有了实用技巧——拆解任务后评估效率大幅提升，建议直接参考这个流程优化你的评估策略。