AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:检索增强×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月5日
02:49
02:49a16z@a16z
Exa CEO Will Bryk 在 a16z 的访谈中提出,不应为所有任务使用巨型模型,而应通过检索增强让小模型表现如大模型。他称,大模型负责决策,向小模型分配任务,小模型借助检索可更准确可靠。Exa 通过高效筛选网络信息,能为客户节省高达 20 倍的成本。Andrej Karpathy 也评论认为,模型大小竞争正逆向发展,未来会出现极小的、能“思考”的模型,但前提是先用大模型帮助生成理想训练数据。
行业检索增强小模型成本优化Exa智能体

推荐理由:做 AI 应用或代理的团队,如果被 token 成本压得喘不过气,这个思路值得一试——用检索让小模型干大模型的活,省 20 倍成本不是梦。
原文
5月29日
18:55
18:55rohanpaul_ai@rohanpaul_ai
一篇新论文提出“效率前沿”框架,系统比较 LLM 在不同部署场景下的上下文策略。研究发现,在保持答案质量的前提下,选择合适的方法可将 token 消耗降低约 25%,在重复使用记忆的场景下甚至可节省超过 50%。该框架将答案质量与 token 成本联合优化,而非分开评估。实验基于 5000 个 HotpotQA 问题,结果表明:低复用场景轻量检索最优,高复用场景记忆压缩更佳,而全上下文提示仍是追求最高准确率的必要手段。
论文LLM上下文管理效率优化token成本检索增强

推荐理由:做 LLM 部署优化的团队终于有了量化工具——这篇论文告诉你何时该用检索、何时该用记忆压缩,直接帮你省 token 成本,建议做推理优化的工程师点开看具体方法。
原文
5月26日
01:10
01:10Jerry Liu@jerryjliu0
精选
LlamaIndex创始人Jerry Liu分享了@hexapode在新加坡AI工程师大会上的90分钟工作坊内容,包含116页幻灯片,系统梳理了RAG、检索、智能体循环、文档理解等AI模式在过去3年的演变。内容涵盖朴素RAG的12个痛点、重排序与查询重写的重要性、智能体循环如何简化检索层、文档解析的持续挑战,以及现代智能体形态如工作流和深度研究。对于关注AI技术演进的开发者,这是一份宝贵的历史脉络和实战经验总结。
AI产品RAG智能体文档解析检索增强LlamaIndex

推荐理由:想理解RAG和AI智能体从2023到2026的完整进化路径?这份116页幻灯片是绝佳教材,做检索增强生成或智能体开发的团队值得收藏。
原文
5月16日
22:51
22:51elvis@omarsar0
73°
一项研究发现,在编码智能体任务中,将 grep 风格的文本搜索嵌入合适的智能体框架,其效果可与基于嵌入的检索相媲美甚至更优。这提示我们,编码智能体真正需要的可能不是更好的嵌入,而是围绕原始工具设计更优的框架。如果你依赖向量数据库构建编码智能体,现在或许是重新评估的时候。论文指出,在规模场景下向量数据库仍有优势,但混合方法尚未成熟。
论文智能体检索增强编码助手向量数据库grep

推荐理由:做编码智能体的开发者值得关注——grep 式搜索+好框架可能省掉向量数据库的复杂度和成本,建议点开论文看看实验细节。
原文
精选全部日报登录