AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:语义搜索×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
23:17
23:17Milvus@milvusio
精选
股票媒体平台123RF拥有2亿+视觉资产,从关键词搜索转向语义搜索。迁移至Zilliz Cloud后,成本降低50%,查询延迟从100ms降至30-50ms。Zilliz Cloud支持CLIP生成稠密向量、动态扩缩容、解耦数据写入与在线查询、自定义排序逻辑。该方案帮助平台在保证检索质量的同时控制运营成本。
技巧123RFZilliz Cloud语义搜索向量数据库成本优化

推荐理由:123RF用Zilliz Cloud省了一半成本
原文
5月30日
18:29
18:29Qdrant@qdrant_engine
大多数车载媒体系统仍依赖关键词搜索,但驾驶时用户更倾向于用情绪、氛围和意图来寻找音乐。Sarvesh Talele 基于 Qdrant Edge 构建了一个完全本地化的 AI 媒体发现系统,支持语音、文本和情绪查询。该系统利用 Whisper 进行本地语音转录,通过向量嵌入实现语义检索,并使用 Qdrant Edge 在设备端完成向量搜索,无需依赖云端。这一项目展示了向量搜索如何在保护隐私的前提下,为车载场景提供实时、个性化的体验。
AI产品语义搜索车载系统Qdrant EdgeWhisper本地AI

推荐理由:车载媒体搜索终于从关键词进化到语义理解,做车载系统或本地 AI 应用的开发者可以直接参考这个架构,体验隐私优先的实时搜索。
原文
5月28日
21:00
21:00LlamaIndex@llama_index
精选
文章指出grep词法搜索在小代码库或文档文件夹中足够,但在企业环境中面对数百万PDF、电子表格和扫描文档时无法读取、不扩展且忽略同义词。作者分析grep的优势和局限,解释为什么RAG和语义搜索在企业规模下是必要的。最后介绍如何分层结合词法搜索与语义搜索来获得最佳效果。
技巧grepRAG语义搜索检索增强生成

推荐理由:教你如何搭配grep和RAG做搜索
原文
5月24日
10:56
10:56Qdrant@qdrant_engine
Qdrant 宣布将在 MistralAI 举办的 AI NOW 巴黎峰会上发表演讲,主题为“使用 MistralAI OCR 和 Qdrant 对杂乱文档进行语义搜索”。演讲将探讨如何结合语义搜索与 OCR 技术,将噪声多、结构混乱的非结构化文档转化为可搜索、可用的知识。该演讲由 Qdrant 开发者倡导者 Chadha Sridi 主讲,旨在展示 MistralAI 与 Qdrant 的联合解决方案。峰会将于巴黎举行,Qdrant 期待与 AI 社区交流。
AI产品语义搜索OCRQdrantMistralAI非结构化文档

推荐理由:做文档搜索或知识管理的团队值得关注——MistralAI OCR + Qdrant 的组合能直接解决非结构化数据难检索的痛点,建议有类似需求的开发者点开了解具体方案。
原文
5月20日
20:05
20:05Qdrant@qdrant_engine
该项目利用 Qdrant Edge 构建代码库的语义记忆引擎,让开发者可以用自然语言而非精确关键词搜索代码。例如,直接问“重试逻辑在哪里实现?”即可瞬间检索到相关代码,无需手动翻文件夹、猜函数名或链式使用 grep。该方案完全本地运行,无云依赖和外部 API 调用,延迟低,适合大型代码库的语义搜索。
AI产品语义搜索代码库Qdrant Edge自然语言本地检索

推荐理由:告别 grep 和猜函数名,做代码维护或大型项目重构的开发者可以直接用自然语言搜索代码,效率提升明显,值得一试。
原文
5月18日
11:47
11:47Jerry Liu@jerryjliu0
精选
PwC发布论文《Is Grep All You Need?》,研究Agent搜索中不同检索工具的效果。他们让Agent同时使用向量搜索和grep,发现grep在准确率上普遍优于语义搜索。论文测试了多种Agent框架(包括Claude Code、Codex),但局限在于检索对象是对话记忆而非企业文档。作者认为Agent框架确实简化了检索问题,但仍有改进空间。
论文Agent搜索grep语义搜索RAGPwC

推荐理由:这篇论文挑战了“语义搜索是Agent标配”的直觉,做Agent检索或RAG的开发者值得一读,看完可能会重新审视你的检索策略。
原文
5月17日
23:39
23:39rohanpaul_ai@rohanpaul_ai
精选72°
一篇新论文发现,AI Agent 使用 grep、文件读取等基本终端工具直接搜索原始数据,在多个基准测试中表现远超传统检索系统。在 BrowseComp-Plus 上,将语义检索替换为终端搜索后,准确率从 69% 提升至 80%,同时降低了成本。论文指出,检索不仅是模型问题,更是接口问题——传统检索将语料库简化为一次查询、一个排名列表,而直接交互允许 Agent 搜索精确字符串、检查上下文、发现新实体并反复验证假设。提升主要来自从已找到的文档中提取更多可用证据,而非找到更多相关文档。该方法的局限是随着语料库增长,找到第一个有用锚点的成本会快速上升。
论文AI Agent检索系统grep语义搜索论文

推荐理由:这篇论文颠覆了「检索必须靠语义索引」的直觉,做 AI Agent 或搜索系统的开发者值得一读——它可能改变你对工具接口设计的思考方式。
原文
5月16日
18:06
18:06Milvus@milvusio
精选
在伦敦非结构化数据聚会上,Milvus 开发者关系负责人 Jiang Chen 分享了将原始对话日志转化为智能体长期记忆的方法。核心思路是让记忆以 Markdown 文件形式可读可编辑,再通过语义搜索和混合搜索让智能体根据含义检索上下文,即使不记得关键词也能找到。该工作流可通过开源项目 memsearch 实现,适合构建更智能的对话式 AI 应用。
AI产品智能体长期记忆语义搜索开源/仓库Milvus

推荐理由:做智能体开发的团队终于有了一个把对话记忆从黑盒变成可读可搜索的方案,建议试试 memsearch 开源项目。
原文
精选全部日报登录