19:03Qdrant@qdrant_engine精选Qdrant CTO Andrey Vasnetsov介绍了未来架构:存储和计算彻底分离,用户仅需查询本地设备上的索引片段,无需云端往返。Panel嘉宾来自cognee、Haystack_AI、llama_index、n8n_io,讨论了实际生产中Agent使用检索的问题——Agent有时不会主动调用检索,这比预期更严重。还指出若用同一模型生成评估数据集和作为评判者,相当于自己判自己作业。更多详情和完整录像在Qdrant YouTube频道。行业Qdrant向量数据库Agent检索LLM评估推荐理由:Qdrant CTO分享了未来架构怎么省掉云端来回;Panel聊了Agent不跑检索的坑,还有用同个模型判自己作业的槽点,做AI的都该看看。原文
01:44Firecrawl@firecrawl_dev精选Firecrawl 推出 Research Index,一个针对 AI/ML 研究代理的专用索引。该索引在 arXivQA 基准上实现最先进召回率,比次优提供商高出 18%,成本相近。目前正在为 YC 研究实验室 Aemon_ai 提供自动研发支持。该索引旨在提升研究代理的信息检索效率。AI产品FirecrawlResearch IndexarXivQAAI研究检索推荐理由:Firecrawl 搞了个研究专用索引,召回率比同行高 18%,还已经用在 YC 实验室 Aemon_ai 了,做研究检索的朋友可以看看。原文
08:28Qdrant@qdrant_engineVector Space Day在旧金山举办,汇聚了350多名工程师、研究员、创始人和AI从业者。活动议题涵盖检索、搜索、记忆、智能体和AI基础设施。主办方Qdrant引擎通过这场活动促进行业社区交流。行业QdrantVector Space Day旧金山智能体检索推荐理由:Qdrant组织了一场大聚会,350多人一起聊检索和智能体,看看现在这领域最热的话题。原文
03:15AlphaSignal@AlphaSignalAI精选传统Agent系统依赖检索获取信息,但LCLMs(Latent Compression Language Models)提出先压缩所有信息。该方法将数据全局压缩一次,再基于压缩进行全局推理,仅当需要时才局部扩展。这与检索式记忆的本质区别在于:压缩使模型能理解整体结构而非片段匹配。LCLMs在多个知识密集型任务中展现出更高效的记忆利用。论文LCLMs智能体Agent记忆压缩检索推荐理由:做Agent系统的话可以看看这个思路:不先检索,而是先全局压缩再按需展开,和传统做法完全不一样。原文
12:39arXiv cs.LG@Tengfei Zhang, Ziheng Zhao, Lisong Dai, Xiaoman Zhang, Pengcheng Qiu, Ya Zhang, Yanfeng Wang, Weidi Xie精选该研究提出了一个实体感知的跨图像比较推理框架 MedReCo,用于解决放射科实践中依赖前后对比和参考病例的诊断需求。研究构建了 MedReCo-DB 大规模数据集,包含来自 8 家机构、4 个国家、7 种影像模态的 69 万张图像,并将报告分解为解剖结构、异常发现和病理条件。基于此,开发了用于可控检索的 MedReCo 编码器和用于生成式比较解读的 MedReCo-VLM 视觉语言模型。在内部、外部和跨中心评估中,MedReCo 在 12 项内部检索设置中均取得最高 Recall@1,外部检索平均提升 6 个百分点;MedReCo-VLM 在比较生成评估中全面最优,纵向随访准确率提升 14.5-46.5 个百分点(胸片)和 13.0-27.9 个百分点(CT)。这表明实体感知的比较推理可从常规临床数据中大规模学习,为医学影像 AI 提供更贴近临床的范式。论文医学影像比较推理视觉语言模型检索放射科推荐理由:放射科医生和医学影像 AI 研究者终于有了一个能真正做前后对比和参考病例检索的框架——MedReCo 在 12 项检索任务中全胜,做临床 AI 落地的团队值得关注。原文