12:01arXiv cs.AI@Zhuoming Chen, Xinrui Zhong, Qilong Feng, Ranajoy Sadhukhan, Yang Zhou, Michael Qizhe Shieh, Zhihao Jia, Beidi Chen精选Vortex 是一个专为大规模语言模型(LLM)设计的稀疏注意力服务系统,解决了稀疏注意力算法在部署和评估中工程成本高的问题。它通过 Python 嵌入式前端语言和页面中心张量抽象,支持广泛稀疏注意力算法的快速原型设计、部署和评估。在 NVIDIA B200 GPU 上,Vortex 使 AI Agent 自动生成的算法吞吐量比全注意力提升高达 3.46 倍,并在 MLA 架构的 GLM-4.7-Flash 和 229B 参数的 MiniMax-M2.7 上分别实现 4.7 倍和 1.37 倍的吞吐量提升。该系统显著加速了稀疏注意力算法的迭代,尤其适用于长序列生成场景。论文稀疏注意力LLM服务AI Agent吞吐量优化Vortex8 个信源在谈推荐理由:稀疏注意力是长上下文 LLM 服务的关键瓶颈,Vortex 让 AI Agent 和研究者能快速实验新算法,做 LLM 推理优化的团队可以直接用它提升吞吐量,值得关注。原文
12:17LangChain@LangChainAI精选LangChain 的 Ankush Gola 分享了构建 SmithDB 背后的技术细节,核心依赖两个开源项目:Apache DataFusion 和 Vortex。DataFusion 是一个基于 Rust 的可扩展查询引擎,团队为其定制了执行计划以适配工作负载和存储后端。Vortex 则是一个可扩展文件格式,支持为不同列自定义布局、编码和分块策略。这两个项目对于关注现代数据系统的开发者来说值得深入研究。行业LangChainSmithDBDataFusionVortex开源/仓库1 个信源在谈推荐理由:做数据系统或 AI 基础设施的开发者,可以从 SmithDB 的架构思路中直接学到如何用 DataFusion 和 Vortex 搭建高性能查询引擎,值得点开看看具体实现。原文