09:21arXiv cs.LG@Gal Bloch, Ariel Gera, Matan Orbach, Ohad Eytan, Assaf Toledo精选Flash-GMM 是一个融合的 Triton 内核,用于在单次 GPU 传递中高效计算高斯混合模型(GMM)。它通过避免在 GPU 内存中实例化完整的责任矩阵,实现了比现有实现快 20 倍的加速,并支持在单个设备上训练比以往大 100 倍以上的数据集。该内核被集成到 IVF 粗量化器中用于近似最近邻搜索,表明软 GMM 聚类可以替代 k-means,并利用 GMM 责任将边界向量分配到多个簇。在达到固定召回率目标时,Flash-GMM 减少了最多 1.7 倍的距离计算,或在相同计算成本下召回率提升 2-12 个点。该项目已开源。论文GMMGPU加速聚类近似最近邻搜索开源推荐理由:做大规模聚类或近似最近邻搜索的团队,Flash-GMM 让你在单卡上处理百倍数据量,速度还快 20 倍,直接替换 k-means 就能提升召回率,值得一试。原文
11:00arXiv cs.LG@Mohammadreza Sadeghi, Sareh Soleimani, Zihan Wang, Narges Armanfard本文提出无监督持续聚类(UCC)问题,并引入前向-后向知识蒸馏持续聚类方法(FBCC)。该方法通过持续教师网络和轻量级任务特定学生,在无标签且不存储旧数据的情况下,学习新聚类同时保留已有聚类结构。实验表明,FBCC在四个基准数据集上持续优于现有持续学习方法,显著减少灾难性遗忘。这是首个专门针对无监督持续聚类的研究,解决了该领域缺乏聚类特定目标的问题。论文无监督学习持续学习知识蒸馏聚类灾难性遗忘推荐理由:做无监督学习和持续学习的团队终于有了聚类场景的专用方案——FBCC 不依赖标签和旧数据就能保持聚类结构,做数据流聚类或隐私敏感场景的开发者可以直接参考实验设置。原文
13:02arXiv: DeepSeek@Haochen Yang, Ke Zhao, Mengyuan Ma, Xingyu Lu, Xiangfeng Wang, Hong Qian精选OptSkills 是一种面向优化建模与求解的智能体系统,通过聚类问题原型而非表面叙事来提升泛化能力。它利用大语言模型自动从自然语言中提取优化问题,并在聚类内探索多样建模与求解配置,将成功轨迹蒸馏为可复用的工作流技能。在多个数据集上达到 68.27% 的微平均准确率,在 MIPLIB-NL 基准上以 26.91% 超越 DeepSeek-V3.2-Thinking 4.53%。该系统还支持在分布外场景下通过新轨迹扩展技能库,代码和技能已开源。论文大语言模型优化建模技能蒸馏聚类泛化学习推荐理由:做运筹优化或自动化建模的团队终于有了能应对问题类型变化的通用方案——OptSkills 通过原型聚类和技能蒸馏解决了传统方法对叙事变体敏感的问题,值得在复杂优化任务中试试。原文