10:43arXiv cs.AI@Depen Morwani, Alexandru Meterez, Pranav Nair, Sham Kakade精选该论文研究了随机重球法(HB)和加速SGD(ASGD)在一致线性回归中的计算效率与串行运行时间权衡。结果表明HB在任意谱下无法超越SGD的计算效率前沿,但允许在比SGD临界批量大sqrtκ倍的窗口内减少串行运行时间。ASGD在快速衰减幂律谱下可提升小批量计算效率,但随着批量增大,牺牲效率换取更优串行时间。合成线性回归实验验证了这些定性规律。论文HBASGDSGD随机动量方法计算效率推荐理由:这篇论文把HB和ASGD在批量大小上的效率权衡讲清楚了,特别是那个sqrtκ倍的窗口,对想用动量方法加速训练的人很有参考价值。原文
09:44arXiv: DeepSeek@Joshua Ong Jun Leang, Zheng Zhao, Mihaela Cătălina Stoian, Qiyuan Xu, Haonan Li, Wenda Li, Shay B. Cohen, Eleonora Giunchiglia精选73°Pythagoras-Prover 是一个计算高效的 Lean 定理证明器系列,包含 4B 和 32B 参数的自回归模型,以及首个基于扩散的证明器(4B)。通过课程式监督微调和动态证明过滤,训练效率大幅提升。其 4B 模型在 MiniF2F-Test 上以 86.1% 的 pass@32 超越 DeepSeek-Prover-V2-671B(82.4%),参数减少约 167 倍;32B 模型达到 93.0%,创下开源新纪录。团队还提出了增强型 Lean 形式化方法(ALF),通过扰动已知问题生成变体,减少对表面形式的依赖,并发布了 MiniF2F-ALF 基准。论文定理证明器LeanPythagoras-Prover形式化验证计算效率推荐理由:形式化证明领域终于有了计算高效的实用方案——4B 模型就能超越 671B 巨无霸,做定理证明或形式化验证的团队可以直接用,省下大量算力成本。原文
11:05arXiv cs.AI@Lukas Aichberger, Sepp Hochreiter精选论文提出 Reasoning in Memory (RiM) 方法,用固定内存块替代自回归生成推理步骤,让大模型在单次前向传播中完成潜在推理。该方法受人类工作记忆启发,通过两阶段课程训练:先预测显式推理步骤来锚定内存块,再丢弃步骤级监督直接优化最终答案。实验表明,RiM 在多个推理基准上匹配或超越现有潜在推理方法,且计算效率更高。这为提升大模型推理能力提供了新思路,尤其适合需要高效推理的场景。论文推理模型潜在推理工作记忆计算效率RiM推荐理由:RiM 解决了自回归推理计算效率低的问题,做模型推理优化的研究者可以直接参考其两阶段训练方法。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……
09:46arXiv cs.AI@Yan Xia, Zhuangzhuang Pan, Amirrudin Kamsin, Chee Seng Chan精选多方面情感分析(ATSA)中,现有模型要么为每个方面重新编码句子,要么静态使用深层表示,导致计算冗余和适应性不足。DABS 提出单次推理框架,仅对句子编码一次,构建可复用的深度排序基板,每个方面通过查询该基板选择性读取相关 token 和抽象层级,无需重新编码。在四个基准测试中,DABS 在保持竞争性能的同时,将端到端计算量减少高达 60%,尤其在否定和对比等复杂语言场景中优势明显。代码已开源。论文情感分析单次推理深度选择性读取计算效率开源/仓库推荐理由:做情感分析或文本分类的团队,DABS 用单次编码解决了多方面的计算冗余问题,直接复用编码结果能省 60% 算力,建议试试这个轻量方案。原文