AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 1009 条中筛出 58 条
全部模型产品行业论文技巧
标签:计算效率×
6月18日
10:43
10:43arXiv cs.AI@Depen Morwani, Alexandru Meterez, Pranav Nair, Sham Kakade
精选
该论文研究了随机重球法(HB)和加速SGD(ASGD)在一致线性回归中的计算效率与串行运行时间权衡。结果表明HB在任意谱下无法超越SGD的计算效率前沿,但允许在比SGD临界批量大sqrtκ倍的窗口内减少串行运行时间。ASGD在快速衰减幂律谱下可提升小批量计算效率,但随着批量增大,牺牲效率换取更优串行时间。合成线性回归实验验证了这些定性规律。
论文HBASGDSGD随机动量方法计算效率

推荐理由:这篇论文把HB和ASGD在批量大小上的效率权衡讲清楚了,特别是那个sqrtκ倍的窗口,对想用动量方法加速训练的人很有参考价值。
原文
6月12日
09:44
09:44arXiv: DeepSeek@Joshua Ong Jun Leang, Zheng Zhao, Mihaela Cătălina Stoian, Qiyuan Xu, Haonan Li, Wenda Li, Shay B. Cohen, Eleonora Giunchiglia
精选73°
Pythagoras-Prover 是一个计算高效的 Lean 定理证明器系列,包含 4B 和 32B 参数的自回归模型,以及首个基于扩散的证明器(4B)。通过课程式监督微调和动态证明过滤,训练效率大幅提升。其 4B 模型在 MiniF2F-Test 上以 86.1% 的 pass@32 超越 DeepSeek-Prover-V2-671B(82.4%),参数减少约 167 倍;32B 模型达到 93.0%,创下开源新纪录。团队还提出了增强型 Lean 形式化方法(ALF),通过扰动已知问题生成变体,减少对表面形式的依赖,并发布了 MiniF2F-ALF 基准。
论文定理证明器LeanPythagoras-Prover形式化验证计算效率

推荐理由:形式化证明领域终于有了计算高效的实用方案——4B 模型就能超越 671B 巨无霸,做定理证明或形式化验证的团队可以直接用,省下大量算力成本。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
11:05
11:05arXiv cs.AI@Lukas Aichberger, Sepp Hochreiter
精选
论文提出 Reasoning in Memory (RiM) 方法,用固定内存块替代自回归生成推理步骤,让大模型在单次前向传播中完成潜在推理。该方法受人类工作记忆启发,通过两阶段课程训练:先预测显式推理步骤来锚定内存块,再丢弃步骤级监督直接优化最终答案。实验表明,RiM 在多个推理基准上匹配或超越现有潜在推理方法,且计算效率更高。这为提升大模型推理能力提供了新思路,尤其适合需要高效推理的场景。
论文推理模型潜在推理工作记忆计算效率RiM

推荐理由:RiM 解决了自回归推理计算效率低的问题,做模型推理优化的研究者可以直接参考其两阶段训练方法。
原文
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
5月21日
09:46
09:46arXiv cs.AI@Yan Xia, Zhuangzhuang Pan, Amirrudin Kamsin, Chee Seng Chan
精选
多方面情感分析(ATSA)中,现有模型要么为每个方面重新编码句子,要么静态使用深层表示,导致计算冗余和适应性不足。DABS 提出单次推理框架,仅对句子编码一次,构建可复用的深度排序基板,每个方面通过查询该基板选择性读取相关 token 和抽象层级,无需重新编码。在四个基准测试中,DABS 在保持竞争性能的同时,将端到端计算量减少高达 60%,尤其在否定和对比等复杂语言场景中优势明显。代码已开源。
论文情感分析单次推理深度选择性读取计算效率开源/仓库

推荐理由:做情感分析或文本分类的团队,DABS 用单次编码解决了多方面的计算冗余问题,直接复用编码结果能省 60% 算力,建议试试这个轻量方案。
原文
精选全部日报登录