AITOP6月11日 15:28
精选
过去 24 小时,从 693 条中筛出 46 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月9日
12:12
12:12
arXiv cs.LG@Chenxiao Yang, Nathan Srebro, Zhiyuan Li
精选
推荐理由:理论研究者终于有了Transformer样本复杂度的紧界——VC维和思维链学习的下界都算清楚了,做深度学习理论的团队值得细读。
11:31
11:31
arXiv: DeepSeek@Zechen Sun, Yuyang Sun, Zecheng Tang, Juntao Li, Wenpeng Hu, Wenliang Chen, Zhunchen Luo, Guotong Geng, Min Zhang
精选
推荐理由:长文本生成是 LLM 的硬伤,IS-CoT 用动态规划循环解决了长度崩溃,做内容生成或写作助手的团队可以直接参考这个 8B 模型的训练方法。
6月5日
13:07
13:07
arXiv cs.LG@Guancheng Tu, Xiangjun Fu, Suhao Yu, Yao Tang, Haoqiang Kang, Lianhui Qin, Yizhe Zhang, Jiatao Gu
精选
推荐理由:NF-CoT解决了潜在推理中丢失CoT关键优势的痛点,做LLM推理优化和代码生成的开发者可以直接参考其方法,提升效率。
12:12
12:12
arXiv cs.AI@Mykyta Ielanskyi, Kajetan Schweighofer, Lukas Aichberger, Sepp Hochreiter
精选
推荐理由:做推理模型RL微调的团队终于有了降低训练方差的实际方案——RREDCoT用模型自身做信用分配,省去额外生成成本,长上下文场景下效果显著,值得关注。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月27日
12:15
12:15
arXiv: DeepSeek@Kia-Jüng Yang, Dominik Meier, Jiachen Zhao, Terry Ruas, Bela Gipp
精选72°
推荐理由:这项研究揭示了 CoT 在模型安全中的双重角色——既增强鲁棒性又引入新风险,做 AI 安全和对齐的团队值得关注,尤其是使用推理模型的开发者需要重新评估防御策略。
5月20日
10:55
10:55
arXiv: DeepSeek@Yanhang Li, Zhichao Fan, Zexin Zhuang
精选
推荐理由:做模型遗忘审计的团队会发现,思维链泄露可能被误判为权重记忆,这篇论文提供了一个简单有效的 sanity check 方法,值得在评估流程中加上。
5月19日
11:33
11:33
arXiv cs.AI@Yajing Zhou, Xiangyu Kong
精选
推荐理由:这篇论文戳破了MLLM空间推理的泡沫——它们并不真正理解3D世界。做具身AI、多智能体系统或空间推理的开发者,看完会重新评估模型能力边界。
5月15日
10:09
10:09
arXiv: DeepSeek@Pengyun Zhu, Yuqi Ren, Zhen Wang, Lei Yang, Deyi Xiong
精选
推荐理由:做 LLM 价值对齐的研究者终于有了从人口统计维度精细建模的方法——DVMap 用结构化 CoT 和 GRPO 实现了跨群体泛化,比国家标签更准,建议做 AI 伦理和可控生成的团队点开看看。
10:08
10:08
arXiv: DeepSeek@Bin Lei, Caiwen Ding, Jiachen Yang, Ang Li, Xin Eric Wang
精选
推荐理由:长链推理的注意力衰减问题终于有了针对性解法,做推理模型优化或长上下文应用的团队值得关注——InsightReplay简单有效,可以直接在现有CoT框架上尝试。
5月13日
19:12
19:12
arXiv: DeepSeek@Wenkai Li, Fan Yang, Ananya Hazarika, Shaunak A. Mehta, Koichi Onoue
精选75°
推荐理由:这项研究戳破了 CoT 推理过程忠实反映模型思考过程的假设,做 AI 安全、可解释性研究或依赖 CoT 审计的团队值得关注——它提醒我们,看起来合理的推理链条可能只是事后编造的故事。
