AITOP6月11日 15:28
精选
过去 24 小时,从 986 条中筛出 58 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月10日
11:05
11:05
arXiv cs.LG@Tong Xie, Yuanhao Ban, Yunqi Hong, Sohyun An, Yihang Chen, Cho-Jui Hsieh
精选
推荐理由:做LLM微调的团队终于有了一个更系统的设计框架——Target-SFT直接告诉你如何选择目标分布,而不是盲目拟合每个token。做推理模型优化的开发者建议试试,效果在多个数据集上都有提升。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月27日
10:51
10:51
arXiv cs.LG@Shijin Gong, Erhan Xu, Kai Ye, Francesco Quinzan, Giulia Livieri, Chengchun Shi
精选
推荐理由:做LLM推理强化学习的团队终于有了一个兼顾计算和样本效率的方案——BASIS用单次采样就达到多采样的效果,训练成本大幅降低,建议做RLHF或推理优化的开发者点开看看。
5月25日
11:12
11:12
arXiv cs.AI@Xu Ouyang, Deyi Liu, Yuhang Cai, Jing Liu, Yuan Yang, Chen Zheng, Thomas Hartvigsen, Yiyuan Ma
精选
推荐理由:香农缩放定律统一解释了LLM训练中的非单调退化现象,做模型缩放和训练优化的研究者可以直接用这个框架预测性能拐点,避免盲目增加计算量。
5月21日
10:07
10:07
arXiv: DeepSeek@Zhaohui Zheng, Chenhang He, Shihao Wang, Yuxuan Li, Ming-Ming Cheng, Lei Zhang
精选
推荐理由:数值预测是数学推理和代码生成的基础能力,DEL直接改进了LLM对数字的学习效果。做数学推理或代码生成模型训练的团队,值得关注这个新损失函数,它简单有效且开源可用。
5月19日
10:18
10:18
arXiv cs.AI@Mengtian Yang, Zhekun Zhang, Mingheng Wu, Jianwen Yan, Hanshi Sun, Li-wen Chang
精选72°
推荐理由:做 LLM 部署优化的工程师终于有了一个高精度模拟器来验证“如果…会怎样”的假设,Charon 能帮你快速找到最佳配置,避免盲目调参,建议直接看论文实验部分。
5月18日
20:20
20:20
AlphaSignal@AlphaSignalAI
精选76°
推荐理由:训练 LLM 的团队终于有了一个不改变模型、不调优化器的加速方案——直接插进去就能省 2.5 倍时间,做预训练或资源受限的开发者值得一试。
