AITOP6月11日 15:28
精选
过去 24 小时,从 892 条中筛出 48 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月22日
10:43
10:43
arXiv: DeepSeek@Yuyang Wu, Qiyao Xue, Guanxing Lu, Weichen Liu, Zihan Wang, Manling Li, Olexandr Isayev
精选
推荐理由:CLORE 解决了推理模型输出冗长、重复的痛点,做推理优化或部署长链模型的团队可以直接参考其内容级编辑方法,比单纯限制长度更精细。
5月21日
10:22
10:22
arXiv cs.LG@Kesong Li, Yixuan Xu, Kuo-kun Tseng, Weiyi Lu, Kan Liu, Tao Lan
精选
推荐理由:做文本到图像生成的团队终于有了更稳定的对齐方法——Linear-DPO 统一了扩散和流匹配,解决了 DPO 在生成任务中的目标不匹配问题,做图像生成微调的建议试试。
