AITOP6月11日 15:28
精选
过去 24 小时,从 661 条中筛出 45 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月26日
12:37
12:37
arXiv: DeepSeek@Pingfan Su, Kai Ye, Shijin Gong, Erhan Xu, Jin Zhu, Giulia Livieri, Chengchun Shi
精选
推荐理由:AI文本检测的可解释性和鲁棒性一直是痛点,READER用1.5B参数就超越了千倍大模型,做内容安全或反作弊的团队值得关注这个新思路。
5月25日
11:13
11:13
arXiv cs.AI@Beichen Zhang, Yuhong Liu, Jinsong Li, Yuhang Zang, Jiaqi Wang, Dahua Lin
精选
推荐理由:做多模态推理或视觉问答的开发者,ETCHR 提供了一种无需微调即可提升模型准确率的思路,值得在现有工作流中试试。
5月13日
19:12
19:12
arXiv cs.AI@Jacob Fein-Ashley, Paria Rashidinejad
精选70°
推荐理由:循环Transformer训练难、部署贵的问题被Attractor Models用不动点求解优雅解决,做语言模型预训练或推理增强的团队值得关注——它用更少参数和成本实现了对更大模型的超越。
