AITOP6月11日 15:28
精选
过去 24 小时,从 986 条中筛出 58 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月26日
12:21
12:21
arXiv cs.LG@Matt L. Wiemann, Lindsay M. Smith, Peter Melchior, Siddharth Mishra-Sharma, Andrew Gordon Wilson, Pavel Izmailov, Carolina Cuesta-Lázaro
精选72°
推荐理由:这个基准直击LLM科学推理的软肋——从数据中归纳规律而非回忆知识,做AI评估或科学模拟的团队值得关注,它暴露了当前模型在长程推理和实验设计上的真实短板。
12:21
12:21
arXiv cs.LG@Jinwoo Go, Xiaoning Qian, Byung-Jun Yoon
精选
推荐理由:做实验设计或决策优化的研究者终于有了一个直接对齐目标的方法——GoBOED 让实验设计不再浪费在无关参数上,做贝叶斯优化或主动学习的团队值得关注。
5月21日
11:13
11:13
arXiv cs.AI@Harsh Parikh, Gabriel Levin-Konigsberg, Dominique Perrault-Joncas, Alexander Volfovsky
精选
推荐理由:这篇论文为做强化学习或机器人部署的团队提供了一个严谨的框架,帮你判断什么时候该相信模拟器、什么时候该做真实实验。做仿真到真实迁移的开发者可以直接参考其Fisher-SEP算法来优化实验预算。
