AITOP6月11日 15:28
精选
过去 24 小时,从 359 条中筛出 13 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月18日
12:12
12:12
arXiv cs.AI@Ziang Ye, Wentao Shi, Yuxin Liu, Yu Wang, Zhengzhou Cai, Yaorui Shi, Qi Gu, Xunliang Cai, Fuli Feng
精选72°
推荐理由:这篇论文直击 LLM Agent 在陌生环境中的核心短板——过早行动,做智能体开发或强化学习的研究者值得一读,提出的探索-执行范式可以直接启发你的训练策略。
