AITOP6月11日 15:28
精选
过去 24 小时,从 333 条中筛出 12 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月9日
10:41
10:41
arXiv cs.AI@Rakibul Hasan Rajib, Mengxin Zheng, Qian Lou
精选72°
推荐理由:做LLM Agent服务部署和优化的团队,终于有了一个低成本、高精度的模拟工具来测试调度和缓存策略,不用再烧GPU时间试错,建议直接看论文细节。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月20日
10:09
10:09
arXiv cs.AI@Dmitry Redko, Albert Fazlyev, Konstantin Sozykin, Maria Ivanova, Evgeny Burnaev, Egor Shvetsov
精选
推荐理由:做 AI 编译器或硬件优化的开发者会关心——LLM Agent 的搜索能力被高估了,实际表现受限于预训练数据分布,直接套用反馈循环可能适得其反,建议先看实验设计再决定是否采用。
