AITOP6月11日 15:28
精选
过去 24 小时,从 841 条中筛出 52 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月9日
10:41
10:41
arXiv cs.AI@Rakibul Hasan Rajib, Mengxin Zheng, Qian Lou
精选72°
推荐理由:做LLM Agent服务部署和优化的团队,终于有了一个低成本、高精度的模拟工具来测试调度和缓存策略,不用再烧GPU时间试错,建议直接看论文细节。
6月1日
00:09
AITOP6月1日 00:09
