AITOP6月11日 15:28
精选
过去 24 小时,从 840 条中筛出 51 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
11:27
11:27
arXiv cs.AI@Songhao Wu, Ang Lv, Ruobing Xie, Yankai Lin
精选
推荐理由:MoE 模型的路由器设计长期缺乏理论依据,MPI 给出了可解释的优化方向,做大规模 MoE 训练的团队值得关注,能直接提升模型效率。
6月2日
09:56
09:56
Y Combinator@ycombinator
精选
推荐理由:做智能体部署和运维的团队终于有了专门的监控与学习工具,BentoLabsAI 能直接提升模型效果,值得关注和试用。
6月1日
00:09
AITOP6月1日 00:09
5月31日
00:04
00:04IT之家(博客/媒体)
精选76°
推荐理由:小米公开的推理系统优化方案直接解释了 MiMo-V2.5 降价 99% 的技术基础,做模型推理部署的团队可以借鉴其 Hybrid SWA 和缓存管理思路,看完会明白长序列推理成本如何真正降下来。
5月29日
13:08
13:08
berryxia@berryxia
精选
推荐理由:写Prompt总感觉模型不听话?FaceMind的实验戳破了“高级词汇”的幻觉——用高频表达能让模型表现直接起飞,做Prompt工程或微调模型的开发者值得一试。
5月25日
02:52
02:52
rohanpaul_ai@rohanpaul_ai
精选72°
推荐理由:部署MoE模型的团队终于可以省下一半专家计算——ZEDA让Qwen3和GLM等模型自动跳过简单token,推理速度提升20%且几乎不掉精度,做模型推理优化的开发者可以直接参考论文方法。
5月22日
14:56
14:56
Cohere@cohere
精选
推荐理由:Cohere 与 NVIDIA 的深度合作让 Command A+ 在 Blackwell 上跑出最佳性能,做企业级 AI 部署的团队值得关注这个新选择。
