AITOP6月11日 15:28
精选
过去 24 小时,从 846 条中筛出 48 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月27日
10:28
10:28
arXiv cs.AI@Shihao Wang, Shilong Liu, Yuanguo Kuang, Xinyu Wei, Yangzhou Liu, Zhiqi Li, Yunze Man, Guo Chen, Andrew Tao, Guilin Liu, Jan Kautz, Lei Zhang, Zhiding Yu
精选
推荐理由:做视觉定位或目标检测的开发者,LocateAnything 的并行解码思路能直接提升推理效率,建议关注其开源数据和模型。
5月25日
11:15
11:15
arXiv cs.AI@Rim Assouel, Amir Bar, Michal Drozdzal, Adriana Romero-Soriano
精选
推荐理由:PGT用低成本数据生成解决了MLLM细粒度视觉理解的瓶颈,做多模态模型训练或评估的团队可以直接用这个框架提升定位能力,值得一试。
