NVIDIA 团队 LocateAnything 登顶 HuggingFace，重新定义边界框预测

精选理由

做视觉检测或机器人感知的团队，LocateAnything 的并行解码思路能直接提升实时性，值得点开看看项目页。

AI 摘要

NVIDIA 研究团队的 CVPR2026 论文 LocateAnything 在 HuggingFace 上成为趋势第一。该模型是一种视觉语言检测模型，创新性地并行解码边界框，而非传统的一次一个坐标。在 1.38 亿高质量样本上训练，显著提升了定位精度和吞吐量，适用于 AI 智能体和机器人等需要快速精准视觉定位的场景。项目页面已公开。

AI 翻译 · 中文

NVIDIA AIThis #CVPR2026 paper from our research team is trending #1 on @HuggingFace 🤗 Meet LocateAnything: a vision-language detection model that rethinks bounding box prediction. For AI agents and robots, “seeing” is only usefu…

LangChain05-27 18:02原文
WeAreLegora05-28 02:41原文
rohanpaul_ai05-28 12:05原文
marktechpost05-29 23:19原文

查看原推