全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

20:12

20:12

小互@imxiaohu

Perceptron AI 发布了 Agentic Detection 模型，用户只需提供一张图片并用自然语言描述目标，模型就能在图中精确框出并标注每个目标。该模型无需预先训练，可直接处理从未见过的检测任务。它还能执行物理推理，例如从森林火灾画面中定位“烟的来源”，识别“需要维修的电线杆”或标记“空着的停车位”。这些能力使其在零样本目标检测领域展现了显著进步。

AI模型 Perceptron AI Agentic Detection 视觉检测多模态推理模型

推荐理由：Perceptron AI 发了新视觉检测模型，不用提前训练，直接说找什么它就圈出来，还能推理物理关系，挺实用。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月29日

03:07

03:07

NVIDIA AI@NVIDIAAI

72°

NVIDIA 研究团队的 CVPR2026 论文 LocateAnything 在 HuggingFace 上成为趋势第一。该模型是一种视觉语言检测模型，创新性地并行解码边界框，而非传统的一次一个坐标。在 1.38 亿高质量样本上训练，显著提升了定位精度和吞吐量，适用于 AI 智能体和机器人等需要快速精准视觉定位的场景。项目页面已公开。

论文视觉检测边界框预测 NVIDIA CVPR2026 HuggingFace

推荐理由：做视觉检测或机器人感知的团队，LocateAnything 的并行解码思路能直接提升实时性，值得点开看看项目页。