全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

11:12

11:12

arXiv cs.AI@Aray Karjauv

这篇论文指出，现代图像分类器使用的全局平均池化（GAP）加线性分类头的结构，使图像级logits等于特征网格上逐点分类后logits的平均值。这种线性性意味着标准分类器本质上是多实例学习器（MIL），将图像视为空间实例的包。实验发现，即使图像级预测错误，分类器仍在特征网格中保留了空间类别证据，且现成模型（off-the-shelf models）能稳定恢复前景区域的地面真实类别。该研究将GAP隐藏的空间信息重新提取出来，为模型诊断提供了新思路。

论文 GAP 多实例学习图像分类分类器 MIL

推荐理由：用GAP隐藏的空间证据诊断分类错误

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月5日

12:02

12:02

arXiv cs.AI@Alexander Möllers, Marvin Sextro, Julius Hense, Gabriel Dernbach, Klaus-Robert Müller

精选

多实例学习（MIL）处理的是包级别监督的问题，在计算病理学、卫星图像等领域有广泛应用。但现有算法在低标签数据场景下表现不佳，灵活模型容易过拟合，刚性模型难以适应新任务。本文提出一种基于Perceiver架构的上下文学习器，在合成数据上预训练后，仅需少量标注包即可解决新任务，推理时单次前向传播完成，无需梯度更新。研究设计了多种合成数据生成器，它们捕获互补的归纳偏置，混合预训练模型在12个MIL基准上平均性能最优，超越需要任务特定训练的监督基线。

论文多实例学习上下文学习 Perceiver架构弱监督学习合成数据

推荐理由：做弱监督学习或医疗图像分析的团队，终于有了一个无需微调就能从少量标注包中学习的方案——单次前向传播搞定，值得直接试试。

5月14日

13:27

13:27

arXiv cs.AI@Urvi Gianchandani, Praveen Tirupattur, Mubarak Shah

精选

该论文提出一种弱监督方法，仅利用视频级标签（正常/异常）训练网络，无需帧级或像素级标注。通过多实例排序损失（MIL）将异常和正常视频片段分别视为正包和负包，提取特征并训练分类器，从而为时空区域生成异常分数。方法同时检测时间（片段级）和空间（帧内局部区域）异常，在UCF Crime2Local数据集上验证了有效性。这解决了视频异常标注成本高的问题，为实际监控场景提供了更实用的方案。

论文弱监督学习异常检测时空检测多实例学习 UCF Crime2Local

推荐理由：做视频监控或异常检测的团队，不用逐帧标注就能定位异常区域，直接省下大量标注成本，值得关注。