全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

11:35

11:35

arXiv cs.LG@Gandhimathi Padmanaban, Fred Feng

精选

该研究提出一个开源的两阶段计算机视觉流水线，用于从自然道路视频中细粒度分类车辆类型（轿车、SUV、皮卡、小型货车、大型货车、商用卡车），以评估自行车事故中骑车人受伤严重程度。第一阶段使用预训练的RT-DETR检测器进行粗略车辆定位，第二阶段使用微调的Vision Transformer（ViT-Base/16）进行六类车身类型分类。引入基于置信度的弃权机制（softmax输出低于0.60时输出“未知”标签），避免静默误分类。在密歇根州安阿伯市自行车道走廊的3805个超车事件（分布内）上，流水线准确率达0.94，各类F1分数在0.91（小型货车）到0.97（SUV）之间。在独立的外部数据集（311个事件，无再训练）上，准确率为0.89，其中三个常见类别F1仍保持在0.90以上，小型货车因弃权率从2.4%升至25.0%导致F1降至0.72，但未出现主动误分类。完整流水线（含推理脚本、训练代码、评估工具和模型权重）已开源，支持道路视频档案和骑行安全研究的复现与复用。

论文计算机视觉细粒度分类 Vision Transformer RT-DETR 交通安全

推荐理由：做交通安全分析或自动驾驶细粒度感知的团队，可以直接用这个开源流水线替代粗粒度检测，它用弃权机制解决了域迁移下的误分类问题，值得在真实道路视频上试试。