AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:RT-DETR×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月4日
11:35
11:35arXiv cs.LG@Gandhimathi Padmanaban, Fred Feng
精选
该研究提出一个开源的两阶段计算机视觉流水线,用于从自然道路视频中细粒度分类车辆类型(轿车、SUV、皮卡、小型货车、大型货车、商用卡车),以评估自行车事故中骑车人受伤严重程度。第一阶段使用预训练的RT-DETR检测器进行粗略车辆定位,第二阶段使用微调的Vision Transformer(ViT-Base/16)进行六类车身类型分类。引入基于置信度的弃权机制(softmax输出低于0.60时输出“未知”标签),避免静默误分类。在密歇根州安阿伯市自行车道走廊的3805个超车事件(分布内)上,流水线准确率达0.94,各类F1分数在0.91(小型货车)到0.97(SUV)之间。在独立的外部数据集(311个事件,无再训练)上,准确率为0.89,其中三个常见类别F1仍保持在0.90以上,小型货车因弃权率从2.4%升至25.0%导致F1降至0.72,但未出现主动误分类。完整流水线(含推理脚本、训练代码、评估工具和模型权重)已开源,支持道路视频档案和骑行安全研究的复现与复用。
论文计算机视觉细粒度分类Vision TransformerRT-DETR交通安全

推荐理由:做交通安全分析或自动驾驶细粒度感知的团队,可以直接用这个开源流水线替代粗粒度检测,它用弃权机制解决了域迁移下的误分类问题,值得在真实道路视频上试试。
原文
精选全部日报登录