02:45Microsoft Research@MSFTResearch精选ResNet在CVPR 2026上获得Longuet-Higgins奖,表彰其持久影响力。该论文发表十年,残差连接已成为现代AI系统的基础组件。其引用量超过32万次,并在持续增长。残差连接解决了深层网络退化问题,推动了计算机视觉和整个深度学习领域的发展。AI模型ResNetCVPRLonguet-Higgins Prize残差连接计算机视觉推荐理由:ResNet的残差思想直到今天还在被所有大模型使用,32万引用不是白来的,这个奖实至名归。原文
20:51IT之家(博客/媒体)精选OpenCV 团队正式发布 OpenCV 5,这是该计算机视觉库的重大现代化升级。新版本引入了基于图的 DNN 引擎,支持算子融合、广泛的 ONNX 算子(覆盖率从 23% 提升至 80%),并原生支持 Transformer、VLM 和 LLM 等大模型。此外,OpenCV 5 改进了 Python 集成、硬件加速层、3D 视觉功能,并弃用了传统 C API,使代码更紧凑。该库在 GitHub 拥有超 86,000 星,日安装量超百万次,此次更新旨在巩固其作为计算机视觉基础库的地位。AI产品OpenCV计算机视觉DNN引擎ONNX大模型1 个信源在谈推荐理由:做计算机视觉、机器人或 AI 应用开发的团队,OpenCV 5 的 DNN 引擎和 ONNX 支持能直接提升模型部署效率,值得立即升级体验。原文
11:35arXiv cs.LG@Gandhimathi Padmanaban, Fred Feng精选该研究提出一个开源的两阶段计算机视觉流水线,用于从自然道路视频中细粒度分类车辆类型(轿车、SUV、皮卡、小型货车、大型货车、商用卡车),以评估自行车事故中骑车人受伤严重程度。第一阶段使用预训练的RT-DETR检测器进行粗略车辆定位,第二阶段使用微调的Vision Transformer(ViT-Base/16)进行六类车身类型分类。引入基于置信度的弃权机制(softmax输出低于0.60时输出“未知”标签),避免静默误分类。在密歇根州安阿伯市自行车道走廊的3805个超车事件(分布内)上,流水线准确率达0.94,各类F1分数在0.91(小型货车)到0.97(SUV)之间。在独立的外部数据集(311个事件,无再训练)上,准确率为0.89,其中三个常见类别F1仍保持在0.90以上,小型货车因弃权率从2.4%升至25.0%导致F1降至0.72,但未出现主动误分类。完整流水线(含推理脚本、训练代码、评估工具和模型权重)已开源,支持道路视频档案和骑行安全研究的复现与复用。论文计算机视觉细粒度分类Vision TransformerRT-DETR交通安全推荐理由:做交通安全分析或自动驾驶细粒度感知的团队,可以直接用这个开源流水线替代粗粒度检测,它用弃权机制解决了域迁移下的误分类问题,值得在真实道路视频上试试。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……