transformers·general

Transformers

别名
首次出现
2026-05-22
最近出现
2026-06-11
累计提及
64
§ 01综述

Transformers 自 2017 年提出以来,已成为深度学习的基础架构,广泛应用于 NLP 和 CV 等领域。当前研究不仅关注模型性能提升,也开始探索理论统一与工程落地。

近期主要进展:

  • 视觉模型的理论瓶颈:形式化绑定问题。ViTs 在识别物体时如何判断不同特征属于同一实体?新研究通过形式化分析指出,当前 ViTs 缺乏绑定机制,导致错误关联,并提出解决方案。(形式化绑定问题:ViT模型如何知道特征属于同一物体?)
  • 统一注意力与扩散的范畴框架。Kan Extension Transformers 利用范畴论将自注意力、扩散过程、自条件化统一到一个数学框架下,为理解 Transformer 的深层原理和设计新架构提供了理论基础。(Kan Extension Transformers:统一注意力、扩散与自条件化的范畴框架)
  • PaddleOCR 3.5 接入 Hugging Face,支持 Transformers 推理。此更新使得 OCR 和文档解析模型可直接使用 Transformers 后端进行推理,降低了开发成本,提升了部署灵活性。(PaddleOCR 3.5 发布:支持 Transformers 后端,OCR 与文档解析更灵活)
  • Andrew Ng 推出新课程《Transformers in Practice》。该课程与 AMD 合作,聚焦 Transformers 的实际应用与部署,帮助开发者掌握从理论到落地的关键技能。
  • (Andrew Ng 新课程:Transformers in Practice,与 AMD 合作)
  • Stateful Transformers 实现流式推理加速。通过维护隐状态避免重复计算,在流式场景下实现 5.9 倍加速,这对实时应用(如对话系统、直播字幕)具有重要意义。(Stateful Transformers 实现流式推理 5.9 倍加速)
  • 当前焦点集中在理论统一(如绑架问题、范畴框架)与实用优化(推理加速、课程教育)两大方向。未来观察点包括:更高效的结构设计(如 Mamba 能否取代 Transformer)、更广泛的应用覆盖(从 NLP、CV 到多模态),以及基础理论突破如何转化为实际性能提升。

    § 02相关报道07 条在档
    1. 01
      Clement Delangue 提议训练开源 AI 建筑模型
      Clement Delangue
    2. 02
      形式化绑定问题:ViT模型如何知道特征属于同一物体?
      arXiv cs.LG
    3. 03
      Kan Extension Transformers:统一注意力、扩散与自条件化的范畴框架
      arXiv cs.LG
    4. 04
      PaddleOCR 3.5 打通 Hugging Face 生态,支持 Transformers 推理后端
      berryxia
    5. 05
      PaddleOCR 3.5 发布:支持 Transformers 后端,OCR 与文档解析更灵活
      Hugging Face: Blog
    6. 06
      Andrew Ng 新课程:Transformers in Practice,与 AMD 合作
      Andrew Ng
    7. 07
      Stateful Transformers 实现流式推理 5.9 倍加速
      arXiv cs.LG
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Transformers