无需训练·general

无需训练

别名
首次出现
2026-05-22
最近出现
2026-06-05
累计提及
6
§ 01综述

近期,人工智能研究领域涌现出一批以“无需训练”为核心理念的方法,旨在通过改进推理过程或架构设计,在不更新模型参数的前提下提升性能或扩展能力。这些工作主要聚焦于大语言模型(LLM)和扩散模型,涵盖检索增强、图像编辑、视频生成、推理优化及幻觉缓解等多个方向。

当前焦点:这些方法共同指向“训练-推理”范式的转变——不再依赖大规模预训练或微调,而是通过精心设计的推理算法、架构重用或缓存策略来释放预训练模型的潜能。它们特别适合计算资源受限或需快速部署的场景。

未来观察点:随着无需训练技术的成熟,模型能力可能更多由推理策略而非参数规模决定;同时,这些方法能否与模型缩放规律兼容,以及在不同任务上的泛化边界,将是后续值得关注的问题。

§ 02相关报道07 条在档
  1. 01
    SARDI:扩散语言模型的自增强检索方法
    arXiv cs.AI
  2. 02
    GeM-NR:无需训练的几何感知多视图编辑,支持非刚性场景变化
    arXiv cs.AI
  3. 03
    TunerDiT:无需训练的多事件视频生成渐进引导方法
    arXiv cs.AI
  4. 04
    无需训练的循环Transformer:冻结模型推理时循环提升性能
    arXiv cs.LG
  5. 05
    ILVAD:通过层间视觉注意力差异缓解LVLM幻觉
    arXiv cs.AI
  6. 06
    TRACE:跨层证据轨迹纠正减少大模型幻觉,无需训练
    arXiv cs.AI
  7. 07
    KV-Fold:无需训练的长上下文推理协议,单步KV缓存递归
    arXiv cs.AI
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/%E6%97%A0%E9%9C%80%E8%AE%AD%E7%BB%83