flops·general

FLOPs

别名
首次出现
2026-05-22
最近出现
2026-06-11
累计提及
11
§ 01综述

FLOPs(浮点运算次数)是衡量深度学习模型计算成本的核心指标,近期研究焦点在于如何在保持模型性能的同时显著降低FLOPs,以满足设备端部署和高效推理的需求。

  • MobileMoE 提出了一种面向设备端部署的MoE语言模型,通过0.3B到0.9B的活跃参数实现了极低FLOPs,在移动设备上展现了可行性。 MobileMoE:面向设备端部署的MoE语言模型
  • LoopMDM 通过引入循环层来优化掩码扩散语言模型,在保持生成质量的前提下减少了FLOPs,提升了训练和推理效率。 LoopMDM:循环层提升掩码扩散语言模型效率与性能
  • DeepSeek 的架构创新通过将硬件特性(如稀疏性)融入设计,有效将硬件约束转化为计算优势,降低了实际FLOPs。 DeepSeek 架构创新:将硬件稀缺转化为战略优势
  • 当前焦点在于如何在模型规模增长(如MoE)与计算效率之间取得平衡,以及设计硬件友好的架构来进一步削减FLOPs。未来观察点包括:FLOPs优化能否在保持精度下扩展到更大模型,以及这些技术是否能在各种硬件平台上通用。

    § 02相关报道03 条在档
    1. 01
      MobileMoE:面向设备端部署的MoE语言模型,0.3B-0.9B活跃参数
      arXiv cs.AI
    2. 02
      LoopMDM:循环层提升掩码扩散语言模型效率与性能
      arXiv cs.LG
    3. 03
      DeepSeek 架构创新:将硬件稀缺转化为战略优势
      rohanpaul_ai
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/FLOPs