№flops·general

FLOPs

别名

首次出现: 2026-05-22
最近出现: 2026-07-23
累计提及: 39

§ 01综述

FLOPs（浮点运算次数）是衡量AI模型计算量的核心指标，直接影响训练和推理的成本与能耗。近期，围绕FLOPs的效率优化成为行业焦点，包括减少冗余计算、提升利用率以及降低服务开销。

FLOPs 近期进展

斯坦福研究量化数据重复对FLOPs的浪费：斯坦福AI实验室研究发现，训练数据中的重复样本导致高达30%的FLOPs被浪费，模型性能反而受损。该研究呼吁在数据去重上投入更多算力，以提升整体效率。数据重复摧毁语言模型：斯坦福研究量化计算浪费

GPU利用率95%被视为“故障”，强调FLOPs高效分配：Anjney Midha指出，当前AI集群中GPU利用率95%即达到瓶颈，认为应通过动态调度实现近100%利用，以减少空闲FLOPs浪费。Anjney Midha：GPU利用率95%即“故障”，AI竞争进入计算网格时代

DeepSeek提出Floor-First分流方法优化LLM服务FLOPs：该研究在网格搜索前采用基于阈值的分流策略，将低计算需求的请求分配到较低精度通道，节省约40%的推理FLOPs，同时保持响应质量。网格搜索前的思考：面向LLM服务的Floor-First分流方法

小红书开源长上下文LLM服务框架，降低FLOPs开销：该框架针对长序列推理优化，通过稀疏注意力机制减少冗余计算，使长上下文场景下的FLOPs降低50%以上。小红书开源高效长上下文LLM服务框架

当前焦点与观察点

FLOPs的讨论正从“堆算力”转向“精打细算”：数据质量、计算调度和算法创新成为降低无效FLOPs的关键。高盛分析LLM商品化时指出，中国模型通过更低的FLOPs定价策略加剧价格战，侧面反映效率竞争的激烈。然而，GLM-5.2等模型追求1M token超长上下文，意味着FLOPs需求仍在增长。未来焦点可能落在：如何在不牺牲性能的前提下，通过软硬件协同设计（如神经架构搜索、量化）进一步压榨FLOPs效益，并平衡模型能力与计算成本。

§ 02相关报道10 条在档

§ 03邻近话题