№scaling·general
Scaling
别名
- 首次出现
- 2026-05-22
- 最近出现
- 2026-06-11
- 累计提及
- 116
§ 01综述
Scaling(规模化)在AI领域仍是一个核心议题,但焦点正从单纯扩大模型参数转向更精细的维度——包括推理时间、智能体表现以及硬件架构。近期动态显示,Scaling Law依旧有效,但应用方式更加多样。
推理时间Scaling持续有效:研究表明,增加推理时的“思考token”可以显著提升LLM性能,这被称为“第二Scaling Law”。Ethan Mollick等人指出这一趋势仍在延续 (详见 Second Scaling Law 持续有效 ) 。
智能体Scaling新范式:针对AI智能体的Scaling研究提出“有效反馈计算”(EFC)概念,能将任务成功率从0.27提升至0.90,为智能体性能的规模化提供了新方向 (详见 Scaling Laws for Agent Harnesses )。
硬件Scaling逆势突破:华为在制裁压力下推出Tau Scaling架构,旨在实现1.4nm等效密度,通过芯片设计创新继续推动算力规模化 (详见 华为Tau Scaling突破 及 华为芯片设计突破 )。同时,OpenAI将Kubernetes集群扩展至2500节点,展示基础设施规模化能力 (详见 OpenAI将Kubernetes扩展至2500节点 )。
规模化应用民主化:本地优先的个人AI如OpenJarvis可通过Ollama运行,降低了规模化AI的部署门槛 (详见 OpenJarvis:本地优先的个人AI )。而阿里云在Qwen Conference 2026上讨论了可信智能体,强调规模化与安全性的平衡 (详见 Qwen Conference 2026 )。
当前焦点在于:规模化已不再局限于模型参数,而是延伸至推理、智能体、硬件和部署等多个层面。未来值得观察的是,这些不同维度的Scaling如何协同,以及是否会出现新的瓶颈。