scaling-laws

§ 01综述

Scaling laws（缩放定律）自OpenAI 2020年提出以来，已成为AI领域的基础性发现，其核心观点是模型性能随着参数规模、数据量和计算量的增加而可预测地提升。近期，该理论在多个方向得到延伸和深入探讨。

在智能体场景中，研究者提出了“有效反馈计算”（EFC）概念，将成功率从0.27提升至0.90，揭示了反馈信号缩放对智能体能力的影响（Scaling Laws for Agent Harnesses）。

训练算力需求呈指数级增长，每3.4个月翻一番（AI and Compute），这验证了原始缩放定律的预测能力。

进一步研究发现，梯度噪声尺度可预测并行化效率（How AI Training Scales），为规模化训练提供了理论指导。

奖励模型存在过度优化的缩放规律（Scaling Laws for Reward Model Overoptimization），提示强化学习中需要权衡优化程度。

当前焦点：缩放定律是否在所有场景下都成立？在智能体、RLHF等复杂任务中，缩放的速度和边界可能与预训练阶段不同。未来需关注：1）数据质量与规模对缩放曲线的影响；2）是否存在“缩放天花板”，即计算量增加带来的边际效益递减。

§ 02相关报道06 条在档

§ 03邻近话题