全部 AI 动态 · AI 热点

6月26日

14:24

14:24

Lilian Weng@lilianweng

精选74°

Lilian Weng 发布了一篇关于 scaling laws 的博文，详细解释了如何通过缩放定律在数据量和模型尺寸之间做计算最优分配。文章对比了 Kaplan et al.（2020）和 Chinchilla（2022）两篇经典论文的分歧：前者主张模型尺寸随计算量更快增长，后者主张等比例增长。文中还指出数据限制和拟合细节会使外推变得不可靠。

AI模型 Scaling Laws Chinchilla Kaplan et al.计算最优 Lilian Weng

推荐理由：想搞懂 Scaling Laws？Lilian 这篇把 Kaplan vs Chinchilla 的争论讲透了，还有实操建议。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

01:18

01:18

berryxia@berryxia

73°

Anthropic 的创始团队是 GPT-2、GPT-3 的实际作者，包括 Scaling Laws 核心作者 Jared Kaplan 和 GPT-3 首席工程师 Tom Brown，拥有行业顶级人才。其独家技术武器包括 Scaling Laws（精确预测训练产出）、Constitutional AI（价值观编码）和 RLHF（发明者参与），算力方面与 Amazon、Google、Microsoft 合作，拥有约 100 万颗 Trainium2 芯片和 5 GW 算力协议。年化营收从 2024 年 1 月的 8700 万美元飙升至 2026 年 4 月的 300 亿美元，增速超预期 8 倍。关于指控中国厂商蒸馏 Claude 能力，既有技术证据，也被视为政策游说动作。

行业 Anthropic 创始团队 Scaling Laws Constitutional AI 算力合作

推荐理由：想了解 AI 行业顶级团队如何构建技术壁垒和商业飞轮的读者，这篇快速梳理了 Anthropic 的核心优势，看完会对这家公司的战略有清晰认知。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月30日

11:34

11:34

elvis@omarsar0

精选72°

一项新研究提出了有效反馈计算（EFC）指标，用于衡量智能体实际可用的反馈量，替代传统的原始token和工具调用计数。实验表明，原始计数只能解释33%-42%的智能体失败原因，而EFC的解释力达到99%。在相同计算预算下，仅通过按有效反馈重新分配资源，就能将智能体成功率从0.27提升至0.90。该研究将智能体框架设计从猜测转变为可预测的科学。

论文智能体有效反馈计算 Scaling Laws Agent Harness 性能优化

推荐理由：做智能体框架或Agent Harness的开发者，终于有了一个可量化的优化指标——EFC能让你用相同算力把成功率翻三倍，值得点开论文细读。