08:40Satya Nadella@satyanadella71°微软Azure在AI训练基准测试中创下新纪录,实现了史上最快的训练时间和最大的报告规模。这一里程碑得益于全栈创新,包括硅片、系统、网络和软件协同优化,以及与Nvidia的深度合作。Azure此次突破展示了其AI基础设施的最新进展。行业AzureNvidiaAI训练基准基础设施2 个信源在谈推荐理由:Azure和Nvidia联手刷了个AI训练速度纪录,规模也是史上最大,搞AI基础设施的可以看看。原文
14:15AI Will@FinanceYF588°Anthropic 正在使用 1000 名自由软件工程师来训练其编程助手 Claude Code。每位工程师每完成一个任务可获得 280 美元,任务包括编写提示词、比较代码、测试后续交互,以及向 Claude 展示真实开发者的工作方式。这一做法旨在提升 Claude Code 的代码生成质量和开发流程理解能力。消息引发讨论,有人担忧 AI 训练正在“烹饪”人类自身,即人类在帮助 AI 取代自己的岗位。AI产品Claude Code编程助手AnthropicAI训练自由工程师10 个信源在谈推荐理由:Anthropic 用真实开发者训练 Claude Code,揭示了 AI 编程助手背后的数据来源和成本结构,做 AI 训练或关注编程工具演进的开发者值得了解——这直接关系到未来谁在写代码。原文
14:12AI Will@FinanceYF572°Anthropic 正在大规模招募 1000 名自由职业软件工程师,专门用于训练其编程助手 Claude Code。每完成一个任务可获得 280 美元报酬,工程师们需要编写提示词、比对代码输出、测试模型的追问响应,并教会 Claude 真实开发者的工作方式。这一举措旨在提升 Claude Code 在真实编程场景中的表现,但也引发了关于 AI 可能取代部分编程工作的讨论。对于开发者而言,这既是参与前沿 AI 训练的机会,也反映了行业对高质量训练数据的需求。AI产品AnthropicClaude Code编程助手自由职业AI训练10 个信源在谈推荐理由:Anthropic 用真金白银请工程师教 Claude 写代码,做 AI 训练或编程工具的团队值得关注——这揭示了高质量训练数据的新模式,也暗示了未来编程工作的形态变化。原文
18:49rohanpaul_ai@rohanpaul_ai精选76°Amazon 发布了新型数据中心网络架构“Resilient Network Graphs”(RNG),用扁平随机图替代传统的胖树结构,将硬件需求降低 69%,吞吐量提升 33%。该设计自去年起已在 AWS 数据中心悄然部署,现已成为大多数 AWS 工作负载的默认网络。RNG 通过扁平化随机图连接路由器,提供多条独立路径,避免胖树网络的流量瓶颈问题。其路由系统 Spraypoint 将流量分散到多条路径,ShuffleBox 布线设备使随机连接变得可实施。实测显示,RNG 在性能上与胖树网络持平,但成本降低 9% 至 45%,尤其对 AI 集群的大规模同步训练流量有显著改善。行业数据中心网络AWSRNGAI训练网络架构推荐理由:AWS 用 RNG 解决了胖树网络的流量瓶颈,做 AI 训练和大规模云计算的团队可以直接受益——更少的硬件、更低的成本、更好的吞吐,值得点开了解工程细节。原文
00:10小互@imxiaohu精选Midjourney创始人公开表示,团队因采用Google TPU进行训练,研究进度相比使用Nvidia GPU技术栈落后约一年。他称如果回到过去,会从一开始就全部使用Nvidia的方案。这一言论反映了大模型训练中硬件生态适配的隐蔽成本。行业MidjourneyGoogleTPUNvidiaGPUAI训练2 个信源在谈推荐理由:创始人亲述选错硬件的代价原文
13:36Weights & Biases@weights_biasesAndrej Karpathy 在社交媒体上发布了一条简短但引人深思的推文:“let there be descent”,引用自《创世纪》的“let there be light”变体。这条推文暗示了机器学习中梯度下降(descent)的核心地位,可能是在强调优化算法在AI训练中的根本作用。Karpathy 作为AI领域的重要人物,其言论常引发社区对基础概念的重新思考。这条推文可能是在鼓励开发者回归对优化本质的理解,而非追逐复杂模型。行业梯度下降KarpathyAI训练优化算法社区观点推荐理由:Karpathy 用一句话点醒了AI社区:别光顾着堆模型,梯度下降才是根本。做训练和优化的开发者看完会有感触,值得停下来想想。原文