12:21IT之家(博客/媒体)《纽约时报》于2023年12月首次起诉OpenAI,指其非法使用该报文章训练ChatGPT。最新诉状将矛头转向微软,指控其为OpenAI定制超算系统,专门爬取包括《纽约时报》在内的网络资源。该系统据称使用“几乎整个互联网”训练模型,并提高《纽约时报》内容权重。诉状还披露,ChatGPT可输出接近原文的多段文字,并帮助用户绕过付费墙。行业纽约时报微软OpenAIChatGPT版权AI训练10 个信源在谈推荐理由:《纽约时报》再出手,这次指控微软为OpenAI定制超算爬取内容,涉及版权和AI训练边界,值得关注。原文
13:24IT之家(博客/媒体)73°华为宣布在WAIC 2026(7月17日-20日)首次展出业界最大规模超节点Atlas 950 SuperPoD真机,该产品以单柜64卡为基本单元,最大支持8192张NPU卡高速互联。同时展出的还有Atlas 850E风冷超节点真机,采用升级的VCE散热技术,为Agentic推理提供高吞吐低时延体验。展区将展示昇腾AI基础软件开源开放,并集中呈现11大行业解决方案,覆盖互联网、运营商等领域。AI产品华为Atlas 950 SuperPoD超节点AI训练大模型推荐理由:华为这次展出业界最大规模的Atlas 950 SuperPoD真机,单柜64卡、最高8192卡互联,专为万亿参数大模型训练打造,效率比传统集群大幅提升。原文
07:26IT之家(博客/媒体)Meta 已暂停名为“模型能力计划(MCI)”的 AI 训练项目,该项目记录员工键盘敲击和鼠标操作轨迹。因数据泄露,包含员工私人对话、工作绩效数据在内的敏感信息被意外开放给全体员工查看。这是 Meta 在 2025 年 6 月继 3 月 AI 智能体擅自操作、本月黑客利用 AI 客服劫持 Instagram 账号后的又一起安全事件。行业Meta数据泄露AI训练内部监控企业安全推荐理由:Meta 监控员工键盘鼠标的 AI 项目因数据泄露叫停了,之前还有两起AI安全事件,想了解来龙去脉可以看看。原文
08:40Satya Nadella@satyanadella71°微软Azure在AI训练基准测试中创下新纪录,实现了史上最快的训练时间和最大的报告规模。这一里程碑得益于全栈创新,包括硅片、系统、网络和软件协同优化,以及与Nvidia的深度合作。Azure此次突破展示了其AI基础设施的最新进展。行业AzureNvidiaAI训练基准基础设施2 个信源在谈推荐理由:Azure和Nvidia联手刷了个AI训练速度纪录,规模也是史上最大,搞AI基础设施的可以看看。原文
00:43Decoder@Maximilian SchreinerSpaceX 计划将数据中心送入太空,马斯克在 IPO 前将其描述为近乎微不足道的工程问题。首颗 AI 卫星的性能将相当于一台 Nvidia GB300 机架。然而,谷歌的研究表明,真正的 AI 训练需要大约 10,000 颗紧密耦合的卫星。这一构想旨在利用太空的太阳能和低温环境降低能耗,但技术挑战巨大。行业SpaceX太空数据中心AI训练卫星基础设施6 个信源在谈推荐理由:SpaceX 的太空数据中心构想可能颠覆 AI 基础设施的能耗和部署模式,关注云计算和 AI 训练的工程师值得了解这一前沿方向。原文
14:41IT之家(博客/媒体)Meta 公司收缩了其 MCI 员工追踪系统,新增最长 30 分钟的暂停功能和豁免申请机制。MCI 系统从 200 多个应用和网站收集员工鼠标移动、点击等操作,用于训练 AI 智能体。扎克伯格称员工智力水平高于承包商,但该系统因隐私和耗电问题遭到员工反对。Meta 副总裁表示团队仍相信隐私保护,但会进行多项优化。行业MetaAI训练员工监控隐私智能体推荐理由:Meta 用员工操作数据训练 AI 的做法引发隐私争议,现在允许暂停和豁免,关注 AI 数据采集伦理的读者值得一看。原文
14:15AI Will@FinanceYF588°Anthropic 正在使用 1000 名自由软件工程师来训练其编程助手 Claude Code。每位工程师每完成一个任务可获得 280 美元,任务包括编写提示词、比较代码、测试后续交互,以及向 Claude 展示真实开发者的工作方式。这一做法旨在提升 Claude Code 的代码生成质量和开发流程理解能力。消息引发讨论,有人担忧 AI 训练正在“烹饪”人类自身,即人类在帮助 AI 取代自己的岗位。AI产品Claude Code编程助手AnthropicAI训练自由工程师10 个信源在谈推荐理由:Anthropic 用真实开发者训练 Claude Code,揭示了 AI 编程助手背后的数据来源和成本结构,做 AI 训练或关注编程工具演进的开发者值得了解——这直接关系到未来谁在写代码。原文
14:12AI Will@FinanceYF572°Anthropic 正在大规模招募 1000 名自由职业软件工程师,专门用于训练其编程助手 Claude Code。每完成一个任务可获得 280 美元报酬,工程师们需要编写提示词、比对代码输出、测试模型的追问响应,并教会 Claude 真实开发者的工作方式。这一举措旨在提升 Claude Code 在真实编程场景中的表现,但也引发了关于 AI 可能取代部分编程工作的讨论。对于开发者而言,这既是参与前沿 AI 训练的机会,也反映了行业对高质量训练数据的需求。AI产品AnthropicClaude Code编程助手自由职业AI训练10 个信源在谈推荐理由:Anthropic 用真金白银请工程师教 Claude 写代码,做 AI 训练或编程工具的团队值得关注——这揭示了高质量训练数据的新模式,也暗示了未来编程工作的形态变化。原文
12:14IT之家(博客/媒体)精选三星在 2026 年台北国际电脑展上展示了全球首款 HBM5 内存,这是面向未来高性能计算和 AI 训练需求的第八代存储技术。HBM5 预计在 2029 年至 2031 年间推出市场,采用 2nm 基础裸片搭配 1c nm DRAM 的先进制造工艺。为应对超高功耗,HBM5 将采用浸没式冷却技术,直接将裸片和封装整体浸泡在冷却液中。性能方面,HBM5 将 I/O 通道提升至 4096-bit,以 16 层堆叠为标准,预期每个堆叠的带宽将提升至 4 TB/s。这一进展标志着存储技术向更高带宽和更低功耗迈出了重要一步。AI产品HBM5三星存储技术AI训练高性能计算推荐理由:HBM5 是 AI 训练和 HPC 场景的下一代关键存储技术,做 AI 基础设施或高性能计算的团队值得关注——三星提前展示原型,意味着未来几年的算力瓶颈有望被突破。原文
18:49rohanpaul_ai@rohanpaul_ai精选76°Amazon 发布了新型数据中心网络架构“Resilient Network Graphs”(RNG),用扁平随机图替代传统的胖树结构,将硬件需求降低 69%,吞吐量提升 33%。该设计自去年起已在 AWS 数据中心悄然部署,现已成为大多数 AWS 工作负载的默认网络。RNG 通过扁平化随机图连接路由器,提供多条独立路径,避免胖树网络的流量瓶颈问题。其路由系统 Spraypoint 将流量分散到多条路径,ShuffleBox 布线设备使随机连接变得可实施。实测显示,RNG 在性能上与胖树网络持平,但成本降低 9% 至 45%,尤其对 AI 集群的大规模同步训练流量有显著改善。行业数据中心网络AWSRNGAI训练网络架构推荐理由:AWS 用 RNG 解决了胖树网络的流量瓶颈,做 AI 训练和大规模云计算的团队可以直接受益——更少的硬件、更低的成本、更好的吞吐,值得点开了解工程细节。原文
17:35IT之家(博客/媒体)美国初创公司 Shift 在纽约市推出免费公寓清洁服务,专业清洁人员会全程佩戴设备录制第一视角视频。这些视频经匿名化处理后,将被授权用于训练 AI 和家用机器人,帮助它们学习日常家务操作。Shift 强调会模糊处理屏幕、身份证等个人信息,不会公开分享或出售给广告商。该公司计划未来在全球范围内扩展免费上门维修、修理和跑腿等服务,同样以录像为交换条件。AI产品数据采集家用机器人AI训练隐私保护Shift推荐理由:做机器人或 AI 家务训练的团队,终于有了真实世界数据获取的新路径——Shift 用免费服务换清洁录像,解决了数据稀缺和成本高的问题,值得关注其数据集授权模式。原文
16:20IT之家(博客/媒体)联想集团董事长杨元庆在财报沟通会上表示,AI基础设施正从训练向推理快速转移,目前70-80%的GPU服务器用于训练,未来将反转至70%用于推理、30%用于训练。他强调训练需求不会减少,但仅靠大型云服务商已无法满足需求。联想2026财年AI相关收入同比增长105%,占总营收33%,第四季度占比达38%。行业联想GPU服务器AI推理AI训练算力趋势推荐理由:杨元庆的预测揭示了AI算力市场的结构性拐点——推理需求将主导未来,做AI应用部署和基础设施规划的团队值得关注这一趋势,提前调整算力采购策略。原文
00:10小互@imxiaohu精选Midjourney创始人公开表示,团队因采用Google TPU进行训练,研究进度相比使用Nvidia GPU技术栈落后约一年。他称如果回到过去,会从一开始就全部使用Nvidia的方案。这一言论反映了大模型训练中硬件生态适配的隐蔽成本。行业MidjourneyGoogleTPUNvidiaGPUAI训练2 个信源在谈推荐理由:创始人亲述选错硬件的代价原文
13:36Weights & Biases@weights_biasesAndrej Karpathy 在社交媒体上发布了一条简短但引人深思的推文:“let there be descent”,引用自《创世纪》的“let there be light”变体。这条推文暗示了机器学习中梯度下降(descent)的核心地位,可能是在强调优化算法在AI训练中的根本作用。Karpathy 作为AI领域的重要人物,其言论常引发社区对基础概念的重新思考。这条推文可能是在鼓励开发者回归对优化本质的理解,而非追逐复杂模型。行业梯度下降KarpathyAI训练优化算法社区观点推荐理由:Karpathy 用一句话点醒了AI社区:别光顾着堆模型,梯度下降才是根本。做训练和优化的开发者看完会有感触,值得停下来想想。原文
12:33DeepSeek: GitHub 新仓库(资讯)精选DeepSeek AI开源了其分布式文件系统3FS。3FS专为AI训练与推理场景设计,利用SSD和RDMA网络实现高吞吐量。该系统采用无状态架构,支持数千台服务器并发读写。3FS在内部部署中已用于训练DeepSeek系列大模型。开源版本允许开发者自行部署和定制。AI产品3FSDeepSeek AI分布式文件系统存储系统AI训练推荐理由:DeepSeek开源的3FS文件系统原文