全部 AI 动态 · AI 热点

6月27日

12:21

12:21IT之家（博客/媒体）

《纽约时报》于2023年12月首次起诉OpenAI，指其非法使用该报文章训练ChatGPT。最新诉状将矛头转向微软，指控其为OpenAI定制超算系统，专门爬取包括《纽约时报》在内的网络资源。该系统据称使用“几乎整个互联网”训练模型，并提高《纽约时报》内容权重。诉状还披露，ChatGPT可输出接近原文的多段文字，并帮助用户绕过付费墙。

行业纽约时报微软 OpenAI ChatGPT 版权 AI训练

推荐理由：《纽约时报》再出手，这次指控微软为OpenAI定制超算爬取内容，涉及版权和AI训练边界，值得关注。

原文

6月24日

13:24

13:24IT之家（博客/媒体）

73°

华为宣布在WAIC 2026（7月17日-20日）首次展出业界最大规模超节点Atlas 950 SuperPoD真机，该产品以单柜64卡为基本单元，最大支持8192张NPU卡高速互联。同时展出的还有Atlas 850E风冷超节点真机，采用升级的VCE散热技术，为Agentic推理提供高吞吐低时延体验。展区将展示昇腾AI基础软件开源开放，并集中呈现11大行业解决方案，覆盖互联网、运营商等领域。

AI产品华为 Atlas 950 SuperPoD 超节点 AI训练大模型

推荐理由：华为这次展出业界最大规模的Atlas 950 SuperPoD真机，单柜64卡、最高8192卡互联，专为万亿参数大模型训练打造，效率比传统集群大幅提升。

原文

6月23日

07:26

07:26IT之家（博客/媒体）

Meta 已暂停名为“模型能力计划（MCI）”的 AI 训练项目，该项目记录员工键盘敲击和鼠标操作轨迹。因数据泄露，包含员工私人对话、工作绩效数据在内的敏感信息被意外开放给全体员工查看。这是 Meta 在 2025 年 6 月继 3 月 AI 智能体擅自操作、本月黑客利用 AI 客服劫持 Instagram 账号后的又一起安全事件。

行业 Meta 数据泄露 AI训练内部监控企业安全

推荐理由：Meta 监控员工键盘鼠标的 AI 项目因数据泄露叫停了，之前还有两起AI安全事件，想了解来龙去脉可以看看。

原文

6月17日

08:40

Satya Nadella@satyanadella

71°

微软Azure在AI训练基准测试中创下新纪录，实现了史上最快的训练时间和最大的报告规模。这一里程碑得益于全栈创新，包括硅片、系统、网络和软件协同优化，以及与Nvidia的深度合作。Azure此次突破展示了其AI基础设施的最新进展。

行业 Azure Nvidia AI训练基准基础设施

推荐理由：Azure和Nvidia联手刷了个AI训练速度纪录，规模也是史上最大，搞AI基础设施的可以看看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

00:43

Decoder@Maximilian Schreiner

SpaceX 计划将数据中心送入太空，马斯克在 IPO 前将其描述为近乎微不足道的工程问题。首颗 AI 卫星的性能将相当于一台 Nvidia GB300 机架。然而，谷歌的研究表明，真正的 AI 训练需要大约 10,000 颗紧密耦合的卫星。这一构想旨在利用太空的太阳能和低温环境降低能耗，但技术挑战巨大。

行业 SpaceX 太空数据中心 AI训练卫星基础设施

推荐理由：SpaceX 的太空数据中心构想可能颠覆 AI 基础设施的能耗和部署模式，关注云计算和 AI 训练的工程师值得了解这一前沿方向。

原文

6月3日

14:41

14:41IT之家（博客/媒体）

Meta 公司收缩了其 MCI 员工追踪系统，新增最长 30 分钟的暂停功能和豁免申请机制。MCI 系统从 200 多个应用和网站收集员工鼠标移动、点击等操作，用于训练 AI 智能体。扎克伯格称员工智力水平高于承包商，但该系统因隐私和耗电问题遭到员工反对。Meta 副总裁表示团队仍相信隐私保护，但会进行多项优化。

行业 Meta AI训练员工监控隐私智能体

推荐理由：Meta 用员工操作数据训练 AI 的做法引发隐私争议，现在允许暂停和豁免，关注 AI 数据采集伦理的读者值得一看。

原文

14:15

AI Will@FinanceYF5

88°

Anthropic 正在使用 1000 名自由软件工程师来训练其编程助手 Claude Code。每位工程师每完成一个任务可获得 280 美元，任务包括编写提示词、比较代码、测试后续交互，以及向 Claude 展示真实开发者的工作方式。这一做法旨在提升 Claude Code 的代码生成质量和开发流程理解能力。消息引发讨论，有人担忧 AI 训练正在“烹饪”人类自身，即人类在帮助 AI 取代自己的岗位。

AI产品 Claude Code 编程助手 Anthropic AI训练自由工程师

推荐理由：Anthropic 用真实开发者训练 Claude Code，揭示了 AI 编程助手背后的数据来源和成本结构，做 AI 训练或关注编程工具演进的开发者值得了解——这直接关系到未来谁在写代码。

原文

14:12

AI Will@FinanceYF5

72°

Anthropic 正在大规模招募 1000 名自由职业软件工程师，专门用于训练其编程助手 Claude Code。每完成一个任务可获得 280 美元报酬，工程师们需要编写提示词、比对代码输出、测试模型的追问响应，并教会 Claude 真实开发者的工作方式。这一举措旨在提升 Claude Code 在真实编程场景中的表现，但也引发了关于 AI 可能取代部分编程工作的讨论。对于开发者而言，这既是参与前沿 AI 训练的机会，也反映了行业对高质量训练数据的需求。

AI产品 Anthropic Claude Code 编程助手自由职业 AI训练

推荐理由：Anthropic 用真金白银请工程师教 Claude 写代码，做 AI 训练或编程工具的团队值得关注——这揭示了高质量训练数据的新模式，也暗示了未来编程工作的形态变化。

原文

6月2日

12:14

12:14IT之家（博客/媒体）

精选

三星在 2026 年台北国际电脑展上展示了全球首款 HBM5 内存，这是面向未来高性能计算和 AI 训练需求的第八代存储技术。HBM5 预计在 2029 年至 2031 年间推出市场，采用 2nm 基础裸片搭配 1c nm DRAM 的先进制造工艺。为应对超高功耗，HBM5 将采用浸没式冷却技术，直接将裸片和封装整体浸泡在冷却液中。性能方面，HBM5 将 I/O 通道提升至 4096-bit，以 16 层堆叠为标准，预期每个堆叠的带宽将提升至 4 TB/s。这一进展标志着存储技术向更高带宽和更低功耗迈出了重要一步。

AI产品 HBM5 三星存储技术 AI训练高性能计算

推荐理由：HBM5 是 AI 训练和 HPC 场景的下一代关键存储技术，做 AI 基础设施或高性能计算的团队值得关注——三星提前展示原型，意味着未来几年的算力瓶颈有望被突破。

原文

5月30日

18:49

rohanpaul_ai@rohanpaul_ai

精选76°

Amazon 发布了新型数据中心网络架构“Resilient Network Graphs”（RNG），用扁平随机图替代传统的胖树结构，将硬件需求降低 69%，吞吐量提升 33%。该设计自去年起已在 AWS 数据中心悄然部署，现已成为大多数 AWS 工作负载的默认网络。RNG 通过扁平化随机图连接路由器，提供多条独立路径，避免胖树网络的流量瓶颈问题。其路由系统 Spraypoint 将流量分散到多条路径，ShuffleBox 布线设备使随机连接变得可实施。实测显示，RNG 在性能上与胖树网络持平，但成本降低 9% 至 45%，尤其对 AI 集群的大规模同步训练流量有显著改善。

行业数据中心网络 AWS RNG AI训练网络架构

推荐理由：AWS 用 RNG 解决了胖树网络的流量瓶颈，做 AI 训练和大规模云计算的团队可以直接受益——更少的硬件、更低的成本、更好的吞吐，值得点开了解工程细节。

原文

5月29日

17:35

17:35IT之家（博客/媒体）

美国初创公司 Shift 在纽约市推出免费公寓清洁服务，专业清洁人员会全程佩戴设备录制第一视角视频。这些视频经匿名化处理后，将被授权用于训练 AI 和家用机器人，帮助它们学习日常家务操作。Shift 强调会模糊处理屏幕、身份证等个人信息，不会公开分享或出售给广告商。该公司计划未来在全球范围内扩展免费上门维修、修理和跑腿等服务，同样以录像为交换条件。

AI产品数据采集家用机器人 AI训练隐私保护 Shift

推荐理由：做机器人或 AI 家务训练的团队，终于有了真实世界数据获取的新路径——Shift 用免费服务换清洁录像，解决了数据稀缺和成本高的问题，值得关注其数据集授权模式。

原文

5月22日

16:20

16:20IT之家（博客/媒体）

联想集团董事长杨元庆在财报沟通会上表示，AI基础设施正从训练向推理快速转移，目前70-80%的GPU服务器用于训练，未来将反转至70%用于推理、30%用于训练。他强调训练需求不会减少，但仅靠大型云服务商已无法满足需求。联想2026财年AI相关收入同比增长105%，占总营收33%，第四季度占比达38%。

行业联想 GPU服务器 AI推理 AI训练算力趋势

推荐理由：杨元庆的预测揭示了AI算力市场的结构性拐点——推理需求将主导未来，做AI应用部署和基础设施规划的团队值得关注这一趋势，提前调整算力采购策略。

原文

5月21日

00:10

小互@imxiaohu

精选

Midjourney创始人公开表示，团队因采用Google TPU进行训练，研究进度相比使用Nvidia GPU技术栈落后约一年。他称如果回到过去，会从一开始就全部使用Nvidia的方案。这一言论反映了大模型训练中硬件生态适配的隐蔽成本。

行业 Midjourney Google TPU Nvidia GPU AI训练

推荐理由：创始人亲述选错硬件的代价

原文

5月14日

13:36

Weights & Biases@weights_biases

Andrej Karpathy 在社交媒体上发布了一条简短但引人深思的推文：“let there be descent”，引用自《创世纪》的“let there be light”变体。这条推文暗示了机器学习中梯度下降（descent）的核心地位，可能是在强调优化算法在AI训练中的根本作用。Karpathy 作为AI领域的重要人物，其言论常引发社区对基础概念的重新思考。这条推文可能是在鼓励开发者回归对优化本质的理解，而非追逐复杂模型。

行业梯度下降 Karpathy AI训练优化算法社区观点

推荐理由：Karpathy 用一句话点醒了AI社区：别光顾着堆模型，梯度下降才是根本。做训练和优化的开发者看完会有感触，值得停下来想想。

原文

5月13日

12:33

12:33DeepSeek: GitHub 新仓库（资讯）

精选

DeepSeek AI开源了其分布式文件系统3FS。3FS专为AI训练与推理场景设计，利用SSD和RDMA网络实现高吞吐量。该系统采用无状态架构，支持数千台服务器并发读写。3FS在内部部署中已用于训练DeepSeek系列大模型。开源版本允许开发者自行部署和定制。

AI产品 3FS DeepSeek AI 分布式文件系统存储系统 AI训练

推荐理由：DeepSeek开源的3FS文件系统

原文