12:54Amazon Science@AmazonScience精选AWS 宣布其自研芯片 Graviton5 正式可用。该芯片采用四芯片架构,拥有 192 个核心,支持 DDR5-8800 内存和 PCIe Gen6。相比上一代 Graviton4,在通用计算和智能体 AI 工作负载上性能提升 25%。这标志着 AWS 在自研芯片领域的又一重要进展,为云端 AI 和通用计算提供了更强的基础设施选择。AI产品AWSGraviton5芯片云端计算AI 基础设施推荐理由:AWS 自研芯片的迭代直接关系到云端计算成本与性能,做 AI 推理或大规模部署的团队值得关注 Graviton5 的性价比提升。原文
12:29Mira Murati (TML)@miramurati前 OpenAI CTO Mira Murati 在 X 上发文感谢 NVIDIA CEO Jensen Huang 及其团队的支持,宣布双方合作部署至少 1GW 的 Vera Rubin 系统。该系统旨在将可适应的协作 AI 带给每个人,标志着 AI 基础设施的大规模扩展。Vera Rubin 是 NVIDIA 下一代 AI 计算平台,此次合作将显著提升 AI 训练和推理能力。行业NVIDIAVera RubinAI 基础设施合作Mira Murati10 个信源在谈推荐理由:AI 基础设施的规模化部署是行业关键瓶颈,关注算力布局的团队和开发者值得了解这一合作动向。原文
12:28Mira Murati (TML)@miramuratiThinking Machines 宣布与 Barret Zoph 分道扬镳,同时任命 Soumith Chintala 为新任 CTO。Chintala 是 AI 领域资深领导者,曾为 PyTorch 等开源项目做出重要贡献,过去十年持续推动 AI 发展。此次人事变动标志着公司战略方向的调整,Chintala 的加入可能带来技术路线和团队管理上的新变化。关注 AI 基础设施和开源生态的从业者值得留意后续动态。行业Thinking MachinesSoumith ChintalaCTO 任命AI 基础设施人事变动推荐理由:AI 基础设施领域的关键人事变动,做深度学习框架或关注开源生态的开发者值得关注——Soumith Chintala 的 CTO 任命可能影响 Thinking Machines 的技术走向。原文
11:50Epoch AI@EpochAIResearchEpoch AI Research 数据显示,AI 相关投资(数据中心建设、计算硬件和网络设备)在 2026 年第一季度约占美国 GDP 的 0.8%,推动整个计算基础设施占比达到约 1.5%。这一比例相比此前翻倍,反映了 AI 产业对经济的巨大拉动作用。投资主要集中在数据中心、GPU 等硬件和网络设备上,表明 AI 基础设施已成为经济增长的重要驱动力。行业AI 基础设施美国 GDP数据中心投资趋势Epoch AI推荐理由:AI 基础设施投资占 GDP 比例翻倍,说明 AI 产业正在重塑经济结构,关注宏观趋势的投资者和科技从业者值得了解这一信号。原文
05:59Y Combinator@ycombinatorAI 计算需求激增导致数据中心冷却成为瓶颈。初创公司 Ferveret 受核反应堆冷却技术启发,开发出新型冷却系统,比最先进的液体冷却性能提升 15%,同等功耗下可多生成 35% 的 tokens,且零水耗。该方案有望缓解数据中心能耗压力,推动 AI 基础设施可持续发展。行业数据中心冷却技术Ferveret能耗优化AI 基础设施推荐理由:数据中心冷却问题正制约 AI 算力扩展,Ferveret 的方案直接提升 token 产出效率,做 AI 基础设施或大模型部署的团队值得关注这一突破。原文
01:36Clement Delangue@ClementDelangue精选Hugging Face 宣布其存储平台已成为私有和公开模型及数据集的最佳选择,支持中间和最终版本。以 @heyjasperai 为例,他们使用 HF 存储桶存储 Monet 数据集并直接在其上训练模型。这展示了 HF 在 AI 存储和训练工作流中的一体化能力。对于需要管理大型模型和数据集的团队,HF 提供了便捷的存储和训练集成方案。AI产品Hugging Face存储平台数据集模型训练AI 基础设施推荐理由:Hugging Face 将存储与训练无缝集成,管理模型和数据集的团队可以直接在平台上完成从存储到训练的全流程,省去多平台切换的麻烦。原文
20:45NVIDIA AI@NVIDIAAINVIDIA 宣布与 Gcore 和 Orange Business 合作,基于 NVIDIA Dynamo 平台实现大规模分布式 AI 推理。该方案旨在解决高并发推理场景下的延迟和成本问题,通过分布式架构优化 GPU 利用率。合作方将共同为企业客户提供可扩展的推理基础设施,支持大模型在生产环境中的高效部署。此举标志着 NVIDIA 在 AI 推理领域从硬件向平台化生态的进一步延伸。AI产品NVIDIA Dynamo分布式推理GcoreOrange BusinessAI 基础设施9 个信源在谈推荐理由:分布式推理是当前大模型落地的关键瓶颈,NVIDIA 联合云服务商推出规模化方案,做 AI 部署和 MLOps 的团队值得关注,尤其是需要处理高并发推理的企业。原文
22:28PolymarketMoney@PolymarketMoney据报道,OpenAI 正与相关方洽谈租用俄亥俄州联邦土地上拟建的 10GW AI 数据中心园区。英伟达将提供硬件和财务担保,OpenAI 将签署 20 年租约运营该设施。此举标志着 AI 基础设施投资规模进一步扩大,可能推动美国 AI 算力布局。行业OpenAI数据中心英伟达AI 基础设施算力10 个信源在谈推荐理由:AI 基础设施投资进入新量级,关注算力布局的团队和投资者值得了解这一动向,它可能影响未来 AI 模型训练和部署的成本与效率。原文
17:26Together AI@togethercomputeTogether AI 宣布与云分销商 Pax8 合作,将高性能、低成本的 AI 基础设施和领先的开源模型带给全球中小企业。此举打破了 AI 资源被大公司垄断的局面,使中小企业也能利用先进的 AI 技术。合作将通过 Pax8 的渠道网络,让更多企业轻松获取 Together AI 的模型和服务。行业AI 基础设施开源模型中小企业Together AIPax8推荐理由:中小企业终于能低成本用上顶级 AI 基础设施,做技术选型或预算有限的团队可以直接关注。原文
21:18PolymarketMoney@PolymarketMoneyBroadcom(AVGO)联合 Apollo(APO)和 Blackstone(BX)推出了 AI XPV 平台,目标是在 2028 年前部署超过 20GW 的 AI 计算容量。该平台的首笔 350 亿美元资金将用于资助 Anthropic 建设超过 1GW 的 AI 基础设施,采用 Broadcom 的 XPU 和网络技术。这一合作标志着大型科技公司与私募资本在 AI 基础设施领域的深度整合,旨在加速大规模 AI 算力的部署。行业AI 基础设施算力部署BroadcomAnthropic私募资本10 个信源在谈推荐理由:这标志着 AI 基础设施从科技巨头自建转向资本化平台模式,关注算力投资和 AI 基础设施的团队值得了解这一趋势。原文
06:38rohanpaul_ai@rohanpaul_ai据 WSJ 报道,OpenAI 已秘密提交 IPO 文件,启动上市流程。此举允许 OpenAI 在不公开收入、亏损、客户构成等敏感数据的情况下,与 SEC 进行初步审查。此前 Anthropic 也已秘密提交 IPO 文件。这表明 AI 实验室之间的竞争已从模型能力扩展到资本层面,各方正为下一代 AI 基础设施融资。行业OpenAIIPO资本竞赛AnthropicAI 基础设施10 个信源在谈推荐理由:AI 实验室的竞争正式进入资本赛段,关注 AI 投资或行业格局的读者值得了解——这决定了未来谁有资源建更大模型。原文
18:42Julien Chaumond@julien_cCoinbase CEO Brian Armstrong 在 X 上分享了对模型路由趋势的看法,认为对智能的需求近乎无限,但未来 12-18 个月内,80% 的工作负载将运行在便宜 99% 的模型上,仅 20% 需要最新高端模型。他类比高端 MacBook 或游戏 PC 的配置比例,指出价格下降速度远超摩尔定律,因此瓶颈将是能源和算力而非模型本身。Coinbase 正积极将提示路由到更便宜的模型,在 token 使用量指数增长的同时保持成本基本持平。行业模型路由成本优化CoinbaseAI 基础设施行业趋势推荐理由:做 AI 应用或负责成本优化的团队,这条关于模型路由的洞察直接关系到你的预算和架构选择——Coinbase 已经验证了在 token 使用暴增时成本可控的路径,值得参考。原文
13:30Jerry Liu@jerryjliu0精选Jerry Liu(LlamaIndex 创始人)认为,AI 创业公司将在“模型路由即服务”领域积累大量价值,这不仅是 OpenRouter 这样的通用路由,还包括垂直化的智能体和基础设施。他以文档基础设施(解析、提取、搜索)和网络搜索(Exa/Parallel)为例,说明在准确性与成本的帕累托曲线上找到最佳点既重要又困难。Brian Armstrong 补充说,未来 80% 的工作负载将运行在便宜 99% 的模型上,只有 20% 需要最新高端模型,而 Coinbase 已通过路由提示词到更便宜的模型来保持成本稳定。这揭示了模型路由作为降低 AI 应用成本、提升效率的关键基础设施,对开发者和创业公司是巨大机会。行业模型路由AI 基础设施成本优化智能体OpenRouter推荐理由:模型路由是 AI 应用降本增效的关键,做 AI 产品、智能体或基础设施的团队值得关注——它可能成为下一个像 API 网关一样的基础设施层。原文
05:50rohanpaul_ai@rohanpaul_aiAnthropic 此前承诺每月向 SpaceX 支付 12.5 亿美元用于 GPU 算力,加上 Google 新披露的每月 9.2 亿美元云合同,两家 AI 实验室合计每月支付 21.7 亿美元,年化收入达 260 亿美元。Google 在 2015 年以约 9 亿美元投资 SpaceX 获得约 7% 股份,如今 SpaceX 目标 IPO 估值 1.75 万亿美元,Google 持股价值约 870-1070 亿美元,回报率高达 97-119 倍。这笔交易不仅体现了 AI 算力需求的爆发,也凸显了 SpaceX 从卫星互联网到发射主导权再到 AI 算力合同的业务转型。行业算力AnthropicGoogleSpaceXAI 基础设施10 个信源在谈推荐理由:AI 算力军备竞赛的账单终于公开了——做 AI 基础设施或云计算的从业者,看完这个数字会重新理解算力定价和供应链格局。原文
01:33Latent.Space@latentspacepod76°OpenAI 的 Sam Altman 在播客中分享了 AI 扩展的惊人数据:6 年前全球最高 token 使用量是每月 10 万,现在中位数已达到这个水平,而最高使用量超过每月 1000 亿,增长了 100 万倍。他认为未来还有 100 万倍的增长空间,全球平均使用量将达到每月 1000 亿 token。这引发了对所需基础设施的思考,对 AI 行业的发展方向有重要启示。行业OpenAISam Altman扩展挑战token 使用量AI 基础设施10 个信源在谈推荐理由:Sam Altman 用 100 万倍增长数据揭示了 AI 扩展的真实节奏,做 AI 基础设施或大模型应用的团队值得关注未来对算力和架构的需求。原文
05:03rohanpaul_ai@rohanpaul_ai在微软 Build 2026 主题演讲中,CEO Satya Nadella 介绍了 Fairwater 数据中心,这是一座垂直设计的两层 AI 超级工厂。与传统平面布局不同,该架构在三维空间内密集部署 GPU 机架,同时保持高速网络连接,使集群更像一台巨型 AI 机器,GPU 间延迟低、带宽高。其冷却系统一次注水后几乎零耗水运行,年用水量仅相当于一家餐厅的日均用水量。这标志着 AI 基础设施从水平扩展向垂直密集化的重要转变。AI产品微软数据中心AI 基础设施GPU 集群冷却效率推荐理由:微软把数据中心从平房盖成了楼房,GPU 密度和能效都上了一个台阶——做 AI 训练和推理的团队,这个架构会直接影响未来算力成本和部署方式,值得关注。原文
16:55rohanpaul_ai@rohanpaul_aiAlphabet 宣布将通过多种方式筹集 800 亿美元,用于 AI 基础设施投资,其中巴菲特旗下伯克希尔哈撒韦投资 100 亿美元。这表明 AI 发展的瓶颈已从需求、模型或产品转向算力供应。Alphabet 的筹资方式包括承销股票、强制可转换优先股、伯克希尔私募以及 400 亿美元的 ATM 计划。伯克希尔的参与为此次筹资提供了耐心资本的背书,凸显了 AI 基础设施投资正从软件式回报转向类似铁路、电网等重资产模式。行业AI 基础设施算力Alphabet巴菲特投资4 个信源在谈推荐理由:AI 算力成为新瓶颈,Alphabet 的 800 亿融资和巴菲特入场,说明基础设施投资逻辑变了——做 AI 基础设施或关注资本流向的投资者值得关注。原文
03:52rohanpaul_ai@rohanpaul_aiAnthropic 在最新 H 轮融资中筹集 650 亿美元,投后估值高达 9650 亿美元,较三个月前的 3800 亿估值暴涨 154%。Claude 年化收入突破 470 亿美元。本轮由 Altimeter Capital、红杉资本等联合领投,三星、SK 海力士、美光作为战略基础设施合作伙伴加入,其中 150 亿美元来自此前超大规模云厂商承诺,包括亚马逊 4 月宣布的 50 亿美元投资。相比之下,OpenAI 在 3 月以 8520 亿美元估值完成 1220 亿美元融资。行业Anthropic融资估值ClaudeAI 基础设施10 个信源在谈推荐理由:Anthropic 估值三个月翻倍,AI 军备竞赛进入新阶段——关注 AI 基础设施和模型竞争的投资者、创业者、开发者值得点开,看看资本如何押注下一代 AI 巨头。原文
10:23小互@imxiaohuOpenRouter 宣布完成 1.13 亿美元 B 轮融资,由 CapitalG 领投。过去 6 个月,其每周 Token 交易量从 5T 增长到 25T,增长 5 倍。这表明 AI 正从实验阶段快速进入生产部署,Token 中转分发成为一门大生意。OpenRouter 作为模型 API 聚合平台,为开发者提供统一接口访问多种模型,本轮融资将用于扩展基础设施和生态建设。行业OpenRouter融资模型 APIToken 经济AI 基础设施1 个信源在谈推荐理由:做 AI 应用开发的团队值得关注——OpenRouter 的增长证明了模型 API 聚合模式正在成为基础设施,用多模型调用的团队可以直接受益于其规模和稳定性提升。原文
10:16Replit@ReplitReplit 被风险投资公司 Redpoint 列入其 2026 年 InfraRed 100 榜单,该榜单旨在评选构建 AI 基础设施的公司。Replit 与 Stripe、Snowflake 和 HashiCorp 等知名企业一同入选,标志着其在 AI 开发平台领域的地位得到认可。Replit 团队将这一荣誉归功于在其平台上进行构建的开发者社区。行业ReplitAI 基础设施开发者平台Redpoint行业榜单1 个信源在谈推荐理由:Replit 入选 InfraRed 100 意味着其 AI 开发平台被顶级风投视为基础设施级产品,做 AI 应用开发的团队可以借此判断平台长期稳定性,值得关注。原文
13:03AI Will@FinanceYF5Meta 正在调整内部架构,重点围绕 AI 基础设施、基础模型和 AI 商业化进行重组。此举不仅是为了削减成本,更是为了将更多人力投入到模型训练系统搭建、模型研发以及将模型转化为收入的产品开发中。这表明 Meta 正在加速 AI 战略转型,从成本优化转向以 AI 为核心的增长模式。对于关注 AI 行业动态的读者来说,这是理解 Meta 未来方向的关键信号。行业MetaAI 基础设施基础模型AI 商业化架构重组推荐理由:Meta 的架构调整揭示了 AI 巨头的资源流向——模型训练和商业化是核心,做 AI 基础设施或模型开发的团队值得关注这一趋势,思考如何对齐。原文
12:28AI Will@FinanceYF5YC 表示其关注重点已从“AI 应用”转向 AI 如何深入农业、医疗、国防、芯片、供应链和太空工业等实体领域。这意味着下一批成功的 AI 公司可能不再是传统的 SaaS 模式,而是更像新型基础设施公司。这一转变反映了 AI 行业正从消费级应用向产业级、硬科技方向演进,投资风向也随之改变。行业YCAI 基础设施产业 AI投资风向硬科技推荐理由:YC 的转向信号对创业者和投资人至关重要——如果你在找下一个风口,农业、医疗、国防等领域的 AI 基础设施化值得重点关注。原文
14:56Cohere@cohere精选Cohere 发布了新模型 Command A+,该模型针对 NVIDIA Blackwell 架构进行了优化,并使用了 NVIDIA CUDA-X 库进行训练。NVIDIA AI 基础设施团队公开祝贺,强调了双方在 AI 基础设施上的紧密合作。这一合作意味着 Command A+ 将充分利用 NVIDIA 最新硬件的性能,为企业和开发者提供更高效的 AI 推理能力。AI模型CohereCommand A+NVIDIA BlackwellAI 基础设施模型优化推荐理由:Cohere 与 NVIDIA 的深度合作让 Command A+ 在 Blackwell 上跑出最佳性能,做企业级 AI 部署的团队值得关注这个新选择。原文
22:45rohanpaul_ai@rohanpaul_aiOpenAI 联合创始人 Greg Brockman 在播客中解释,公众对 AI 数据中心用水量的批评部分基于误解。他指出,现代数据中心大多采用闭环冷却系统,水在密封管道中循环使用,而非像传统冷却塔那样持续消耗新水。关键区别在于“取水量”与“消耗量”:一个数据中心可能储存大量水,但日常新水补充量远低于公众想象。OpenAI 在 Stargate 项目的官方博客中也证实,其阿比林站点每栋建筑的初始注水量约等于两个奥运泳池,但满负荷运行后全年用水量仅相当于一栋中型办公楼或四个普通家庭。Brockman 强调,AI 基础设施并非没有资源成本,但公众讨论常混淆不同冷却设计,导致对用水量的误判。行业AI 基础设施数据中心用水争议闭环冷却OpenAI10 个信源在谈推荐理由:Brockman 用通俗比喻(密封泳池 vs 水龙头)拆解了 AI 数据中心的真实用水逻辑,关心 AI 环境影响或基础设施成本的读者值得一看,能帮你避开常见的舆论误区。原文
08:00rohanpaul_ai@rohanpaul_aiVelobase 开源了其 AI SaaS 框架 Harness,揭示了产品并非真正护城河,而是将用户转化为收入的基础设施。该框架填补了从工作应用向付费业务转变的关键缺失层,包含服务器端广告归因、基于使用量的积分、多币种计费、双重记账联盟账本、退款追回、USDT 提现、A/B 邮件活动、双提供商故障切换、PostHog 分析、支付以及 11 个 BullMQ 工作进程。AI产品开源/仓库SaaS 框架计费系统AI 基础设施Velobase推荐理由:做 AI SaaS 的团队终于有了现成的商业化基础设施——Velobase Harness 把计费、归因、退款等麻烦事打包开源,省去自己造轮子的时间,建议直接拿来用。原文
14:10歸藏(guizang.ai)@op741883°英伟达开始交付其首款自研通用 CPU NVIDIA Vera,专为高并发、高吞吐的 Agent 编排和工具调用场景设计。该 CPU 负责调度编排和工具调用,而模型推理仍在 GPU 上进行,旨在解决密集 Agent 工作下的强 IO、内存和调度压力。首批交付对象包括 Anthropic、OpenAI、xAI 和 Oracle Cloud,其中 xAI 由马斯克亲自接待。这标志着英伟达从 GPU 向 CPU 领域扩展,为 Agentic AI 时代提供专用硬件。AI产品英伟达Vera CPUAgent 编排硬件交付AI 基础设施10 个信源在谈推荐理由:做 Agent 编排和工具调用的团队终于有了专用 CPU——Vera 专治高并发调度瓶颈,Anthropic、OpenAI 已经拿到手,搞 AI 基础设施的开发者值得关注。原文
14:57AI Will@FinanceYF5a16z 最新图表显示,内存(Memory)的利润增速已跃居 AI 基础设施最前列,老牌存储厂商股价从多年横盘转为垂直上升。这表明 AI 时代正在重新定价稀缺资源,内存成为新的瓶颈。对于关注 AI 基础设施投资和硬件趋势的读者,这一变化意味着存储行业可能迎来长期增长。行业AI 基础设施内存存储a16z利润增速推荐理由:a16z 的数据揭示了 AI 基础设施的利润正在向内存转移,做硬件投资或关注 AI 算力瓶颈的读者,值得看看这张图背后的趋势。原文
15:23rohanpaul_ai@rohanpaul_ai微软 CEO Satya Nadella 在最新发言中提出了 AI 时代的新衡量标准:“每美元每瓦特的 Token”(Tokens per Dollar per Watt),强调效率而非单纯算力。他认为这一公式适用于所有公司、行业和国家,并指出核心在于基础设施、基础设施和基础设施。这反映了 AI 产业从追求规模转向关注成本与能效的趋势,对云服务商和 AI 开发者有重要指导意义。行业AI 基础设施成本效率微软Satya Nadella行业趋势推荐理由:Nadella 提出的新公式直击 AI 落地的成本与能效痛点,做 AI 基础设施或模型部署的团队值得关注,这可能是未来优化方向的信号。原文
19:15阿里云 Alibaba Cloud@alibaba_cloud阿里云与 TiDB 联合举办的 AI 创新之夜活动将于一周后举行,目前席位已接近满额。活动聚焦智能体 AI、AI 就绪数据基础设施、实际部署策略及可衡量 ROI,旨在帮助企业将 AI 愿景转化为商业影响。参与者可与行业领袖交流,并享受晚餐、饮品及惊喜环节。活动注册链接已开放,适合关注企业级 AI 落地的从业者。行业阿里云TiDB智能体AI 基础设施企业 AI 落地推荐理由:企业 AI 落地从概念到 ROI 的实战经验分享,做数据基础设施和智能体部署的团队值得关注,还能与行业领袖面对面交流。原文
07:09Together AI@togethercomputeTogether AI 研究团队将有七篇论文在 MLSys 2026 会议上发表,展示从研究到生产的 AI 原生云平台成果。这些论文涵盖 AI 系统优化、模型部署效率等关键领域,体现了 Together AI 在 AI 基础设施方面的技术积累。MLSys 是机器学习系统领域的顶级会议,入选多篇论文说明其技术实力获得学术界认可。行业MLSys 2026AI 基础设施系统优化模型部署Together AI推荐理由:做 AI 基础设施和模型部署的团队值得关注——Together AI 这七篇论文覆盖了从研究到落地的关键环节,能帮你了解当前 AI 系统优化的前沿方向。原文