00:05berryxia@berryxia精选75°美光宣布与Anthropic签署多年期合作协议,涉及HBM、DRAM和SSD,双方将围绕Claude工作负载共同设计内存和存储架构。美光还参与了Anthropic的Series H融资,并在内部部署Claude。此合作使美光同时成为Anthropic的投资者、客户、供应商和合作伙伴,标志着AI基础设施垂直整合的新趋势。行业MicronAnthropicClaudeHBMAI基础设施10 个信源在谈推荐理由:美光不光卖内存给Anthropic,还投钱、用Claude、一起改硬件设计,这种全栈绑定挺有意思的。原文
17:27Together AI@togethercompute精选DeepCogito团队需要为其前沿推理模型实现低于500毫秒的首令牌时间,并支持每分钟1000+请求。Together AI提供了解决方案,满足了这一严苛的性能要求。DeepCogito团队分享了在创业公司时间线上构建前沿模型的经验。这展示了AI基础设施提供商如何帮助初创企业实现高性能推理。AI产品推理模型Together AIDeepCogito低延迟AI基础设施推荐理由:做推理模型部署的团队会关心这个案例——Together AI帮DeepCogito在创业节奏下实现了500ms首令牌延迟,值得点开看看他们怎么做到的。原文
23:47Milvus@milvusio精选Milvus 3.0 是该项目自启动以来最大的架构升级,支持直接在数据湖上索引和查询向量,并引入超越 top-K 搜索的查询引擎。今天(6月8日)的线上研讨会由核心维护者 Li Liu 和 Jiang Chen 主讲,内容包括 Milvus 3.0 架构、路线图、如何驱动 Zilliz Vector Lakebase,以及 15-20 分钟的 AMA 环节。该升级解决了向量数据库与数据湖割裂的问题,对构建大规模 AI 基础设施的团队意义重大。AI产品Milvus向量数据库数据湖ZillizAI基础设施推荐理由:做向量搜索或数据湖架构的开发者,这是 Milvus 3.0 架构升级的官方解读,直接听核心维护者讲设计思路和路线图,比看文档更高效。原文
07:48IT之家(博客/媒体)精选英伟达与SK海力士宣布多年期技术合作,共同研发面向AI工厂的下一代内存。SK海力士将为英伟达的Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台定制专用内存,并进入AI基础设施、个人AI及物理AI新市场。合作还包括SK海力士采用英伟达CUDA-X库、PhysicsNeMo框架加速芯片仿真,以及利用Omniverse和cuOpt构建晶圆厂数字孪生。该协议旨在满足高端内存延长开发周期的需求,确保内存供应跟上英伟达的AI基础设施路线图。行业英伟达SK海力士AI内存AI基础设施芯片制造1 个信源在谈推荐理由:AI基础设施的瓶颈之一就是内存,英伟达和SK海力士联手定制专用内存,做AI训练和推理的团队可以关注——这直接关系到下一代超级计算机和机器人平台的性能上限。原文
09:49pandaily@contact@pandaily.com (Pandaily)精选华为云在6月5日的INSPIRE大会上提出AI战略新方向:为国家级重点行业打造“Token工厂”,并明确表示不追求竞争对手看重的Token总量指标。周跃峰等高管强调,华为云将聚焦于工业、能源、政务等关键领域的深度AI应用,通过定制化模型和基础设施服务提升行业效率,而非单纯扩大Token生成规模。这一策略与许多云厂商追求大规模通用模型和Token流量的做法形成鲜明对比,反映了华为云对AI实用性和行业价值的侧重。此举可能重塑AI云服务市场的竞争格局,推动行业从“量”向“质”的转变。行业华为云Token工厂行业AIAI基础设施战略1 个信源在谈推荐理由:华为云放弃Token总量竞赛,转向为工业、政务等关键行业定制AI基础设施,做行业AI落地的团队可以看看这种务实路线是否更匹配自己的需求。原文
16:49rohanpaul_ai@rohanpaul_ai精选日本AI数据中心建设激增,GPU发热量五年翻倍,传统风冷已无法满足散热需求。液冷技术通过直接接触芯片的冷板带走热量,效率远超风冷,能处理更高热密度。富士电机、日本电产、三菱重工等日本企业正积极布局液冷系统。液冷虽安装成本高、需防漏设计,但能显著降低风扇能耗和温度波动。该技术正成为AI算力基础设施的关键组成部分。行业液冷数据中心GPU散热日本AI基础设施推荐理由:液冷是解决AI算力散热瓶颈的核心方案,做数据中心运维或GPU集群部署的团队值得关注。日本企业的技术路线可能影响全球供应链,建议点开了解具体方案。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……
17:10Milvus@milvusio精选大多数 AI 团队并非从零开始,已有对象存储、管道、日志等数据。向量搜索引入后,数据重力问题凸显。向量基础设施经历了三代演进:第一代向量数据库解决生产级低延迟语义检索;第二代向量湖将搜索靠近数据但不完整;第三代向量湖库(Vector Lakebase)结合生产级向量服务与湖原生存储及弹性计算,使在线搜索和离线 AI 数据操作基于同一数据源。Zilliz 推出的 Vector Lakebase 旨在让 AI 数据只存一次,多种方式使用。AI产品向量数据库Vector LakebaseZillizAI基础设施数据重力推荐理由:做 AI 基础设施的团队终于有了解决数据重力问题的思路——Zilliz 的 Vector Lakebase 让在线搜索和离线分析共用同一份数据,省去同步和索引过期的麻烦,值得关注。原文