全部 AI 动态 · AI 热点

6月5日

19:19

marktechpost@Michal Sutter

Perplexity AI 发布了一款面向个人电脑的混合本地-服务器推理编排器，能够自动将 AI 任务在本地设备和云端模型之间进行路由。该编排器根据任务复杂度、延迟要求和隐私需求，智能选择最佳执行环境，从而优化性能和成本。这一创新解决了用户在使用 AI 应用时面临的本地算力不足与云端延迟之间的权衡问题。对于注重隐私或需要低延迟响应的用户，本地推理可优先处理敏感或简单任务；而复杂推理则自动切换至云端。Perplexity AI 的这一举措旨在提升个人电脑上 AI 助手的实用性和用户体验。

AI产品 Perplexity AI 混合推理本地-云端编排 AI 助手隐私优化

推荐理由：Perplexity AI 的混合编排器解决了本地与云端 AI 任务调度的痛点，让 PC 用户无需手动切换即可获得最佳性能与隐私平衡。做本地 AI 应用开发或重度使用 AI 助手的团队，值得关注这个自动路由方案。

原文

19:18

marktechpost@Asif Razzaq

NVIDIA 推出了 Dynamo Snapshot，这是一个基于 CRIU 和 cuda-checkpoint 工具的系统，用于在 Kubernetes 上对 vLLM 推理工作节点进行快照和恢复。该系统能够显著加速 AI 推理服务的启动时间，解决冷启动延迟问题。通过保存和恢复推理工作节点的状态，Dynamo Snapshot 使得在 Kubernetes 集群中快速扩缩容成为可能，尤其适用于需要频繁调整推理资源的场景。这一工具对于部署大规模 AI 推理服务的团队来说，可以提升资源利用率和响应速度。

AI产品 NVIDIA Dynamo Snapshot Kubernetes AI推理 CRIU

推荐理由：NVIDIA 用 CRIU 快照解决了 Kubernetes 上 AI 推理的冷启动痛点，做模型推理部署的团队可以直接用这个工具来加速扩缩容，值得关注。

原文

19:13

19:13IT之家（博客/媒体）

高通在2026汽车技术与合作峰会上宣布车端人工智能Claw生态计划，联合诚迈科技、斑马智能等企业，将骁龙数字底盘与智能体AI运行环境结合。该计划旨在解决汽车智能开发碎片化问题，提供从概念验证到量产的高效路径。核心能力包括全天候多模态感知、百亿参数大模型的车端实时运行、车规级安全架构及持续演进的AI生态系统。这标志着汽车从移动工具向智能伙伴的进化，AI智能体可直接部署于车端，实现情境理解与预判需求。

AI产品智能体智能座舱高通车端AI 多模态大模型

推荐理由：高通把智能体AI直接塞进车端，解决了座舱开发碎片化痛点，做车载系统或智能座舱的团队值得关注，这可能是量产落地的加速器。

原文

17:42

小互@imxiaohu

72°

Kimi 推出新产品 Kimi Work，定位为面向办公场景的 AI 工具，继承 Kimi Code 和 Kimi Agent 的核心能力，并打通金融、科研、法律等专业数据库。用户只需通过文字描述需求，Kimi Work 即可自动拆解任务、并行执行、调用工具、使用浏览器、创建文件夹，并交付文档、表格、PPT 等成果。最大亮点是支持同时调度 300 个 Agent 互相配合完成任务，无需终端或命令行操作。这标志着 AI 工具从编程辅助向通用办公自动化的重要转变。

AI产品 Kimi Work 办公自动化智能体 Agent 调度 AI 工具

推荐理由：Kimi Work 把 AI 从写代码拉到了写文档、做 PPT、查数据库的日常办公场景，300 个 Agent 并行干活对打工人来说是真解放双手，建议所有被重复性办公任务折磨的团队点开看看。

原文

17:13

AI SDK@aisdk

AI SDK 7 的 canary 版本引入了详细的步骤性能统计功能，包括步骤耗时、LLM 响应时间、首次输出时间、工具执行时间、每秒 token 数（多种变体）以及输出块之间的时间间隔。这些指标帮助开发者精确诊断和优化 AI 应用的性能瓶颈，提升用户体验。该功能目前处于 canary 阶段，值得关注。

AI产品 AI SDK 性能统计开发者工具 LLM 优化

推荐理由：做 AI 应用性能调优的开发者终于有了量化抓手——不用再靠猜来优化响应速度，建议直接试 canary 版本。

原文

16:20

16:20IT之家（博客/媒体）

MiniMax 因 M3 模型上线后切换 Token 计费方式未提前充分沟通而致歉，并公布了详细的订阅权益保护与档位迁移方案。M3 模型更大、更智能，需要更多算力，因此改用行业统一的 Token-Based 计量。为回馈用户，老用户无周限额权益保留，部分用户获赠额外额度，补偿积分有效期延长至一年。同时公布了 Plus、Max、Ultra 等档位的迁移细节，新增 Ultra 469 元重度档，并确保 M2.7 使用权益不缩水。

AI产品 MiniMax M3模型 Token计费订阅权益模型迁移

推荐理由：MiniMax 这次调整解决了老用户对计费变更的担忧，如果你是 MiniMax 的订阅用户，建议仔细查看自己的档位迁移方案，确保权益不受影响。

原文

16:14

16:14IT之家（博客/媒体）

NBA 中国与阿里巴巴合作，基于阿里千问大模型打造了首个官方大模型“NBA Chat”，已在“NBA 中国”App 上线。该模型结合篮球历史数据和球员深度分析进行微调，能为球迷提供智能问答服务，包括解读球员位置、得分等核心数据。后续还将升级 Agent 能力，支持战术拆解和赛后复盘。这是阿里巴巴成为 NBA 中国官方云计算与 AI 合作伙伴后的首个落地产品，展示了 AI 在体育领域的应用潜力。

AI产品阿里千问 NBA Chat 体育AI 智能问答 Agent

推荐理由：NBA 球迷终于有了官方 AI 助手，可以直接在 App 里问球员数据和战术分析，看球时遇到不懂的随时查，建议篮球迷点开体验。

原文

16:13

16:13IT之家（博客/媒体）

精选

江波龙在 2026 高通汽车技术与合作峰会上发布了车规级 UFS 4.1 存储产品，搭载自研 5nm 工艺 WM7400 主控。该产品顺序读写速度分别达 4200MB/s 和 4000MB/s，随机读写性能达 630K/750K IOPS，提供 128GB 至 512GB 容量。它符合 AEC-Q100 车规标准，工作温度覆盖 -40℃ 至 +105℃，并内置 RSA2048 加密引擎等安全功能。这标志着国产车规存储芯片在性能和可靠性上迈入新阶段，对智能汽车和自动驾驶领域意义重大。

AI产品车规级存储 UFS 4.1 5nm 主控江波龙智能汽车

推荐理由：车规级存储是智能驾驶和座舱系统的关键瓶颈，江波龙用 5nm 主控把性能拉到 UFS 4.1 级别，做车载电子或自动驾驶的团队值得关注这款国产替代方案。

原文

15:51

pandaily@contact@pandaily.com (Pandaily)

大疆在 Pocket 4P 发布前首次公开了其手持影像技术路线图，展示了未来几年在手持稳定器相机领域的技术规划。Pocket 4P 作为该系列的专业版，预计将搭载更先进的影像传感器和稳定系统，提升画质和拍摄体验。这一路线图表明大疆正加速布局消费级手持影像市场，为内容创作者和摄影爱好者提供更多专业级工具。

AI产品大疆 Pocket 4P 手持影像稳定器相机技术路线图

推荐理由：大疆首次公开手持影像技术路线图，做视频创作或旅行拍摄的团队可以提前了解 Pocket 4P 的技术方向，值得关注。

原文

15:48

pandaily@contact@pandaily.com (Pandaily)

精选

华为云在INSPIRE大会上宣布推出数十款AI新产品，涵盖基础设施、模型服务、企业智能体平台及行业解决方案。这些产品旨在降低AI应用门槛，加速企业数字化转型。关键发布包括升级的AI算力平台、预训练模型服务、以及面向金融、制造等行业的定制化AI方案。此举标志着华为云在AI领域的全面布局，为开发者与企业提供了从底层算力到上层应用的完整工具链。

AI产品华为云 AI产品企业智能体行业解决方案算力平台

推荐理由：华为云一口气推出数十款AI产品，从算力到行业方案全覆盖，做企业AI落地的团队可以直接评估这些工具能否降低自己的开发成本。

原文

15:30

15:30IT之家（博客/媒体）

78°

小米机器人团队在CVPR 2026 Workshops和ICRA 2026 WBC两大国际赛事中夺得双料冠军，且大幅领先第二名。在CVPR的RoboChallenge Track中，小米自研的WAM模型「my16」以40.89%成功率成为唯一突破40%门槛的模型，综合排名第一。该模型采用“S1/S2双系统+长短期记忆+跨本体预训练”架构，融合认知深度、执行精度和长程稳定性。在ICRA的WBC赛事中，小米机器人在超市场景下综合得分99.2分，整体成功率94%，领先第二名10个百分点。雷军表示，小米机器人的目标是让机器人真正走进物理世界，干实际的活。

AI产品小米机器人 WAM模型具身智能赛事冠军

推荐理由：小米机器人团队用自研WAM模型在两大顶级赛事中碾压对手，做具身智能的团队值得关注其“大小脑+长短期记忆”架构的实际效果。

原文

15:23

berryxia@berryxia

Locally AI 在被 LM Studio 收购后，迅速推出了移动手机版客户端，旨在让用户能在手机上更高效地运行本地大模型。这一动作体现了 AI 领域的快速迭代速度，但当前移动端本地模型运行场景仍未被充分挖掘，用户需求支持尚不完善。该客户端可能为开发者或 AI 爱好者提供更便捷的本地推理体验，但实际应用效果有待观察。

AI产品 LM Studio Locally AI 本地大模型移动客户端 AI 产品

推荐理由：LM Studio 收购后快速推出移动版，解决了本地大模型在手机端运行的需求，适合经常在移动设备上测试或使用 AI 模型的开发者和爱好者，建议关注其实际体验。

原文

15:12

AI Will@FinanceYF5

83°

Claude Platform 推出了终端功能，用户现在可以通过一个命令行界面调用API、启动智能体、上传文件、同步YAML以及检查运行状态。该终端还能与Claude Code配合使用，提升了开发者的操作效率。这一更新将AI开发中的多个分散任务整合到单一CLI中，减少了上下文切换，对使用Claude进行自动化工作的团队尤为实用。

AI产品 Claude 终端/CLI 智能体 API 开发者工具

推荐理由：Claude Platform 的终端功能把API调用、智能体管理和文件操作整合到一个CLI中，做AI自动化和Claude Code开发的团队可以直接提升效率，值得一试。

原文

15:00

15:00IT之家（博客/媒体）

英韧在COMPUTEX 2026展出CXL Type 3内存扩展设备主控IG5676，符合CXL 3.1规范，支持PCIe Gen6速度。该主控可搭配铠侠XL-FLASH作为存储级内存，经济高效地为系统扩展至多2TB内存空间。同时展出的常规PCIe Gen6 SSD主控IG5686采用×4接口，支持4800MT/s NAND，实现28GB/s顺序读取、22GB/s顺序写入、7M IOPS随机读取、5M IOPS随机写入，最大容量256TB，符合NVMe 2.3规范。

AI产品英韧 CXL 3.1 IG5676 SSD主控内存扩展

推荐理由：新主控能扩2TB内存，性能飙到28GB/s

原文

14:52

AI Will@FinanceYF5

Claude 平台新增终端功能，用户可通过命令行界面（CLI）完成 API 调用、启动智能代理、上传文件、同步 YAML 配置文件以及查看运行记录等操作。该功能整合了 Claude Code，使得开发者无需切换界面即可完成多项任务。此举大幅提升了 Claude 平台的可编程性和自动化能力，尤其适合需要频繁与模型交互的开发者。

AI产品 Claude 终端/CLI API 调用智能代理开发者工具

推荐理由：Claude 的终端功能让 API 调用和智能代理管理变得像敲命令一样简单，做自动化脚本或频繁调试的开发者可以直接在终端里搞定一切，省去来回切换界面的麻烦。

原文

14:43

14:43IT之家（博客/媒体）

据爆料人 MEGAsizeGPU 消息，英伟达已重新启动 GeForce RTX 50 系列 SUPER 中期更新计划。本次更新将包括一款 12GB 显存版本的 60 级产品，可能命名为 RTX 5060 12GB 或 RTX 5060 SUPER 12GB。爆料称英伟达已找到办法在存储危机中获取所需显存，并与 GPU 核心捆绑销售给合作伙伴。此外，RTX 5080/5070 Ti/5070 SUPER 的规格也已基本确认，显存容量和功耗均有提升。

AI产品英伟达 RTX 50 SUPER 显卡显存升级游戏硬件

推荐理由：英伟达重启 SUPER 计划意味着中端显卡用户将迎来显存升级，RTX 5060 12GB 版对游戏玩家和内容创作者是直接利好，建议关注后续发布节奏。

原文

14:42

14:42IT之家（博客/媒体）

精选

雷克沙推出 NM1090 PRO 8TB 固态硬盘，采用 PCIe 5.0 接口，顺序读取速度达 14400MB/s，写入 13400MB/s，配备 8GB 独立 DRAM 缓存和 8TB 海量空间。评测显示，该硬盘在空盘和 90% 填盘率下性能几乎无衰减，顺序写入稳定在 13455-13516MB/s，4K 随机性能优异，适合 AI 大模型加载、海量小文件处理等场景。其主控采用台积电 6nm 制程，功耗和发热控制优于竞品，解决了 PCIe 5.0 固态的散热瓶颈。对于需要处理 TB 级数据集的 AI 工作流用户，这款硬盘提供了稳定、高速的存储底座。

AI产品固态硬盘 PCIe 5.0 AI PC 存储雷克沙

推荐理由：AI 工作流中模型加载和数据集吞吐常被存储拖后腿，这款硬盘用 14400MB/s 读取和满盘不降速解决了痛点，做 AI 绘画、视频生成或大模型训练的团队值得关注，实测数据直接可用。

原文

14:12

Greg Brockman@gdb

OpenAI 宣布推出更强大的 ChatGPT 记忆系统，能够跨对话携带上下文并随时间保持有用性。这项改进旨在解决 AI 助手在长期对话中遗忘用户偏好和关键信息的问题。新记忆系统现已逐步向 ChatGPT 用户开放，将提升个性化体验和任务连续性。

AI产品 ChatGPT 记忆系统上下文个性化 OpenAI

推荐理由：ChatGPT 重度用户终于不用每次重复背景信息了——新记忆系统能跨对话记住你的偏好和上下文，做长期项目或频繁咨询的团队建议立刻体验。

原文

13:51

13:51IT之家（博客/媒体）

76°

谷歌 Magenta 团队发布 Magenta RealTime 2（MRT2），一款可在本地实时运行的 AI 音乐模型，支持与用户即兴合奏。MRT2 推出两种规模：24 亿参数的高质量模型 mrt2_base 和 2.3 亿参数的高速模型 mrt2_small，后者针对苹果 Apple Silicon 优化，可在 M1 及以上芯片的 Mac 上实时运行。相比前代，MRT2 将控制延迟从约 3 秒降至约 200 毫秒（降低至 1/15），采用逐帧生成（每帧 40 毫秒），更接近真实乐器演奏体验。模型支持文本、音频风格提示以及 MIDI 控制，并免费提供 Jam 应用和 DAW 插件。

AI产品实时音乐生成 Magenta RealTime 2 本地模型苹果 Apple Silicon DAW 插件

推荐理由：音乐创作者和 AI 爱好者终于有了能实时合奏的本地模型——延迟从 3 秒降到 200 毫秒，用 MacBook 就能跑，建议玩电子乐或编曲的人直接下载 Jam 试试。

原文

12:56

Justine Moore@venturetwins

76°

一位开发者分享了他的编程智能体在仅收到“just figure it out”这一条指令后，自主完成复杂编程任务的视频。该智能体没有收到任何具体步骤或提示，完全依靠自身推理和工具调用能力解决问题。这展示了当前AI智能体在自主性和任务理解上的显著进步，意味着未来开发者可能只需给出目标，AI就能独立完成编码工作。该视频在推特上引发关注，获得73个赞和近5000次浏览。

AI产品编程助手智能体自主性零指令任务分解

推荐理由：这展示了AI编程智能体自主性的新高度，做自动化开发或研究智能体的团队值得一看——零指令就能干活，意味着任务分解和工具调用能力已经接近实用。

原文

12:49

arXiv: OpenAI@Varun Aggarwal, Kay Kobak, John Howarter

精选

普渡大学暑期本科研究项目（SURF）每年收到数千份申请，传统人工评审耗时数周。研究人员开发了基于GPT-4o、GPT-5-mini和GPT-5.2的LLM工具，对1200份个人陈述进行结构化评分（六项子标准，0-3分）。GPT-5.2处理全部申请仅需4.6小时，平均每份14秒，且评分一致性最高。项目协调员结合LLM输出的分数和理由，在4小时内完成终审，而此前需要数周协调。该工具在低分申请上评分分歧较大，但整体显著缩短了评审周期。

AI产品 LLM应用教育/评审 GPT-5.2 自动化工作流普渡大学

推荐理由：高校行政人员或科研项目管理者终于有了可落地的AI用例——LLM自动评分+理由输出，把数周评审压缩到几小时，做大规模申请筛选的团队可以直接参考这套工作流。

原文

12:45

歸藏(guizang.ai)@op7418

精选

开发者歸藏分享在大型代码库中使用 Vibe Coding 的经验，指出文档体系已成为 AI 编程的核心 Harness（约束与引导框架）。在 CodePilot 项目中，文档占比达 21%，开发者无需直接修改代码即可修复所有已知 bug 并实现新功能。Claude Code 的 Plan 模式被废后，计划也以文档形式编写，文档管理成为关键。该实践表明，AI 协作下的文档梳理对大型代码库的 Vibe Coding 至关重要。

AI产品 Vibe Coding 文档即 Harness Claude Code CodePilot AI 编程实践

推荐理由：Vibe Coding 重度用户会发现文档才是真正的控制中枢——不用碰一行代码就能修 bug 加功能，做大型项目的团队值得借鉴这套文档即 Harness 的方法。

原文

11:58

歸藏(guizang.ai)@op7418

精选

开发者 op7418 分享了在大型代码库 CodePilot 中使用 Vibe Coding 的实践，指出文档体系对 AI 协作至关重要。自 Claude Code 的 Plan 模式废弃后，他转向以文档驱动开发，文档占代码比例达 21%。尽管从未手动修改代码，他仍能修复所有已知 bug 并实现新功能。重构原计划两周，实际耗时超过一个月三周。这一案例凸显了文档管理在 AI 辅助编程中的核心地位。

AI产品 Vibe Coding 文档体系 CodePilot AI 协作代码库管理

推荐理由：Vibe Coding 重度用户和大型代码库维护者会深有共鸣——文档不再是附属品，而是 AI 协作的命脉。看完这篇实践，你会重新审视自己的文档策略。

原文

11:46

AI Will@FinanceYF5

78°

Peter Yang 分享了如何通过创建自定义 AI Skill 来大幅节省时间，核心是将个人知识和审美编码为可复用的技能，让 AI 自动执行重复任务。他使用 Claude Code 现场演示了搭建过程，仅需 5 个步骤。这一方法适用于需要频繁处理特定类型任务的开发者或创作者，能显著提升效率。该技巧已在社交媒体上引发关注，展示了 AI 从工具向个性化助手演进的趋势。

AI产品 AI Skill Claude Code 效率工具自动化个性化

推荐理由：想省下每周重复劳动时间的开发者，可以学 Peter Yang 用 Claude Code 5 步造自己的 AI Skill，把个人经验变成自动化的生产力。

原文

11:33

11:33IT之家（博客/媒体）

精选

群联在 2026 台北国际电脑展上展示了首款 PCIe Gen6 SSD 主控 PS5303-X3-66，面向 AI 服务器与高速数据平台。该主控支持 PCIe Gen6x4、NVMe 2.3 和 OCP v2.6，最大容量达 2PB，顺序读写速度最高 28 GB/s，随机读写 IOPS 达 6800K。能效方面，每瓦可提供 4000 GB/s，功耗约 7W，兼顾高带宽与低功耗。群联还展出了首批采用该方案的 Pascari PCIe Gen6 SSD，提供 E3.2 与 E1.S 两种规格，搭载 SK 海力士 DRAM 模组。

AI产品群联 PCIe Gen6 SSD主控 AI服务器企业级存储

推荐理由：PCIe Gen6 主控将存储带宽翻倍，AI 训练和高速数据中心的存储瓶颈有望缓解，做服务器或存储方案的团队值得关注。

原文

11:18

11:18IT之家（博客/媒体）

精选

微软正在加速使用 Rust 语言改造 Windows 11 系统，其 GitHub 仓库 windows-rs 合并了 Windows Reactor 相关 PR，后者为 WinUI 构建面向 Rust 开发人员的 UI 库。微软在 Build 大会上指出，过去依赖 Electron、React Native 等方案导致内存占用高、启动慢、动画卡顿等问题，因此正重写 Windows 11 shell 核心部分，更多第一方功能将基于原生框架构建。新合并的 UI 库为原生桌面应用引入类似 React 的组件模型。微软工程师 Kenny Kerr 设计的 WinUI 相册应用对比显示，Rust 在构建时间、部署规模、打开窗口速度、内存占用和 CPU 时间上均优于 C#（JIT 和 PublishAOT）。

AI产品 Rust WinUI Windows 11 原生应用微软

推荐理由：Rust 改造 Win11 原生应用能显著提升性能和降低资源占用，Windows 桌面开发者值得关注这一趋势，未来开发效率和应用体验都可能受益。

原文

10:52

coderabbitai@coderabbitai

CodeRabbit 的 Slack Agent 新增了可视化生成功能，支持从 GitHub 流量、BigQuery 数据、Datadog 指标等来源创建图表、示意图或报告。用户可以在 Slack 线程中直接请求，支持即席查询或定时生成。这一功能将数据洞察直接嵌入团队协作流程，减少了切换工具的麻烦。对于依赖数据驱动决策的开发团队，这能显著提升效率。

AI产品 CodeRabbit Slack Agent 可视化数据报告开发工具

推荐理由：做数据分析和开发运维的团队，现在可以直接在 Slack 里问 CodeRabbit 要图表，省去打开多个工具的麻烦，建议试试定时报告功能。

原文

10:46

rohanpaul_ai@rohanpaul_ai

76°

OpenAI 为 ChatGPT 引入了一种名为“梦境”的新记忆系统，旨在更主动地跨对话保留用户偏好。与之前被动记录用户明确指令的“便签”式记忆不同，新系统会主动分析历史对话，提取仍有效的上下文，并更新已变化的信息，形成动态的用户画像。用户可查看并修正这一总结。此举显著提升了 ChatGPT 在依赖历史对话的查询中的事实召回能力，使助手能更贴近用户当前状态。

AI产品 ChatGPT 记忆系统用户偏好上下文理解 OpenAI

推荐理由：对于频繁使用 ChatGPT 处理复杂、长期任务的用户，这个“梦境”记忆系统解决了手动重复上下文的痛点，让对话更连贯、更智能，值得立即体验。

原文

10:42

shao__meng@shao__meng

Kai 在 X 上分享了过去一个月重构 Kimi Code 的疯狂经历，强调在 AI 编程时代，好的架构设计比以往更重要，能让 Agent 在可控范围内高效编码。他认为 Agent 不会替代所有程序员，而是让顶级程序员生产力提升 20 倍，同时淘汰能力不足者。团队采用封闭开发、随时吵架迭代架构的方式，极大提升了工程效率。Kai 还提到，代码质量正比于人类的注意力密度，集体主义优于个人英雄主义。

AI产品 Kimi Code AI编程架构设计团队协作生产力

推荐理由：Kai 的实战复盘戳中了 AI 编程时代的核心矛盾——Agent 不是替代所有人，而是放大顶级程序员的能力。做 AI 编程工具或团队管理的开发者，看完会对架构设计、团队协作和生产力边界有新的认知。

原文

10:00

Viking@vikingmute

网友发现了一个名为Sophon.at的AI信息聚合网站，它收集并展示了AI领域的论文、最新模型、Benchmark和排行榜，论文还支持在线直接阅读。网站还提供Feed订阅功能，方便用户追踪最新动态。Sophon一词源自《三体》中的智子，寓意智能与监控。该网站因其全面性和易用性受到关注，适合AI研究者和爱好者使用。

AI产品 AI聚合论文模型排行榜 Sophon

推荐理由：做AI研究或追踪前沿动态的人，这个网站能省去你到处找论文和模型的时间，论文直接在线看，还有排行榜和Feed订阅，建议收藏试试。

原文

09:55

09:55IT之家（博客/媒体）

精选72°

AMD 在 2026 台北国际电脑展上展示了其首个机架级 AI 平台 Helios，定位高端 AI 基础设施市场，直接对标英伟达的 NVL72 VR200。该平台搭载第 6 代 EPYC Venice 处理器（最多 256 核）和 72 颗 Instinct MI455X 加速器，配备 31TB HBM4 显存和 1400TB/s 带宽，FP4 稠密精度下理论算力达 2900 PFLOPS。虽然算力略逊于英伟达 VR200 NVL72，但 HBM4 显存容量更大，更适合大语言模型等显存密集型任务。互联方面采用 UALink-over-Ethernet，scale-up 带宽达 260TB/s，并配备支持 Ultra Ethernet 的 800GbE 网卡。首批方案由合作伙伴展示，计划 2026 年内供货。

AI产品 AMD Helios 机架级AI平台 HBM4 英伟达NVL72

推荐理由：AMD 终于拿出了机架级 AI 平台，显存容量优势对大模型训练团队很关键，做 AI 基础设施选型的值得关注。

原文

09:45

09:45IT之家（博客/媒体）

海尔在2026上海老博会上推出行业首套AI未来智慧养老解决方案，首次展出三大AI陪伴机器人：具身服务机器人、家务机器人和陪伴机器人。同时，海尔系统化推出失能人群解决方案，涵盖护理床、浴缸、康复机等产品。该方案还包含九大AI健康管理方案和五大居家场景方案，旨在解决老年人护理、洗浴、康复、出行等难题。

AI产品海尔智慧养老陪伴机器人失能人群 AI健康管理

推荐理由：海尔这套AI养老方案解决了老年人日常照护和失能人群的痛点，做养老产业或家庭照护的团队值得关注，可以直接参考其产品布局。

原文

09:44

09:44IT之家（博客/媒体）

精选

ENERMAX 在 COMPUTEX 2026 上展示了无泵一体式液冷散热器 PFA，采用液-气相变材料作为工质，通过蒸发吸热和蒸汽压力回流实现散热，无需水泵。该设计降低了机械复杂性和噪音，消除了传统 AIO 液冷的一大故障点。同时展出的还有 Cirrus MkII 浸没式两相液冷工作站，解热能力达 4500W，配备两张 RTX 5090 显卡。此外，Mariner WST 系列常规 AIO 液冷解热能力突破 730W，PF-II 120 风扇采用铝合金框架和 LCP 叶片。这些方案展示了液冷技术的创新方向，尤其适合高性能计算和静音需求场景。

AI产品散热器无泵液冷相变工质 ENERMAX COMPUTEX

推荐理由：无泵设计解决了传统液冷的水泵故障和噪音痛点，对追求静音和高可靠性的 PC 发烧友、工作站用户来说值得关注，建议看看具体原理和性能表现。

原文

09:34

Ate-a-Pi@svpino

精选

Lemma 推出 FARS（全自动研究系统）模式，通过四个专门智能体（构思、规划、实验、写作）实现端到端的 AI 研究自动化。该系统无需人类干预即可运行完整研究循环，从提出假设到撰写论文。FARS 通过共享文件系统协调智能体，支持并行运行多个研究线程，使单个研究者一周内能完成传统实验室一年的工作量。这有望彻底改变当前研究效率低下的现状，解决文献综述耗时、路径选择风险高等痛点。

AI产品多智能体系统自动化研究 Lemma FARS 假设验证

推荐理由：AI 研究者终于有了能并行跑假设验证的工具——FARS 把实验室一年的工作量压缩到一周，做学术或工业研究的团队可以直接用它加速探索。

原文

09:21

shao__meng@shao__meng

78°

OpenAI 发布了 ChatGPT 记忆系统的第三代版本 Dreaming V3，解决了大规模用户和跨年时间尺度下记忆的陈旧性、准确性与可扩展性问题。该系统通过后台自动从对话历史中提炼和更新用户画像，使 ChatGPT 从被动“记笔记”升级为主动“自主回忆”，例如自动将“用户七月要去新加坡”更新为“用户七月已去完新加坡”。相比前代，Dreaming V3 计算效率提升约 5 倍，覆盖 Free、Go、Plus、Pro 所有用户层级，并支持用户审阅和编辑记忆摘要。这一升级让 ChatGPT 在上下文承接、偏好遵守和时间动态更新三个维度上表现更佳，用户无需在新对话中重复介绍个人信息。

AI产品 ChatGPT 记忆系统 Dreaming V3 OpenAI 自主回忆

推荐理由：ChatGPT 记忆系统终于从“记笔记”进化到“自主回忆”，长期用户不用再反复交代背景，做多轮对话应用或依赖 AI 助手管理日常的团队值得体验。

原文

09:11

shao__meng@shao__meng

精选

OpenAI Codex 推出了面向 iOS / SwiftUI 开发的官方插件“Build iOS Apps”，允许开发者在 Codex 内直接查看和测试 iOS 应用、打开 SwiftUI previews 并对代码编辑进行热重载，无需频繁切换 Xcode 或模拟器。底层基于 XcodeBuildMCP 构建自动化工作流，支持构建、测试、模拟器运行、UI 检查、日志和调试器状态采集。该插件依赖两个开源项目：serve-sim（提供 streaming simulator 能力）和 SnapshotPreviews（提取 SwiftUI previews）。这标志着 AI 编程助手在 iOS 开发领域迈出了重要一步，实现了从发现项目到调试验证的完整闭环。

AI产品 Codex iOS开发 SwiftUI MCP/工具编程助手

推荐理由：iOS 开发者终于可以在 Codex 里完成从编码到预览的完整闭环，省去 Xcode 和模拟器之间来回切换的麻烦，做 SwiftUI 开发的团队建议直接试试这个插件。

原文

09:10

shao__meng@shao__meng

72°

Cursor 发布了名为「Canvases」的新功能，类似于 OpenAI Codex 的 Sites 功能，允许用户创建并发布应用（如仪表盘、报告、内部工具），并通过 URL 与团队分享。这一功能将 AI 编程从代码生成扩展到完整的产品交付闭环，包括设计、开发、测试、部署和运维。结合 Cursor 已有的 Coding、Design、Debug、Deploy 能力，它有望取代 Lovable、v0、bolt.new 等 AI 建站工具，成为一站式开发平台。对于需要快速构建内部工具或原型的前端和全栈开发者，这是一个值得关注的方向。

AI产品 Cursor Canvases AI 编程内部工具部署

推荐理由：Cursor 把 AI 编程的终点从代码拉到了可分享的 URL，做内部工具或原型的团队可以直接用 Canvases 替代多个建站工具，省去部署烦恼。

原文

09:09

shao__meng@shao__meng

83°

Anthropic 内部设计负责人 Meaghan 分享了团队已验证的 Claude Code 工作流，核心是让 AI 成为全流程协作者，而非仅代码工具。她演示了在 Excalidraw 上通过一句话 prompt 加功能，包括多方案生成、AI 自主选方案、自动开 PR 并附录屏。她强调 LLM 目前做不好设计，人必须留在审美与决策环中，同时将自动化扩展到非编码任务，如批量 UI 修复、代码审查和定时巡检。她还提出了三条组织级原则：自动化不限于写代码、人人都能 ship 不等于什么都该 ship、需要可扩展的质量治理。

AI产品 Claude Code AI 工作流设计自动化产品开发 Anthropic

推荐理由：Anthropic 内部设计负责人的真实工作流，把 Claude Code 从代码工具升级为全流程协作者，做产品、写代码、推 PR 一条龙。设计师、产品经理、工程师都能直接复制她的 prompt 结构和并行工作流，看完就能用。

原文

08:48

HeyGen@HeyGen_Official

Ratava 公司以 HeyGen 为核心构建了一个 AI 媒体代理，帮助企业快速制作社交媒体内容、活动营销视频、产品展示和客户沟通视频。通过利用 AI 视频技术，Ratava 能够以更快的速度扩展业务，并为客户提供更高质量的服务。这一案例展示了 AI 视频在内容营销领域的实际应用潜力，尤其适合需要大量视频内容的中小企业。

AI产品 AI视频内容营销 HeyGen 媒体代理企业服务

推荐理由：做内容营销或视频制作的团队可以看看——Ratava 用 HeyGen 把视频生产流程自动化了，效率提升明显，值得参考。

原文

08:45

@OpenAIDevs@OpenAIDevs

OpenAI 为 Codex 用户推出了个人主页功能，集中展示活动图、连续使用天数、累计 Token 数、单日峰值 Token 数以及常用功能（如插件和 /fast 模式）。该页面默认私密，用户可选择分享卡片。这一更新让开发者能更直观地追踪自己的使用习惯和效率，也方便在团队或社区中展示成果。

AI产品 Codex 个人主页活动追踪开发者工具 OpenAI

推荐理由：Codex 重度用户终于有了自己的数据仪表盘，做 AI 编程的开发者可以直观看到自己的使用轨迹，分享卡片也方便在社交平台展示成果，值得一试。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。