OpenAI自研芯片亮相，Anthropic解禁在即

模型发布/更新

Model Releases

5 篇

Qwen发布Agent环境模拟器Qwen-AgentWorld，可模拟7种环境

X·KOLX：berryxia (@berryxia)原文 ↗

Qwen团队直接训练了一个语言世界模型Qwen-AgentWorld，核心目标是从头建模环境而非仅训练Agent行为。模型需预测终端输出、网页变化及代码执行后状态，而非单纯学习操作。利用该模型作为模拟器进行可控Sim RL，在某些任务上模拟训练的Agent性能甚至超过真实环境训练的Agent。此外，仅做环境预测的预训练能力可直接迁移到多轮Agent任务，在多个benchmark上取得显著提升，包括未见领域。Qwen开源了35B MoE版本及对应基准。

Gradium发布stt-translate和s2s-translate实时语音翻译模型，准确率和延迟超越GPT实时翻译

X·KOLX：marktechpost (@Asif Razzaq)原文 ↗

Gradium推出两个实时语音翻译模型stt-translate和s2s-translate，覆盖英语、法语、德语、西班牙语、葡萄牙语共20个语言对。模型采用双阶段架构，将传统三模型级联简化为两个：单次转录+翻译后连接Gradium TTS，通过单个双工WebSocket运行。据Gradium报告，该模型在准确性和延迟上优于gpt-realtime-translate和gemini-3.5-live-translate。模型还支持输出语音选择和语音克隆功能。

Tripo AI 发布 Project Eden，新世界模型先用地图再渲染

X·KOLX：Ate-a-Pi (@svpino)原文 ↗

Tripo AI 推出 Project Eden 世界模型，与传统逐帧预测方案不同，它先构建包含几何、物体位置等真实状态的地图，再根据地图生成画面。该架构解决了传统模型遗忘问题，物体离开视线后仍存在于地图中，并支持多人/智能体共存与编辑。公司刚完成两轮近 2 亿美元融资，将在 SIGGRAPH 2026 展示。

NVIDIA Metropolis VSS 3发布：自然语言搜索与摘要视频

X·KOLX：NVIDIA AI (@NVIDIAAI)原文 ↗

NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3，允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能，如搜索、摘要、警报、报告和片段审查。提供统一开源仓库，附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告，集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别，并取得 SOTA 性能。

Snowflake CEO称GLM-5.2以五分之一成本媲美Opus 4.7

X·KOLX：Decoder (@Matthias Bastian)原文 ↗

智谱AI的GLM-5.2在Snowflake的103项编程任务基准测试中，性能接近Claude Opus 4.7，但每输出token成本仅为后者的五分之一。不过GLM-5.2每任务消耗的token数量几乎是Opus 4.7的两倍。这一价格差异对Anthropic和OpenAI构成压力，可能影响西方AI实验室的估值。

产品发布/更新

Product

4 篇

OpenAI发布首款自研AI推理芯片Jalapeño

X·KOLX：berryxia (@berryxia)原文 ↗

OpenAI推出自研AI芯片Jalapeño，专用于推理（Inference）场景，设计制造仅用9个月，并由AI辅助完成。该芯片由Broadcom负责生产，目标是将推理成本降低约50%（Broadcom CEO原话）。早期性能数据显示，其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。

NVIDIA NeMo AutoModel 基于 Hugging Face Transformers v5 实现 MoE 训练加速 3.4-3.7 倍

X·KOLX：NVIDIA AI (@NVIDIAAI)原文 ↗

NVIDIA 发布了 NeMo AutoModel，基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核，仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分，专为大规模模型构建设计。

GPT-5.5 Instant更新：更风趣，理解意图更准

X·KOLX：Greg Brockman (@gdb)原文 ↗

OpenAI推出新版GPT-5.5 Instant，对话体验更风趣。模型能更好理解用户问题意图并动态调整回应。它处理复杂约束更可靠，购物和本地推荐也更实用。今天向付费用户开放，明天免费用户可用。

Notion 集成 Claude 智能体，可创建专用AI助手执行数据分析等任务

X·KOLX：Notion (@NotionHQ)原文 ↗

Notion 宣布在其平台中集成 Claude 智能体，允许用户创建定制化的 AI 助手。这些智能体可专门用于数据分析、编程、制作电子表格和幻灯片等任务。用户可以将智能体放置在共享任务板上，与团队成员一起协作。智能体之间能够链式工作、互相传递任务，实现24小时不间断自动运行。

行业动态

Industry

5 篇

Mirendil 获 2 亿美元种子轮融资，a16z 领投

X·KOLX：a16z (@a16z)原文 ↗

Mirendil AI 完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 联合领投，NVIDIA 参与投资。该公司正构建一个专精 AI 研发的自主系统，类似为研究设计的编码智能体，可自行控制 GPU 并循环执行科研与工程任务。创始团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。

Anthropic 与特朗普政府谈判 Fable 5 解禁，Tom Brown 取代 Amodei 成主要代表

X·KOLX：宝玉 (@dotey)原文 ↗

6月12日美国商务部以国家安全为由，对 Anthropic 的 Fable 5 和 Mythos 5 模型发布出口管制令，因亚马逊研究团队声称找到绕过安全护栏的方法。Anthropic 被迫关闭这两款模型，影响数亿用户。多轮谈判后，白宫态度转暖，原因之一是联合创始人 Tom Brown 取代了难以沟通的 Amodei。Tom Brown 是 GPT-3 首席工程师，目前负责计算基础设施。国会两党四名众议员要求商务部解释管制依据，回复截止 6 月 26 日。

英伟达黄仁勋：AI工厂时代来临，智能体与物理AI驱动增长

官方IT之家原文 ↗

英伟达CEO黄仁勋在6月24日股东大会上表示，AI产业已进入智能体AI阶段，物理AI将驱动下一轮增长。他称数据中心为AI工厂，强调企业需部署机器人、自动驾驶等物理AI系统。过去1年营收增长65%，营业利润增长60%，2026财年自由现金流超960亿美元。黄仁勋计划将50%自由现金流用于股票回购和分红。

Databricks 联合创始人谈为何前沿生态必须开放

X·KOLX：Latent.Space (@latentspacepod)原文 ↗

Databricks 联合创始人 Matei Zaharia 和 Reynold Xin 在播客中解释了公司为何切入企业智能体的基础设施层。他们介绍了 Omnigent 如何为编码智能体和自定义智能体创建共享框架。两人还讨论了 LTAP 和 Lakebase 如何重构操作型与分析型数据库的分离。此外，他们强调智能体安全需要上下文策略和支出控制，并认为未来软件的核心是让数据就绪并在此基础上运行智能体。

数据推翻 AI 取代论：工程师岗位成科技行业抗风险最强工种

官方IT之家原文 ↗

SignalFire 追踪超 8000 万家企业数据，2025 年工程岗位招聘降幅仅 11%，远低于科技行业整体 25% 的降幅。12 家头部科技巨头新入职员工中工程师占比从 2019 年的 46% 升至 2025 年的 55%。Anthropic CEO 曾预警 AI 将淘汰半数入门白领岗位，但该公司首席经济学家称未观测到显著冲击。英伟达 CEO 黄仁勋表示工程师因 AI 工具反而更忙碌，印证杰文斯悖论。

论文研究

Research

3 篇

‘思考即回忆’：推理如何解锁LLM参数化知识

官方Google Research: Blog原文 ↗

Google Research提出'Thinking to Recall'假设，认为链式思维（Chain-of-Thought）推理的本质是组合LLM参数中分散存储的知识片段。基于PaLM 2模型的实验显示，在GSM8K和MATH等数学推理基准上，推理步骤让模型更有效地调用习得的知识。该工作揭示了注意力机制在定位和整合参数化知识过程中的关键作用。

Eric Xing 新论文：Agent 是什么？从五维度定义自主性

X·KOLX：elvis (@omarsar0)原文 ↗

Eric Xing 等人在 arXiv（编号 2606.23991）发表论文，尝试界定 agent 与 agency 的边界。论文基于笛卡尔哲学和科幻作品，提出分析 agent 架构的五个维度：目标、身份、决策、自我调节和学习。作者认为真正的自主性要求这些结构以特定方式整合。该研究为区分简单的工具调用循环与真正的智能体提供了概念框架。

用Snowflake和Amazon Quick构建AI驱动的BI工作流

X·KOLX：AWS Machine Learning Blog (@Ying Wang)原文 ↗

本文教程演示如何将Snowflake语义视图与Amazon Quick集成，实现自然语言BI查询。通过加载S3中的电影评论数据到Snowflake，使用SQL定义语义视图，再通过Cortex Analyst进行自然语言查询。最后自动化生成Amazon Quick数据集和仪表板，使得BI团队能用自然语言访问受治理的数据层。整个过程可手动或通过脚本完成，确保响应反映一致业务逻辑。

技巧与观点

Tips & Takes

5 篇

今日事件

一手报道

新模型

信源

AITOP日报