VOL.2026.06.25·69 STORIES·AITOP DAILY

AITOP日报

二〇二六年六月二十五日 星期四DAILY · 每早八时
01

模型发布/更新

Model Releases
5

Qwen发布Agent环境模拟器Qwen-AgentWorld,可模拟7种环境

X·KOLX:berryxia (@berryxia)原文 ↗

Qwen团队直接训练了一个语言世界模型Qwen-AgentWorld,核心目标是从头建模环境而非仅训练Agent行为。模型需预测终端输出、网页变化及代码执行后状态,而非单纯学习操作。利用该模型作为模拟器进行可控Sim RL,在某些任务上模拟训练的Agent性能甚至超过真实环境训练的Agent。此外,仅做环境预测的预训练能力可直接迁移到多轮Agent任务,在多个benchmark上取得显著提升,包括未见领域。Qwen开源了35B MoE版本及对应基准。

Gradium发布stt-translate和s2s-translate实时语音翻译模型,准确率和延迟超越GPT实时翻译

X·KOLX:marktechpost (@Asif Razzaq)原文 ↗

Gradium推出两个实时语音翻译模型stt-translate和s2s-translate,覆盖英语、法语、德语、西班牙语、葡萄牙语共20个语言对。模型采用双阶段架构,将传统三模型级联简化为两个:单次转录+翻译后连接Gradium TTS,通过单个双工WebSocket运行。据Gradium报告,该模型在准确性和延迟上优于gpt-realtime-translate和gemini-3.5-live-translate。模型还支持输出语音选择和语音克隆功能。

NVIDIA Metropolis VSS 3发布:自然语言搜索与摘要视频

X·KOLX:NVIDIA AI (@NVIDIAAI)原文 ↗

NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3,允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能,如搜索、摘要、警报、报告和片段审查。提供统一开源仓库,附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告,集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别,并取得 SOTA 性能。

02

产品发布/更新

Product
4

NVIDIA NeMo AutoModel 基于 Hugging Face Transformers v5 实现 MoE 训练加速 3.4-3.7 倍

X·KOLX:NVIDIA AI (@NVIDIAAI)原文 ↗

NVIDIA 发布了 NeMo AutoModel,基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核,仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分,专为大规模模型构建设计。

03

行业动态

Industry
5

Anthropic 与特朗普政府谈判 Fable 5 解禁,Tom Brown 取代 Amodei 成主要代表

X·KOLX:宝玉 (@dotey)原文 ↗

6月12日美国商务部以国家安全为由,对 Anthropic 的 Fable 5 和 Mythos 5 模型发布出口管制令,因亚马逊研究团队声称找到绕过安全护栏的方法。Anthropic 被迫关闭这两款模型,影响数亿用户。多轮谈判后,白宫态度转暖,原因之一是联合创始人 Tom Brown 取代了难以沟通的 Amodei。Tom Brown 是 GPT-3 首席工程师,目前负责计算基础设施。国会两党四名众议员要求商务部解释管制依据,回复截止 6 月 26 日。

Databricks 联合创始人谈为何前沿生态必须开放

X·KOLX:Latent.Space (@latentspacepod)原文 ↗

Databricks 联合创始人 Matei Zaharia 和 Reynold Xin 在播客中解释了公司为何切入企业智能体的基础设施层。他们介绍了 Omnigent 如何为编码智能体和自定义智能体创建共享框架。两人还讨论了 LTAP 和 Lakebase 如何重构操作型与分析型数据库的分离。此外,他们强调智能体安全需要上下文策略和支出控制,并认为未来软件的核心是让数据就绪并在此基础上运行智能体。

数据推翻 AI 取代论:工程师岗位成科技行业抗风险最强工种

官方IT之家原文 ↗

SignalFire 追踪超 8000 万家企业数据,2025 年工程岗位招聘降幅仅 11%,远低于科技行业整体 25% 的降幅。12 家头部科技巨头新入职员工中工程师占比从 2019 年的 46% 升至 2025 年的 55%。Anthropic CEO 曾预警 AI 将淘汰半数入门白领岗位,但该公司首席经济学家称未观测到显著冲击。英伟达 CEO 黄仁勋表示工程师因 AI 工具反而更忙碌,印证杰文斯悖论。

04

论文研究

Research
3

Eric Xing 新论文:Agent 是什么?从五维度定义自主性

X·KOLX:elvis (@omarsar0)原文 ↗

Eric Xing 等人在 arXiv(编号 2606.23991)发表论文,尝试界定 agent 与 agency 的边界。论文基于笛卡尔哲学和科幻作品,提出分析 agent 架构的五个维度:目标、身份、决策、自我调节和学习。作者认为真正的自主性要求这些结构以特定方式整合。该研究为区分简单的工具调用循环与真正的智能体提供了概念框架。

用Snowflake和Amazon Quick构建AI驱动的BI工作流

X·KOLX:AWS Machine Learning Blog (@Ying Wang)原文 ↗

本文教程演示如何将Snowflake语义视图与Amazon Quick集成,实现自然语言BI查询。通过加载S3中的电影评论数据到Snowflake,使用SQL定义语义视图,再通过Cortex Analyst进行自然语言查询。最后自动化生成Amazon Quick数据集和仪表板,使得BI团队能用自然语言访问受治理的数据层。整个过程可手动或通过脚本完成,确保响应反映一致业务逻辑。

05

技巧与观点

Tips & Takes
5

如何设计一个OpenHarness风格的智能体运行时:工具、内存、权限等

X·KOLX:marktechpost (@Sana Hassan)原文 ↗

本文手把手教你从零搭建一个OpenHarness风格的智能体运行时,包含工具调用、类型化工具模式、权限控制、生命周期钩子、记忆模块、技能系统、上下文压缩、重试逻辑、成本追踪以及多智能体协调共10个核心组件。所有代码均可直接运行,无需API密钥或额外基础设施。通过暴露完整控制流,你将理解框架内部机制而非将其当作黑盒。

用Amazon Nova 2 Sonic构建医疗预约语音助手

X·KOLX:AWS Machine Learning Blog (@Jimin Kim)原文 ↗

这篇教程展示了如何利用Amazon Nova 2 Sonic和Amazon Bedrock AgentCore构建一个语音预约提醒助手。该助手能够通过语音验证患者身份,处理确认、取消或改约操作,并收集就诊前健康信息。当需要时,助手会将问题升级给人工客服。教程包含一个浏览器界面用于测试,若要连接真实电话线路,需集成Amazon Connect等电话服务。

RAG系统引文错误分类:先诊断再修复

X·KOLX:Milvus (@milvusio)原文 ↗

Milvus团队指出LLM在RAG中频繁引用了不支持的来源。引文失败分为两类:忠实性错误(生成内容与检索文档不符,如模型声称150W功耗但文档只说低功耗)和引文准确性错误(元数据映射错误、缺失引用、幽灵引用、弱支持引用、过度引用)。其中幽灵引用常因索引重建后ID过期导致。修复方案因错误类型而异:忠实性问题调整生成层约束或基座模型,引文准确性问题需工程层修复元数据管理。

LangChain Harrison Chase 分享智能体开发生命周期方法论

X·KOLX:LangChain (@LangChainAI)原文 ↗

LangChain 创始人 Harrison Chase 将于6月24日举办网络研讨会“The Agent Development Lifecycle 101”,阐述构建可靠智能体的五步循环:构建、测试、部署、监控、改进。他强调了首次发布仅是开始,需要可重复的迭代流程来提升智能体性能。该研讨会面向所有构建智能体的团队,提供从工具、上下文、提示到评估的全流程指导。

69
今日事件
17
一手报道
17
新模型
41
信源
AITOP · 编辑系统自动生成