VOL.2026.06.17·240 STORIES·AITOP DAILY

AITOP日报

二〇二六年六月十七日 星期三DAILY · 每早八时
01

模型发布/更新

Model Releases
5

LiL-Q:一种凸拟线性化方法求解非线性PDE,替代传统PINNs梯度训练

X·KOLX:arXiv cs.LG (@Gbenga T. Awojinrin, Abdul-Akeem Olawoyin, Rami M. Younis)

该论文提出LiL-Q方法,通过Bellman-Kalaba拟线性化将非线性PDE转化为一系列线性子问题,每个子问题用线性可学习表示(LiL)离散化并直接通过QR分解求解。LiL表示包括随机特征极限学习机、谱多项式基和三角展开,实现为物理信息神经网络(PINNs)。在7个基准测试(Bratu、粘性Burgers、Buckley-Leverett、平面应变弹性、2D/3D不可压缩Navier-Stokes、异质渗透率Darcy流)上,LiL-Q通常在个位数外部迭代内收敛,参数数量比现有PINN求解器少两个数量级时仍能达到或超越其精度。当精确解在试验空间内时,单次求解即可恢复至机器精度。

PearlVLA: 渐进式潜在空间具身动作规划细化

X·KOLX:arXiv cs.AI (@Bochen Yang, Lianlei Shan)

PearlVLA提出一种将动作规划调度到VLM潜在空间的新框架,通过将元查询表示分为视觉定位分支和迭代潜在规划分支,利用冻结的潜在世界模型生成未来观测,并经过K轮细化后并行解码动作块。在LIBERO基准上,PearlVLA达到了现有方法中的最佳性能,证明了潜在空间推理在降低延迟的同时提升规划质量的有效性。

Qwen-RobotManip技术报告:对齐解锁机器人操作基础模型的规模

X·KOLX:arXiv cs.LG (@Haoqi Yuan, Zhixuan Liang, Anzhe Chen, Ye Wang, Haoyang Li, Pei Lin, Yiyang Huang, Zixing Lei, Tong Zhang, Jiazhao Zhang, Jie Zhang, Jingyang Fan, Gengze Zhou, Qihang Peng, Chenxu Lv, Xiaoyue Chen, An Yang, Fei Huang, Junyang Lin, Dayiheng Liu, Jingren Zhou, Chenfei Wu, Xiong-Hui Chen)

Qwen-RobotManip是基于Qwen-VL构建的视觉-语言-动作基础模型。它引入统一对齐框架,覆盖表示、运动和操作行为三个维度,使多源训练数据协调一致。通过人工到机器人的合成流水线,利用15种平台的示教数据,构建了约38,100小时的预训练语料。模型在RoboCasa365、LIBERO-Plus、EBench等OOD基准上显著优于先前最佳模型π0.5,并在AgileX ALOHA、Franka、UR、ARX等真实机器人平台上验证。

DecoSearch: 复杂度感知路由与计划级修复提升Text-to-SQL

X·KOLX:arXiv: DeepSeek (@Esteban Schafir, Xu Zheng, Hojat Allah Salehi, Zhuomin Chen, Mo Sha, Wei Cheng, Dongsheng Luo)

DecoSearch是一个无需训练的Text-to-SQL框架,通过轻量级Schema Selector修剪数据库模式,LLM Judger判断查询是否需要分解为DAG子问题。在BIRD上达到70.53%执行准确率,在Spider上达88.31%,使用DeepSeek作为骨干模型,比训练无关基线消耗少一个数量级的token。该方法还可作为模型无关包装器,一致提升微调后的SQL生成骨干性能。

ENPIRE:NVIDIA让AI智能体自主控制真实机器人循环,成功率99%

X·KOLX:Jim Fan (@jimfan)

NVIDIA联合CMU和伯克利推出ENPIRE系统,让AI智能体完全自主控制真实机器人循环,包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化,无需人类介入。

02

产品发布/更新

Product
5

ENPIRE:Codex智能体自主操控机器人完成精细任务

X·KOLX:Jim Fan (@jimfan)

ENPIRE赋予8个Codex智能体机器人集群和GPU资源,自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。

Amazon Bedrock AgentCore新增功能:构建更广知识、持续学习的智能体

X·KOLX:AWS Machine Learning Blog (@Madhu Parthasarathy)

Amazon Bedrock AgentCore新增多项能力,支持连接组织、网页和付费知识源,扩展智能体的知识范围。新工具帮助团队在生产环境中定位和修复问题,并实施随智能体能力提升自动扩展的控制机制。这些功能使开发者能更快构建更强大的智能体,并以规模化方式治理和持续改进。

Exa 推出 Exa Agent:托管式 Web Research API,集成模型与搜索工具

X·KOLX:shao__meng (@shao__meng)

Exa 发布 Exa Agent,一款托管式 Web Research Agent API,将前沿模型与自研搜索工具链打包成单一接口。系统采用任务分解与并行子 Agent 架构,适合 WideSearch 类大规模数据集调研。其 Model Fusion 技术根据任务动态混合使用高性能模型与性价比模型以优化成本。Exa Highlights 模型可将 token 用量最高削减 94%。在 WideSearch 基准上,Exa Agent 以 Row-F1 指标与 Perplexity Agent Pro、Opus 4.8 等对比,达到成本效率 Pareto 前沿。

Snap 首款消费级 AR 眼镜 Specs 发布:电致变色镜片、独立运行,2195 美元

官方IT之家

Snap 今日发布首款面向普通消费者的独立式 AR 眼镜 Specs,售价 2195 美元(约 14864 元人民币)。眼镜采用自研 LCoS 显示技术,拥有 51 度视场角和 1600 万色显示。镜片支持电致变色,可在 10 秒内从透明切换至墨镜模式。设备内置两颗高通骁龙处理器,无需外接计算单元即可独立运行。续航在混合使用场景下约 4 小时,充电盒可扩展至 20 小时。

微软 Copilot Cowork 正式 GA,考虑引入 DeepSeek V4 低成本模型

X·KOLX:shao__meng (@shao__meng)

微软宣布 Copilot Cowork 正式全面可用,支持多模型和长期运行代理。为应对 Agent 场景下 token 消耗剧增的问题,计划引入 Azure 托管的 DeepSeek V4 作为低成本选项,按算力/用量计费,取代包月无限用模式。正在测试微调版 DeepSeek V4,作为 Anthropic/OpenAI 模型的替代,预计数周内公布最终选择。该模型可选非强制,数据不出微软云,符合现有安全与合规体系。

03

行业动态

Industry
5

英伟达与Coherent扩建工厂扩产AI光互连,黄仁勋称AI是终极通用技术

官方IT之家

英伟达与Coherent在得州Sherman为扩建工厂奠基,聚焦6英寸磷化铟晶圆和光互连产能,支撑AI数据在机架间以光速传输。黄仁勋在仪式上表示AI是终极通用技术,并指出Vera Rubin Ultra NVL576系统需依赖硅光技术实现576个GPU跨8个机架协同工作。Coherent获得5000万美元CHIPS Act拨款及得州和当地约1700万美元支持,项目满产后预计带来550多个直接岗位。

削弱罢工谈判筹码,三星目标2030年实现无人晶圆厂

官方IT之家

三星宣布通过数据共享生态平台DSEP,目标到2030年实现无人晶圆厂。该平台向设备供应商共享实时工艺数据,汇集数据供AI模型分析决策,首批设备供应商已签约。三星同时建设高性能计算HPC平台为DSEP提供算力,希望降低人力依赖。此举旨在削弱近期劳资博弈中工会的谈判筹码,此前三星与工会达成2026-2028年经营利润超200万亿韩元时工人可获10.5%特别绩效奖金的协议。

SpaceX收购Cursor AI,共同训练前沿模型

X·KOLX:Cursor (@cursor_ai)

SpaceX以全股票交易收购Cursor AI,旨在构建全球最有用的AI模型。过去几个月,SpaceXAI与Cursor已联合训练一个模型。该模型将发布在Cursor和Grok Build中。合作将推动Cursor能力显著提升。

Anthropic 安抚 AI 开发者,搁置 Claude Agent SDK 基于 Token 计费变更计划

官方IT之家

Anthropic 于 5 月 13 日宣布,Claude Agent SDK(包括通过第三方应用及 'claude -p' 调用)的计费方式将从标准订阅调整为按 API Token 用量计费,原定 6 月 15 日生效。开发者 Matthew Diakonov 分析,若以 Opus 模型作为主编码助手,第一周就会超过盈亏平衡点。代码编辑器 Zed 团队也警告用户这是一次“重大成本增加”。Anthropic 于 6 月 15 日更新支持页面,宣布暂停该变更,并表示目前没有任何变化。

美国强制Anthropic关闭Fable 5和Mythos 5模型

X·KOLX:@koltregaskes (@koltregaskes)

美国政府以国家安全和越狱漏洞为由,强制Anthropic关闭Fable 5和Mythos 5模型。指令仅基于口头证据,未提供具体技术细节。Anthropic声称该漏洞很窄,且GPT-5.5也能实现相同功能。同时禁止所有外国人访问,包括Anthropic的外籍员工。此事发生在Anthropic拒绝与五角大楼签订军事监控合同四个月之后。

04

论文研究

Research
5

高斯过程后验采样的差分隐私分析

X·KOLX:arXiv cs.LG (@Tomasz Maciazek)

该研究分析了高斯过程(GP)后验采样中释放样本路径的差分隐私(DP)性质。与标准DP机制不同,后验采样的内在随机性可提供隐私保证。作者推导了显式的Rényi-DP界限,将隐私泄露分解为后验均值依赖和后验协方差依赖部分,并指出有效岭正则化对隐私有显著影响。通过成员推理攻击实验,验证了隐私泄露与正则化强度、后验方差及释放样本路径数量之间的预测关系。在噪声观测任务中,隐私兼容的正则化在保持有用决策的同时仅带来适度效用损失。

Kolmogorov回归用于鲁棒扩散策略

X·KOLX:arXiv cs.AI (@Lekan Molu)

这篇论文提出用向后Kolmogorov方程将扩散策略提升至Cameron-Martin空间,以确定性PDE替代随机分数匹配。在PushT操作基准上,Cameron-Martin损失使最大回合奖励提升17%(0.95 vs 0.78),推理时步间漂移降低67.6%。在6站CONWIP制造线上,RMSE较LSTM降低28.4%,饥饿事件召回率达1.0,瓶颈识别Precision@1=1.0,信噪比13倍。结合Hamilton-Jacobi可达性理论,死锁事件减少96%(351次预防)。方法提供收敛保证、轨迹规整性和无奖励信号的故障检测。

注意力的函数等价性:位置编码如何改变Transformer对称性

X·KOLX:arXiv cs.LG (@Viet-Hoang Tran, Vinh Khanh Bui, Van-Hoan Trinh, Tan Lai Ngoc, Tan M. Nguyen)

这篇论文研究了Transformer中注意力机制的函数等价性,重点分析了sinusoidal和旋转位置编码(RoPE)两种变体。作者发现sinusoidal编码保留了普通注意力的等价结构,而RoPE显著减小了对称群,从而增强了表达力。这一发现为RoPE在实践中的流行提供了理论解释。论文还讨论了位置编码如何影响线性模式连接性,并通过对齐算法证明连接性的存在和变化关键依赖于位置编码。实验表明使用RoPE的Transformer在参数空间具有更少的函数等价性,有助于优化和泛化。

RepSelect:通过表示选择性实现鲁棒的大模型遗忘

X·KOLX:arXiv: DeepSeek (@Filip Sondej, Yushi Yang, Adam Mahdi)

现有大模型遗忘方法(如GradDiff、NPO、SimNPO、RMU、UNDIAL)易被微调或少样本提示逆转,表明确实只是浅层遗忘。RepSelect通过每次更新前崩塌权重梯度的主成分,隔离遗忘集特定的表示,保持通用能力不受影响。在生物危害知识和虐待倾向两个遗忘类别上,对Llama 3、Qwen 3.5、Gemma 4 E4B、DeepSeek V2 Lite四个模型族评估,RepSelect后学习准确率降低幅度是最好基线的4-50倍,且对少样本提示攻击接近完全鲁棒。

Looped World Models:循环架构实现100倍参数效率的世界模型

X·KOLX:arXiv cs.AI (@Hongyuan Adam Lu, Z. L. Victor Wei, Qun Zhang, Jinrui Zeng, Bowen Cao, Lingwei Meng, Mocheng Li, Zezhong Wang, Haonan Yin, Naifu Xue, Minyu Chen, Cenyuan Zhang, Zefan Zhang, Hao Wei, Jiawei Zhou, Haoran Xu, Hao Yang, Ronglai Zuo, Tongda Xu, Yonghao Li, Jian Chen, Hebin Wang, Zeyu Gao, Yang Li, Wei Zhao, Qimin Zhong, Siqi Liu, Yumeng Zhang, Leyan Cui, Zhangyu Wang, Wai Lam)

Looped World Models(LoopWM)首次将循环架构引入世界建模,通过参数共享的transformer块迭代细化潜在环境状态。相比传统方法,LoopWM在参数效率上提升多达100倍,并能根据预测复杂度自动调整计算深度。该方法将迭代潜在深度确立为世界仿真的新扩展轴,独立于模型规模和训练数据规模。

05

技巧与观点

Tips & Takes
3

用xFormers构建内存高效Transformer:Packed Sequences、GQA、ALiBi、SwiGLU和因果注意力教程

X·KOLX:marktechpost (@Sana Hassan)

本文通过xFormers实现GPU上内存高效的Transformer模型。对比标准注意力实现,验证了内存高效注意力在不同序列长度下的速度和内存表现。教程涵盖因果掩码、打包变长序列(packed sequences)、分组查询注意力(GQA)以及自定义ALiBi偏置。最后将上述技术结合SwiGLU层和自动混合精度训练,构建了一个可训练的GPT风格模型。

Amazon Bedrock Guardrails 新 API InvokeGuardrailChecks 保护智能体应用

X·KOLX:AWS Machine Learning Blog (@Sandeep Singh)

Amazon Bedrock Guardrails 推出了 InvokeGuardrailChecks API,允许在代理式AI应用的任意阶段独立应用安全检查,无需预先创建护栏资源。该API支持内容过滤、敏感词检测等安全策略。开发者可以将其集成到多轮对话流程中,动态检查用户输入和模型输出,保障应用安全。文章提供了Python代码示例,演示如何调用此API实现安全守护。

在Amazon SageMaker AI上使用P-EAGLE并行化推测解码

X·KOLX:AWS Machine Learning Blog (@Andy Peng)

本文介绍如何利用Amazon SageMaker AI中的P-EAGLE方法并行化推测解码,加速生成式AI推理。用户可从SageMaker JumpStart目录中选择兼容模型,并配置并行草稿生成参数。通过部署优化的实时SageMaker AI端点,可显著降低推理延迟。P-EAGLE基于EAGLE框架,支持多头并行推测,适用于Llama等主流模型。

240
今日事件
62
一手报道
57
新模型
64
信源
AITOP · 编辑系统自动生成