AITOP 日报｜2026年6月18日｜AI效率进化：MoE压缩与RL训练新突破

模型发布/更新

Model Releases

5 篇

ThinkDeception：渐进式强化学习框架实现可解释多模态欺骗检测

X·KOLX：arXiv cs.AI (@Jinhao Song, Shan Liang, Yiqun Yue, Zhuhuayang Zhang, Tianqi Gao)原文 ↗

ThinkDeception首次将多模态大语言模型(MLLM)引入欺骗检测领域，将其从二分类任务转变为显式认知推理过程。研究团队构建了首个逐步多模态思维链(CoT)数据集，并基于此开发基础模型ThinkDeception Base。核心创新是提出Visual-Audio Consistency Group Relative Policy Optimization(VAC-GRPO)，采用渐进式训练将数据分为四个难度层级。在主流基准上，ThinkDeception在检测准确性和推理质量上达到新SOTA。

LMSYS 发布博客：在 TPU 上用 SGLang-JAX 优化 Ling-2.6-1T MoE 模型

X·KOLX：LMSYS Org (SGLang) (@lmsysorg)原文 ↗

LMSYS 发表博客详解如何用 SGLang-JAX 在 TPU v7x 上优化 Ling-2.6-1T（1T 参数混合 MoE 模型）。通过 Fused MoE V2 内核将令牌和累加器留在 VMEM 中并双缓冲专家权重，MoE 预填充延迟降低 53%。混合内存池为 10 个全注意力层分配逐令牌 MLA KV，为 70 个 GLA 层分配逐请求循环状态。GLA 线性注意力采用分块并行预填充，单控制器 DP 保持分组 RMS Norm 芯片本地化，无需逐层跨芯片规约。

OpenAI发布LifeSciBench，750项任务评估AI模型在生命科学研究中的表现

X·KOLX：marktechpost (@Michal Sutter)原文 ↗

OpenAI推出LifeSciBench，包含750个专家撰写任务，覆盖7个工作流和7个生物学领域，由173位博士科学家构建，使用19,020条评分标准评估推理与决策。当前最佳模型GPT-Rosalind得分仅36.1%，在人工制品、精确输出和操作决策上仍有较大提升空间。该基准旨在测试AI的真实研究能力而非单纯记忆。

大型语言吉布斯的结构化概率推理方法

X·KOLX：arXiv cs.LG (@Sanghyeok Choi, Henry Gouk, Esmeralda S. Whitammer)原文 ↗

Large Language Gibbs 是一种利用大型语言模型条件分布进行结构化概率推理的MCMC方案。该方法通过迭代重采样单个变量避免单次自回归生成的顺序偏差，产生的平稳分布反映所有局部条件之间的折中。在合成分布采样、一致性推理和贝叶斯结构学习任务上验证了有效性。结果表明LLM条件作为MCMC转移算子可替代单次生成进行结构化推理。

Jim Fan详解ENPIRE物理自动研究系统的安全与奖励设计

X·KOLX：Jim Fan (@DrJimFan)原文 ↗

Jim Fan揭秘了物理自动研究系统ENPIRE的设计内幕。安全采用两层硬编码：硬运动学限制立即触发任务失败并自动重置，以及扭矩限制柔性夹爪防止碰撞损坏。奖励函数通过收集成功/失败演示、用计算机视觉分类器编码并冻结在Gym环境中，防止智能体篡改。系统遥测定义了Mean Robot Utilization（MRU）、Mean Token Utilization（MTU）和GPU利用率三个实时指标，并基于Tokens-to-Success和Time-to-Success评估预算效率。

产品发布/更新

Product

5 篇

Claude Code v2.1.181 更新：新增 /config 命令、苹果事件沙箱等

X·KOLX：Claude Code: GitHub Releases (@ashwin-ant)原文 ↗

Anthropic 发布 Claude Code v2.1.181，新增 /config key=value 语法，可在交互式、-p 和远程控制模式下直接设置任意设置（如 /config thinking=false）。新增 sandbox.allowAppleEvents 选项，允许沙箱命令在 macOS 上发送 Apple Events。新增 CLAUDE_CLIENT_PRESENCE_FILE 环境变量，指向标记文件后可抑制移动推送通知。升级内置 Bun 运行时到 1.4，改进长段落流式输出为逐行显示，API 连接掉线自动重试。修复了多个 bug，包括提示缓存、网络驱动器上的文件写入、macOS 认证流程等。

Codex Automations 的内外双循环

X·KOLX：shao__meng (@shao__meng)原文 ↗

Codex Automations 采用双循环架构：内循环在写作前检索历史、事实等上下文，生成可审阅的草稿；外循环在人工审阅后分析草稿与终稿的差异（如补事实、删承诺），并将有效改进写入写作指引。内循环每2小时运行一次以保持即时效率，外循环每日或每周运行以避免过拟合。该架构适用于邮件、汇报、Issue 分诊等需要起草-审阅-修改的流程。

vLLM 支持自托管开源模型作为编程助手

X·KOLX：vLLM (@vllm_project)原文 ↗

vLLM 推出新功能，允许用户在自己的 GPU 上运行开源模型作为编程助手。该引擎兼容 OpenAI Responses API，因此任何使用代码助手的工具都可直接指向你的服务器。支持 NVIDIA、AMD 等多种硬件。当前可部署 GLM 5.2、Kimi K2.7 Code、MiniMax M3 等模型。

Vercel 开源了他们的 Agent Framework「Eve」

X·KOLX：shao__meng (@shao__meng)原文 ↗

Vercel 开源了 Agent 框架 Eve，将 Agent 定义为目录结构，内置持久会话（基于 Workflow SDK 的可 checkpoint 工作流）、沙箱（本地 Docker/microsandbox，部署用 Vercel Sandbox）和 Human-in-the-loop 审批机制。Eve 支持 MCP/OpenAPI 连接、多 Channel（HTTP、Slack、Discord、Teams）和定时任务。内部验证显示：d0 月处理 3 万+ 问数，Lead Agent 年成本约 $5k，回报约 32 倍，Vertex 约 92% 工单自动解决。开发者可用 eve dev 本地调试，vercel deploy 部署，Agent 进 Git 管理。

无需旗舰卡也能体验 AI 队友：英伟达 ACE Game Agent SDK 开启 Beta 测试，已接入虚幻引擎 5

官方IT之家原文 ↗

英伟达 ACE Game Agent SDK 进入 Beta 测试，包含面向虚幻引擎 5 的插件。该 SDK 内置 Qwen 3.5 4B 模型用于决策，Chatterbox Turbo 350M 用于语音合成，可在仅 8GB 显存的 GPU（如 RTX 3060）上本地运行。KRAFTON 已在《绝地求生》中推出 AI 队友 Ally 限时测试，Creative Assembly 在《全面战争：法老》中开发 AI 顾问。SDK 提供 Agent、Chat、RAG 三类 API，支持离线部署。

行业动态

Industry

5 篇

Transformer论文作者Noam Shazeer加入OpenAI，从事模型架构研究

X·KOLX：歸藏(guizang.ai) (@op7418)原文 ↗

Noam Shazeer，Character AI前CEO、Transformer论文作者之一及混合专家模型（MoE）架构提出者，宣布加入OpenAI。谷歌曾以27亿美元收购Character AI，旨在换取Shazeer加入，但他仅在谷歌短暂任职后便离职。Shazeer在社交媒体确认新职位，称期待与OpenAI团队合作。

Anthropic前沿红队通过LLM ATT&CK Navigator绘制AI网络威胁地图

官方Anthropic: Research原文 ↗

Anthropic前沿红队发布报告，利用LLM ATT&CK Navigator框架系统分析AI系统可能面临的网络威胁。该导航器将攻击者行为映射到战术和技术层面，涵盖提示注入、模型窃取、训练数据投毒等攻击类型。报告为安全团队提供了针对AI特定威胁的防御策略。

我国首部L3/L4自动驾驶强制性国标公示，2027年7月实施

官方IT之家原文 ↗

工信部6月16日就《智能网联汽车自动驾驶系统安全要求》等2项强制性国家标准报批稿公开征求意见，计划2027年7月1日起实施。该标准针对L3和L4自动驾驶系统，从推荐性升级为强制性，要求ADS安全水平至少达到合格且专注驾驶人的水平，并引入Safety Case机制。标准对L3重点关注人机交接，L4则关注系统自身风险处置，车企不能仅靠测试里程等指标宣传。业内认为，这标志着自动驾驶监管从概念松绑转向安全硬约束，将推高车企在冗余系统、算力芯片等方面的投入。

Andrew Ng：AI炒作之外，未来企业将是10人团队用智能体重构数据架构

X·KOLX：Pandaily (@contact@pandaily.com (Pandaily))原文 ↗

Andrew Ng在LangChain Interrupt活动中指出，未来企业将由10人工程团队主导，利用AI智能体驱动转型。他强调数据架构是成功的基础，而非模型本身。这一观点挑战了当前对大规模团队的依赖，突出了智能体在重构企业数据流中的关键作用。

阿里巴巴与字节跳动加码具身AI，Qwen-Robot模型系列发布

X·KOLX：Pandaily (@contact@pandaily.com (Pandaily))原文 ↗

阿里巴巴发布Qwen-Robot具身AI模型系列，进军机器人领域。字节跳动将机器人业务提升为核心业务，两大互联网巨头利用各自数据、AI大脑和场景优势重塑中国机器人行业。Qwen-Robot系列基于阿里通义千问大模型，支持多种机器人形态。字节跳动则通过其AI技术和应用场景推动机器人商业化。

论文研究

Research

5 篇

结构剪枝新方法：基于归因引导和覆盖最大化的MoE压缩

X·KOLX：arXiv: DeepSeek (@Yifu Ding, Jiacheng Wang, Ge Yang, Yongcheng Jing, Jinyang Guo, Xianglong Liu, Dacheng Tao)原文 ↗

该论文针对混合专家(MoE)模型部署时内存和推理开销大的问题，提出一种结构剪枝框架。方法将剪枝比率分配转化为通道分数覆盖最大化问题，通过归因近似高效求解。在DeepSeek和Qwen MoE模型上实验，结合4-bit量化后，50%或25%结构化剪枝仍保持模型准确率。在Qwen3-30B-A3B上，内存占用减少5.27倍，优于现有基线。

PowerAgentBench-SS：电力系统稳态研究中智能体AI的基准

X·KOLX：arXiv: OpenAI (@Costas Mylonas, Magda Foti, Andrea Pomarico, Matheus Duarte, Qian Zhang, Emmanouel Varvarigos)原文 ↗

PowerAgentBench-SS是一个针对电力系统稳态研究中工具使用智能体的基准框架。它使用IEEE 39节点系统进行直流热N-2预想事故搜索测试，评估智能体在工具调用、约束满足和验证方面的能力。实验对比了三个本地Ollama模型和一个OpenAI API代理，发现纯求解器评估不足以区分智能体性能，验证预算使用、类型强制转换、证据报告等行为是关键差异。该基准包含召回率、假安全惩罚、严重性遗憾、行动成本等风险敏感指标。

Spotlight：协同种子探索与Spot GPU加速DiT强化学习后训练

X·KOLX：arXiv: DeepSeek (@Ruiqi Lai, Dakai An, Wei Gao, Ju Huang, Siran Yang, Jiamang Wang, Lin Qu, Dmitrii Ustiugov, Wei Wang)原文 ↗

DiT强化学习后训练需要数千块高端GPU，成本极高。Spotlight系统利用Spot GPU（价格低69-77%）和种子探索技术，将训练速度提升4倍。该系统通过带子集探索规划器最大化奖励方差，弹性序列并行在预emption时毫秒级恢复，并采用拉取式调度平衡负载。在Qwen-Image后训练中，Spotlight达到相同验证分数的成本降低1.4-6.4倍，在DeepSeek-OCR和Geneval数据集上512×512和1280×1280分辨率下图像质量更优。

Code-Augur: 通过规范推断实现智能体漏洞检测

X·KOLX：arXiv: DeepSeek (@Zhengxiong Luo, Mehtab Zafar, Dylan Wolff, Abhik Roychoudhury)原文 ↗

Code-Augur提出安全规范优先范式，将漏洞检测智能体的隐性假设显式化为安全规范，并通过运行时反证持续细化。在真实项目上，Code-Augur比Claude Mythos等专用模型检测到更多漏洞。它基于Sonnet和DeepSeek等通用LLM构建，发现了22个关键开源项目的新漏洞。该方法通过模糊测试触发断言，揭示漏洞或修正规范，提升检测可信度。

随机动量方法的计算效率与串行运行时间权衡

X·KOLX：arXiv cs.AI (@Depen Morwani, Alexandru Meterez, Pranav Nair, Sham Kakade)原文 ↗

该论文研究了随机重球法（HB）和加速SGD（ASGD）在一致线性回归中的计算效率与串行运行时间权衡。结果表明HB在任意谱下无法超越SGD的计算效率前沿，但允许在比SGD临界批量大sqrtκ倍的窗口内减少串行运行时间。ASGD在快速衰减幂律谱下可提升小批量计算效率，但随着批量增大，牺牲效率换取更优串行时间。合成线性回归实验验证了这些定性规律。

技巧与观点

Tips & Takes

5 篇

258

今日事件

一手报道

新模型

信源

AITOP日报