AITOP 日报｜2026年6月22日｜欧洲AI超算、日本多智能体、三星全面部署

模型发布/更新

Model Releases

5 篇

京东开源实时视频交互模型JoyAI-VL-Interaction，全球首个全栈开源

京东发布并开源了实时视频视觉语言交互模型JoyAI-VL-Interaction，这是全球首个全栈开源的interaction模型和系统，获得vLLM-Omni的day-0原生支持。该模型能持续观察视频流，自主判断何时响应，而非被动等待用户提问。在58个真人盲评案例中，JoyAI-VL-Interaction对比豆包视频通话助手胜率77.6%，对比Gemini视频通话助手胜率87.9%。它支持摄像头、直播流、监控流等多种视频输入，并具备后台智能体委托能力。

日本Sakana AI发布Fugu和Fugu Ultra多智能体模型

X·KOLX：The Rundown AI (@therundownai)原文 ↗

日本Sakana AI发布了Fugu和Fugu Ultra模型。Fugu Ultra采用多智能体编排系统，整合多种模型协同工作。在多个基准测试中，Fugu Ultra达到Fable和Mythos模型的性能水平。模型通过单一API提供，声称可规避出口管制风险。

MoonMath AI 开源 HIP 注意力内核，在 AMD MI300X 上全面超越 AITER v3

X·KOLX：marktechpost (@Asif Razzaq)原文 ↗

MoonMath AI 开源了一个基于 HIP 的注意力内核，针对 AMD MI300X GPU 进行了优化。该内核采用单指令汇编包装器和八波流水线架构，在所有形状和舍入模式下均击败了 AMD 官方实现的 AITER v3。基准测试结果显示，新内核在 MI300X 上的性能显著领先，未出现任何退化情况。

百川发布新一代医疗增强大模型 M4：登顶 OpenAI 医疗评测，超越 GPT-5.5

官方IT之家原文 ↗

百川智能与清华大学联合发布医疗增强大模型 Baichuan-M4。该模型在 HealthBench 综合得分 68.6，超越 GPT-5.5 超 10 分，幻觉率低至 3.3%。在 SCAN-bench 动态问诊评测中初诊 79.0、复诊 74.7，均领先 GPT-5.5、DeepSeek-V4-Pro 和 Claude Opus 4.7。M4 还具备全病程记忆功能，长上下文临床记忆得分 86.9，较上一代 M3 提升 21.1 分。其证据锚定机制使循证引用精度达到 90.0，远超 GPT-5.5 的 54.7。

Anthropic被曝即将发布Claude Sonnet 5，名称已出现

X·KOLX：@koltregaskes (@koltregaskes)原文 ↗

X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置，暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型，上一代为Claude Sonnet 4（2024年发布）。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。

产品发布/更新

Product

5 篇

英伟达发布全栈机器人安全系统NVIDIA Halos for Robotics

官方IT之家原文 ↗

英伟达于6月22日发布NVIDIA Halos for Robotics，这是业界首套整合AI算力与安全能力的全栈机器人安全系统，面向物理AI的开发、验证及工业部署。人形机器人企业Agility将率先采用，为其工业人形机器人加入完整安全能力。系统包含硬件层（IGX Thor和Holoscan Sensor Bridge）、软件层（Halos OS及Halos Core、外部感知安全蓝图）和认证实验室（全球首个获ANSI认可覆盖物理AI功能安全与AI安全）。面向IGX的Halos Core已向注册开发者提供早期访问，开源外部感知安全蓝图已在GitHub开放。

微软转向DeepSeek V4应对AI token成本激增

X·KOLX：pandaily (@contact@pandaily.com (Pandaily))原文 ↗

微软因AI推理token成本飙升，宣布Copilot Cowork产品改为基于使用量的定价模式。为控制成本，微软选择整合开源模型DeepSeek V4作为替代方案。这一决策反映了大型企业在大规模AI部署中面临的经济压力，以及开源模型在成本效率上的竞争力。DeepSeek V4的参数量与性能表现接近GPT-4级别，但推理成本可降低80%以上。

LangSmith LLM Gateway 发布：在请求前拦截超支和PII泄露

X·KOLX：LangChain (@LangChainAI)原文 ↗

LangSmith LLM Gateway 位于代理和LLM提供商之间。它强制实施支出上限，避免超支。在请求到达模型前自动编辑个人身份信息（PII），从源头阻止隐私泄露。该网关不是事后记录，而是提前阻断问题。更多细节可查看官方博客。

LiteParse v2.1：最快PDF转Markdown开源解析器

X·KOLX：Jerry Liu (@jerryjliu0)原文 ↗

LiteParse v2.1 发布，可将PDF转换为Markdown，速度比Screen Studio放大动作还快。它在olmOCR0-bench、opendataloader-bench、ParseBench三个基准测试上准确率超过pymupdf4llm、opendataloader等工具。完全开源（Apache 2.0），支持CLI、Rust、Node、Python、WASM。可从LlamaIndex官网或GitHub获取。

Cloudflare 推出临时账户，AI agent 可免注册部署 Workers

官方Simon Willison’s Weblog原文 ↗

Cloudflare 宣布支持通过 `npx wrangler deploy --temporary` 命令创建临时 Workers 项目，无需注册 Cloudflare 账户即可部署应用。该临时部署将在 60 分钟后自动失效。开发者可用 GPT-5.5 xhigh 等工具构建测试应用，例如用于追踪 HTTP 重定向的工具。部署后可通过提供的 URL 在 60 分钟内认领项目以延长保留时间。

行业动态

Industry

5 篇

欧洲启动史上最大规模AI超算建设：35台英伟达HPC

官方IT之家原文 ↗

英伟达宣布欧洲启动35台AI HPC超级计算机建设，覆盖国家级超算中心、AI工厂和高校机构，建成后将惠及超过300万研究人员。巴塞罗那MareNostrum5升级后AI训练性能达20EFLOPS，推理性能33EFLOPS。BavariaAI Blue Swan部署1000块GPU，训练性能11EFLOPS、推理22EFLOPS。IT4LIA配备超8000块GPU，训练82EFLOPS、推理164EFLOPS。所有系统采用英伟达全栈AI基础设施，服务于气候科学、医疗、清洁能源、量子计算等领域。

博睿康申请科创板IPO，成中国首家脑机接口上市公司

X·KOLX：pandaily (@contact@pandaily.com (Pandaily))原文 ↗

博睿康持有全球首个获批的侵入式BCI医疗设备，已于近期提交科创板上市申请。该公司计划通过IPO融资以推动进一步研发和商业化。博睿康将成为中国首家公开上市的脑机接口公司。

三星电子为员工部署ChatGPT Enterprise和Codex

官方OpenAI Blog原文 ↗

三星电子在全球范围内为员工部署了ChatGPT Enterprise和Codex，这是OpenAI截至目前最大规模的企业AI部署之一。超过10万名员工将获得访问权限，用于提升编程和日常工作效率。该部署涵盖三星的多个业务部门，包括半导体、消费电子和移动通信。

美光与Anthropic达成战略合作，涉AI存储供应和投资

官方IT之家原文 ↗

美光科技与Anthropic宣布战略合作协议，共同研究HBM、DRAM及SSD在AI训练和推理中的应用。双方签署长期内存和存储供应协议，为Anthropic未来算力扩张提供支持。美光已部署Anthropic的Claude模型，用于加速代码编写和智能化应用。美光还参与了Anthropic的H轮融资，深化下一代AI基础设施合作。

HD 现代基于英伟达 Isaac Sim 研发造船 AI 机器人，率先用于焊接工序

官方IT之家原文 ↗

HD 现代正基于英伟达 Isaac Sim 平台研发实体 AI 机器人，计划率先用于船舶制造的焊接、涂装、板材折弯工序。Isaac Sim 依托英伟达 Omniverse 和 OpenUSD，采用实时光线追踪与 Newton 物理引擎，可在虚拟环境中生成数万种工况数据。HD 现代是全球首家在造船领域采用该平台的企业，目前已实现机器人完成基础焊接作业。该公司目标是在 2030 年建成“未来智能先进船厂”，并已与西门子、英伟达合作搭建数字孪生船厂。

论文研究

Research

3 篇

LLM Agent通信协议报告：五维分类法分析9个开源协议

X·KOLX：elvis (@omarsar0)原文 ↗

该报告构建了五维分类法（对手方、载荷、交互状态、发现机制、模式灵活性），分析了九个活跃维护的开源智能体协议，包括MCP和A2A。报告发现每个智能体间协议都采用混合载荷与会话状态持久化组合，而去中心化发现机制仍属罕见。该研究映射了当前LLM agent通信层的标准化趋势，为选择通信层提供依据。论文地址：arxiv.org/abs/2606.19135。

AI Agent可扩展评估：Human-on-the-Bridge方法

X·KOLX：elvis (@omarsar0)原文 ↗

论文提出Human-on-the-Bridge方法，将人类判断前置到可复用的评估资产中，用于生产环境下的AI Agent评估。Agent作为行为系统需要跨轮推理、调用工具、保持上下文和遵循策略，现有方法如静态Benchmarks、LLM-as-judge、红队测试各有局限。该方法由专家在测试前策划可复用的评估智能，而非在循环中逐条审查输出。论文编号2606.16871，展示了提升可扩展性的具体路径。

小米华为端侧AI对决：8大手机巨头策略解析

X·KOLX：pandaily (@contact@pandaily.com (Pandaily))原文 ↗

小米推出 MiMo-V2.5 端侧模型，参数量缩减至 1.5B 以适配手机芯片。华为则依赖 Pangu 系列，侧重多模态融合与本地推理效率。OPPO 采用 AndesGPT，vivo 推出蓝心大模型 1B 版本，均聚焦离线场景。各家竞争焦点集中于模型轻量化、隐私保护与响应速度，其中 MiMo-V2.5 在端侧推理延迟上较上代降低 40%。

技巧与观点

Tips & Takes

4 篇

前Meta主任工程师分享Agentic工程工作流：每天40+生产级PR

X·KOLX：shao__meng (@shao__meng)原文 ↗

前Meta/Microsoft/Atlassian主任工程师Kun Chen分享了一套完整的Agentic工程工作流，每天可ship 40-50个经测试的生产级PR。核心框架分为四层：造船（终端中心主义，使用WezTerm+tmux+Neovim）、训练船员（Memory+Skills，全局memory仅27行以避免token浪费）、与单个船员协作（语音输入OpenSuperWhisper，自创AXI标准比MCP节省3倍token和2倍延迟）、并行指挥（treehouse管理worktree，First Mate大副编排器）。验证环节采用no-mistakes流水线，在隔离worktree中执行对抗式review和E2E测试，大幅减少人工review耗时。该工作流强调将时间花在任务开头和结尾，中间全交给AI，瓶颈从agent执行力转移到战略思考。

今日事件

一手报道

新模型

信源

AITOP日报

模型发布/更新

京东开源实时视频交互模型JoyAI-VL-Interaction，全球首个全栈开源

日本Sakana AI发布Fugu和Fugu Ultra多智能体模型

MoonMath AI 开源 HIP 注意力内核，在 AMD MI300X 上全面超越 AITER v3

百川发布新一代医疗增强大模型 M4：登顶 OpenAI 医疗评测，超越 GPT-5.5

Anthropic被曝即将发布Claude Sonnet 5，名称已出现

产品发布/更新

英伟达发布全栈机器人安全系统NVIDIA Halos for Robotics

微软转向DeepSeek V4应对AI token成本激增

LangSmith LLM Gateway 发布：在请求前拦截超支和PII泄露

LiteParse v2.1：最快PDF转Markdown开源解析器

Cloudflare 推出临时账户，AI agent 可免注册部署 Workers

行业动态

欧洲启动史上最大规模AI超算建设：35台英伟达HPC

博睿康申请科创板IPO，成中国首家脑机接口上市公司

三星电子为员工部署ChatGPT Enterprise和Codex

美光与Anthropic达成战略合作，涉AI存储供应和投资

HD 现代基于英伟达 Isaac Sim 研发造船 AI 机器人，率先用于焊接工序

论文研究

LLM Agent通信协议报告：五维分类法分析9个开源协议

AI Agent可扩展评估：Human-on-the-Bridge方法

小米华为端侧AI对决：8大手机巨头策略解析

技巧与观点

前Meta主任工程师分享Agentic工程工作流：每天40+生产级PR

7种智能体记忆类型：AI工程师技术指南

用Codex自动测试应用的每个功能：一个循环工作流

Cloudflare 开源 AI 安全审计技能，把编码助手变自动化审计工具