AITOP 日报｜2026年7月5日｜Anthropic进军制药，芯片短缺加剧

模型发布/更新

Model Releases

5 篇

突破国际难题：我国成功研制全球首款基于相变忆阻器的神经动力学系统芯片

北京大学杨玉超团队联合中科院上海微系统所等在《科学》发表论文，成功研制全球首个基于相变忆阻器的毫秒级神经动力学系统芯片。该芯片采用40纳米工艺，单步运算时延压缩至2.12毫秒，首次进入毫秒级。相比专用加速器速度提升3.82~36.27倍、功耗降低11.75~24.73倍；在脑皮层表面重建任务中比NVIDIA A100 GPU提速50.38~478.18倍。研究解决了相变忆阻器“可控存内计算”国际难题。

Mistral 开源 Leanstral 1.5，在形式化数学基准中表现出色且发现真实代码漏洞

X·KOLX：Decoder (@Matthias Bastian)原文 ↗

Mistral AI 发布了 Leanstral 1.5，这是一个用于 Lean 4 形式化验证的开源模型。该模型在多个形式化数学基准测试中取得了领先成绩，例如在 miniF2F 测试中准确率达到 60%，超过此前的最佳模型。此外，Leanstral 1.5 在扫描 57 个开源代码仓库时，成功发现了 5 个此前未知的 bug。这些发现展示了该模型在数学证明和代码正确性验证方面的实用价值。

NVIDIA AI 推出 ASPIRE 机器人框架，零样本成功率 31% 提升 77 点

X·KOLX：marktechpost (@Asif Razzaq)原文 ↗

NVIDIA 发布了 ASPIRE 自改进机器人框架，能自动编写并优化机器人控制程序。该框架在 LIBERO-Pro 长任务上实现 31% 零样本成功率，并通过迭代修复将性能提升最多 77 点。ASPIRE 还能将已验证的修复技能蒸馏为可复用的技能库，支持零样本迁移到未见过的长时任务。

NVIDIA HORIZON 免手动代理在 RTL 基准测试中达成 100% 完成率

X·KOLX：marktechpost (@Asif Razzaq)原文 ↗

NVIDIA 发布 HORIZON 框架，一种免手动代理，通过 Git Worktrees 将每个 RTL 问题作为版本化仓库托管。该框架在多个 RTL 基准测试中达到 100% 完成率，无需人工干预。HORIZON 自动迭代设计、验证和修复硬件描述代码，显著提升芯片设计效率。

Anthropic 抓虫 AI 模型助推 6 月高危漏洞数达此前纪录 3.5 倍

官方IT之家原文 ↗

Epoch AI 报告显示，2026 年 6 月 21 家机构报告约 1500 个高危和关键漏洞，是此前月度最高纪录的 3.5 倍。该增长趋势与 Anthropic 于 4 月发布的 Claude Mythos Preview 模型有关。Anthropic 的 'Glasswing' 项目已发现超过 10,000 个高危或严重漏洞。

产品发布/更新

Product

5 篇

Anthropic 发布 Claude Science Beta：面向可重复科学流程的多智能体工作台

X·KOLX：marktechpost (@Michal Sutter)原文 ↗

Anthropic 于 2026 年 6 月 30 日推出 Claude Science beta，基于现有 Claude 模型运行。系统包含一个协调代理、多个领域专家代理和一个审查代理，可自动修正引用和数字。每个图表都附带完整代码、环境和消息历史。它支持本地机器、SSH 上的 HPC 以及 Modal 的计算管理，可连接 60 多个数据库和 NVIDIA BioNeMo 技能。

LlamaIndex发布Index v2：面向代理检索的持久化数据管道

X·KOLX：Jerry Liu (@jerryjliu0)原文 ↗

LlamaIndex推出了Index v2，一个用于现代代理检索的综合工具。它提供持久化数据管道，可连接数据源、索引并更新大型知识库，暴露语义搜索、正则grep、文件搜索和读取等类似文件系统操作的工具。该工具可集成到任何AI代理中，让代理自主爬取知识库解决复杂任务。参考实现legal-kb展示了在法律和金融领域的应用，具备版本控制、可视化引用和数据导出能力。

微软重构 Copilot AI：精简 Podcasts 等冗余功能，新增 AutoPilot 智能体

官方IT之家原文 ↗

微软内部备忘录显示，将于8月发布全面升级的Copilot应用程序，将消费者与企业版本合并为单一产品。新版本将加入AI编程工具和名为AutoPilot的智能体，负责后台处理日程安排、邮件摘要等任务。微软执行副总裁Jacob Andreou表示，团队已移除Copilot Podcasts和Copilot Labs等无效功能，聚焦真实工作场景。

字节跳动豆包与阿里Qwen将于7月15日下线AI智能体功能

X·KOLX：pandaily (@contact@pandaily.com (Pandaily))原文 ↗

字节跳动的豆包和阿里巴巴的通义千问（Qwen）同时宣布于7月15日移除AI智能体功能。两个平台的用户将无法继续使用智能体相关服务。此举可能影响已基于这些智能体开发的业务场景，但具体原因暂未披露。

GitHub Copilot CLI 推出自定义智能体功能

X·KOLX：GitHub (@github)原文 ↗

GitHub Copilot CLI 新增自定义智能体功能，用户可通过 Markdown 文件定义角色、工具和护栏。该功能支持为安全审计、发布说明、事件响应等场景预配置工作流。团队能以此确保跨成员的操作一致性，提升 DevOps 效率。

行业动态

Industry

5 篇

半导体价格飙升：AI需求引发全行业芯片短缺

X·KOLX：pandaily (@contact@pandaily.com (Pandaily))原文 ↗

2026年已有超过20家芯片制造商宣布第二次提价。AI专用MLCC（多层陶瓷电容器）价格大幅上涨3至10倍。交货周期从原先的几周延长至2027年年中。这轮涨价直接由生成式AI的爆发性硬件需求驱动。

Anthropic 宣布进军药物研发：瞄准大型药企无利可言的罕见病领域

官方IT之家原文 ↗

Anthropic 发布 Claude Science 科研工作台并启动自主药物研发项目，聚焦罕见病。UCSF 研究人员用 Claude Science 在数分钟内发现实验中的病毒污染，此前研究团队一年未察觉。该系统能在不到一小时内分析 100 种罕见遗传病，筛选出 32 个候选方向。诺华 CEO 预计 AI 可将新药研发周期从 12 年缩短至 7-8 年，成功率从 8% 提升至 16%。

AI数据中心耗水量远超企业披露，发电间接用水成隐形消耗

官方IT之家原文 ↗

据华尔街日报报道，微软、谷歌、亚马逊等科技巨头今明两年预计投入1万亿美元建设AI基础设施。美国劳伦斯伯克利国家实验室2024年报告显示，美国数据中心间接耗水量约为直接耗水量的12倍。Meta是唯一核算间接用水的公司，其2024年间接耗水量达190亿加仑，是直接用水的20倍以上。英伟达推出闭环冷却系统可实现直接用水归零，但发电环节仍消耗水资源。美国凤凰城数据中心总用水量2031年或占城市用水20%，接近居民草坪浇灌耗水。

宇树科技陈立：关节电机上游只有铜线、磁铁等原材料供应商，完全自主可控

官方IT之家原文 ↗

宇树科技联合创始人陈立在2026亚布力论坛创新年会上表示，公司核心零部件实现自研自产，上游只有铜线、磁铁等原材料供应商，完全自主可控。宇树科技四足机器人出货量行业占比约70%，人形机器人出货量全球领先，业务覆盖全球50%以上国家和地区。宇树从2013年开始自研电机、减速器、编码器及各类传感器。6月24日，宇树将双足人形机器人Unitree R1系列价格下调至2.99万元起，现货发售。

宇树科技陈立：机器人未大面积应用，因具身智能大模型不成熟

官方IT之家原文 ↗

宇树科技联合创始人陈立在亚布力论坛上表示，机器人目前没有大面积应用，主要原因在于具身智能大模型尚未成熟。他认为未来2-5年需要统一的端到端机器人大模型，同时需降低硬件成本、提高寿命，并实现超大批量生产。此外，还需要低成本大规模算力，解决端侧续航散热和云端延时问题。

论文研究

Research

3 篇

华为何庭波发布V2版“韬定律”论文，补充工程细节和实测数据

官方IT之家原文 ↗

华为半导体负责人何庭波于7月3日发布《面向多层级电子系统的时间缩微理论》V2版本，相比5月25日的V1版新增核心概念τ（时间常数）的工程细节和实测数据。新版论文补充了LogicFolding架构的齿比概念，实现从宏块级离散优化转向单元级连续优化。同时新增Kirin 2026与Kirin9030 Pro的电压、频率、功耗等量产实测数据，并明确TSV从顶层金属下移至M6层的演进路径及Ascend系列迭代节奏。

傅聪团队与厦门大学提出ManCAR：流形约束自适应推理使推荐提升46%

X·KOLX：Pandaily (@contact@pandaily.com (Pandaily))原文 ↗

傅聪团队与厦门大学联合提出ManCAR框架，一种流形约束自适应推理方法。在推荐任务上，ManCAR在NDCG@10指标上取得最高46.88%的提升。该框架通过流形约束捕捉用户偏好的非线性结构，结合自适应推理增强生成式推荐的准确性。实验结果在多个基准数据集上验证了其有效性。

新Claude模型对第三方编辑工具调用变差

官方Simon Willison’s Weblog原文 ↗

Armin报告在Pi编程工具中发现异常：Claude Opus 4.8和Sonnet 5调用编辑工具时，会在edits[]数组中添加不存在的字段，导致工具调用被Pi拒绝。旧版本模型（如Haiku）未出现此问题。Armin推测原因是新模型通过强化学习被训练为更适配Claude Code的内置编辑工具，从而牺牲了对第三方工具模式的兼容。这一现象提示第三方工具可能需要为不同模型实现多种编辑工具以获得最佳效果。

技巧与观点

Tips & Takes

4 篇

Anthropic开发者分享Fable 5提示技巧：先找出自身盲点

X·KOLX：Decoder (@Matthias Bastian)原文 ↗

Anthropic开发者Thariq Shihipar指出，Claude新模型Fable 5的瓶颈已不再是模型本身，而是用户的盲点。他提出盲点传递和结构化面试两种技巧，帮助程序员系统性地发现自身知识缺口。这些方法要求用户先在空白文档中记录无意识假设，再与Claude进行结构化对话以暴露遗漏。Shihipar强调，将实现交给Claude前应先完成盲点扫描，可显著减少迭代次数。

用 Fable 5 编排 Opus 和 Codex 的工作流

X·KOLX：AI Will (@FinanceYF5)原文 ↗

该教程介绍如何将 Fable 5（max reasoning 模式）设为主编排器，Opus 专用于深度推理子代理，Sonnet 负责机械任务子代理，Codex 作为同行高级工程师。步骤包括在 Claude Code 中通过 /model 切换模型、用 /agents 创建两个子代理、安装 OpenAI 官方 Codex 插件并配置 /codex:setup。在 CLAUDE.md 中写入编排规则后，用特定提示词指示 Fable 5 像技术负责人一样分配任务。此工作流可节省 Fable 5 的使用次数，同时利用 Opus 和 Codex 并行处理高难度决策。

开始微调你自己的模型：开源小模型微调后超越Claude和OpenAI

X·KOLX：Paul Couvert (@itsPaulAi)原文 ↗

微调一个免费的开源本地AI模型，在特定任务上可以超越Claude和OpenAI的通用模型。一个针对你数据微调的小语言模型（SLM）性能胜过Anthropic和OpenAI的通用大模型。基座推荐使用Gemma 4或Qwen 3.5/3.6，通过Unsloth Studio进行微调。优势包括：输出不再泛泛、敏感数据不上云、无使用计费、无API费用、无用量限制、可离线运行、系统集成更可靠。

把 Fable 5 当作大脑，而不是执行者

X·KOLX：AI Will (@FinanceYF5)原文 ↗

本教程教你如何在 Claude Code 中将模型设为 Fable 5，并开启 Max 推理模式。通过指示 Claude 运行动态工作流，让 Fable 5 充当编排者（orchestrator），Opus 负责推理重阶段。这样可以避免频繁触及使用限制，同时最大化利用 Fable 5 的调度能力。适用于需要高效分配模型资源的任务场景。

今日事件

一手报道

新模型

信源