VOL.2026.07.05·49 STORIES·AITOP DAILY

AITOP日报

二〇二六年七月五日 星期日DAILY · 每早八时
01

模型发布/更新

Model Releases
5

突破国际难题:我国成功研制全球首款基于相变忆阻器的神经动力学系统芯片

官方IT之家原文 ↗

北京大学杨玉超团队联合中科院上海微系统所等在《科学》发表论文,成功研制全球首个基于相变忆阻器的毫秒级神经动力学系统芯片。该芯片采用40纳米工艺,单步运算时延压缩至2.12毫秒,首次进入毫秒级。相比专用加速器速度提升3.82~36.27倍、功耗降低11.75~24.73倍;在脑皮层表面重建任务中比NVIDIA A100 GPU提速50.38~478.18倍。研究解决了相变忆阻器“可控存内计算”国际难题。

Mistral 开源 Leanstral 1.5,在形式化数学基准中表现出色且发现真实代码漏洞

X·KOLX:Decoder (@Matthias Bastian)原文 ↗

Mistral AI 发布了 Leanstral 1.5,这是一个用于 Lean 4 形式化验证的开源模型。该模型在多个形式化数学基准测试中取得了领先成绩,例如在 miniF2F 测试中准确率达到 60%,超过此前的最佳模型。此外,Leanstral 1.5 在扫描 57 个开源代码仓库时,成功发现了 5 个此前未知的 bug。这些发现展示了该模型在数学证明和代码正确性验证方面的实用价值。

02

产品发布/更新

Product
5

Anthropic 发布 Claude Science Beta:面向可重复科学流程的多智能体工作台

X·KOLX:marktechpost (@Michal Sutter)原文 ↗

Anthropic 于 2026 年 6 月 30 日推出 Claude Science beta,基于现有 Claude 模型运行。系统包含一个协调代理、多个领域专家代理和一个审查代理,可自动修正引用和数字。每个图表都附带完整代码、环境和消息历史。它支持本地机器、SSH 上的 HPC 以及 Modal 的计算管理,可连接 60 多个数据库和 NVIDIA BioNeMo 技能。

LlamaIndex发布Index v2:面向代理检索的持久化数据管道

X·KOLX:Jerry Liu (@jerryjliu0)原文 ↗

LlamaIndex推出了Index v2,一个用于现代代理检索的综合工具。它提供持久化数据管道,可连接数据源、索引并更新大型知识库,暴露语义搜索、正则grep、文件搜索和读取等类似文件系统操作的工具。该工具可集成到任何AI代理中,让代理自主爬取知识库解决复杂任务。参考实现legal-kb展示了在法律和金融领域的应用,具备版本控制、可视化引用和数据导出能力。

03

行业动态

Industry
5

Anthropic 宣布进军药物研发:瞄准大型药企无利可言的罕见病领域

官方IT之家原文 ↗

Anthropic 发布 Claude Science 科研工作台并启动自主药物研发项目,聚焦罕见病。UCSF 研究人员用 Claude Science 在数分钟内发现实验中的病毒污染,此前研究团队一年未察觉。该系统能在不到一小时内分析 100 种罕见遗传病,筛选出 32 个候选方向。诺华 CEO 预计 AI 可将新药研发周期从 12 年缩短至 7-8 年,成功率从 8% 提升至 16%。

AI数据中心耗水量远超企业披露,发电间接用水成隐形消耗

官方IT之家原文 ↗

据华尔街日报报道,微软、谷歌、亚马逊等科技巨头今明两年预计投入1万亿美元建设AI基础设施。美国劳伦斯伯克利国家实验室2024年报告显示,美国数据中心间接耗水量约为直接耗水量的12倍。Meta是唯一核算间接用水的公司,其2024年间接耗水量达190亿加仑,是直接用水的20倍以上。英伟达推出闭环冷却系统可实现直接用水归零,但发电环节仍消耗水资源。美国凤凰城数据中心总用水量2031年或占城市用水20%,接近居民草坪浇灌耗水。

宇树科技陈立:关节电机上游只有铜线、磁铁等原材料供应商,完全自主可控

官方IT之家原文 ↗

宇树科技联合创始人陈立在2026亚布力论坛创新年会上表示,公司核心零部件实现自研自产,上游只有铜线、磁铁等原材料供应商,完全自主可控。宇树科技四足机器人出货量行业占比约70%,人形机器人出货量全球领先,业务覆盖全球50%以上国家和地区。宇树从2013年开始自研电机、减速器、编码器及各类传感器。6月24日,宇树将双足人形机器人Unitree R1系列价格下调至2.99万元起,现货发售。

04

论文研究

Research
3

华为何庭波发布V2版“韬定律”论文,补充工程细节和实测数据

官方IT之家原文 ↗

华为半导体负责人何庭波于7月3日发布《面向多层级电子系统的时间缩微理论》V2版本,相比5月25日的V1版新增核心概念τ(时间常数)的工程细节和实测数据。新版论文补充了LogicFolding架构的齿比概念,实现从宏块级离散优化转向单元级连续优化。同时新增Kirin 2026与Kirin9030 Pro的电压、频率、功耗等量产实测数据,并明确TSV从顶层金属下移至M6层的演进路径及Ascend系列迭代节奏。

傅聪团队与厦门大学提出ManCAR:流形约束自适应推理使推荐提升46%

X·KOLX:Pandaily (@contact@pandaily.com (Pandaily))原文 ↗

傅聪团队与厦门大学联合提出ManCAR框架,一种流形约束自适应推理方法。在推荐任务上,ManCAR在NDCG@10指标上取得最高46.88%的提升。该框架通过流形约束捕捉用户偏好的非线性结构,结合自适应推理增强生成式推荐的准确性。实验结果在多个基准数据集上验证了其有效性。

新Claude模型对第三方编辑工具调用变差

官方Simon Willison’s Weblog原文 ↗

Armin报告在Pi编程工具中发现异常:Claude Opus 4.8和Sonnet 5调用编辑工具时,会在edits[]数组中添加不存在的字段,导致工具调用被Pi拒绝。旧版本模型(如Haiku)未出现此问题。Armin推测原因是新模型通过强化学习被训练为更适配Claude Code的内置编辑工具,从而牺牲了对第三方工具模式的兼容。这一现象提示第三方工具可能需要为不同模型实现多种编辑工具以获得最佳效果。

05

技巧与观点

Tips & Takes
4

Anthropic开发者分享Fable 5提示技巧:先找出自身盲点

X·KOLX:Decoder (@Matthias Bastian)原文 ↗

Anthropic开发者Thariq Shihipar指出,Claude新模型Fable 5的瓶颈已不再是模型本身,而是用户的盲点。他提出盲点传递和结构化面试两种技巧,帮助程序员系统性地发现自身知识缺口。这些方法要求用户先在空白文档中记录无意识假设,再与Claude进行结构化对话以暴露遗漏。Shihipar强调,将实现交给Claude前应先完成盲点扫描,可显著减少迭代次数。

用 Fable 5 编排 Opus 和 Codex 的工作流

X·KOLX:AI Will (@FinanceYF5)原文 ↗

该教程介绍如何将 Fable 5(max reasoning 模式)设为主编排器,Opus 专用于深度推理子代理,Sonnet 负责机械任务子代理,Codex 作为同行高级工程师。步骤包括在 Claude Code 中通过 /model 切换模型、用 /agents 创建两个子代理、安装 OpenAI 官方 Codex 插件并配置 /codex:setup。在 CLAUDE.md 中写入编排规则后,用特定提示词指示 Fable 5 像技术负责人一样分配任务。此工作流可节省 Fable 5 的使用次数,同时利用 Opus 和 Codex 并行处理高难度决策。

开始微调你自己的模型:开源小模型微调后超越Claude和OpenAI

X·KOLX:Paul Couvert (@itsPaulAi)原文 ↗

微调一个免费的开源本地AI模型,在特定任务上可以超越Claude和OpenAI的通用模型。一个针对你数据微调的小语言模型(SLM)性能胜过Anthropic和OpenAI的通用大模型。基座推荐使用Gemma 4或Qwen 3.5/3.6,通过Unsloth Studio进行微调。优势包括:输出不再泛泛、敏感数据不上云、无使用计费、无API费用、无用量限制、可离线运行、系统集成更可靠。

49
今日事件
30
一手报道
8
新模型
21
信源
AITOP · 编辑系统自动生成