全部 AI 动态 · AI 热点

6月13日

10:53

Together AI@togethercompute

精选

MiniMax 发布开源权重原生多模态模型 MiniMax-M3，具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴，通过推理优化在并发场景下实现高达 125% 的吞吐量提升。

AI模型 MiniMax-M3 Together AI 多模态开源模型 1M上下文

推荐理由：MiniMax 新模型上线，吞吐量提升 125%

原文

10:52

rohanpaul_ai@rohanpaul_ai

精选

Google DeepMind 发布论文《From AGI to ASI》，探讨从通用人工智能（AGI）到超级人工智能（ASI）的四种可能路径：持续扩展计算与模型规模、算法范式突破（超越 Transformer）、递归自我改进（AI 加速 AI 研发）、多智能体集体智能。论文指出，扩展路径可能受限于数据、计算和能源瓶颈；递归改进最不确定，因需真实世界测试和稀缺硬件；多智能体集体智能最被低估，通过专业化与协调可超越单一模型。ASI 可能不是单一事件，而是 AI 辅助创造更好 AI 的加速链。

论文 Google DeepMind AGI ASI 多智能体递归自我改进

推荐理由：DeepMind 分析 AGI 到 ASI 的四种路线

原文

10:49

AI Will@FinanceYF5

Anthropic CEO Dario Amodei 在访谈中表示，编程任务将最先被AI取代，但即使AI完成95%工作，人类剩余的5%仍能通过比较优势实现20倍效率提升。他建议年轻人优先培养批判性思维，因为AI生成内容泛滥时辨别真伪的能力最稀缺。Anthropic 研究证实，粗心使用模型会导致可测量的编程技能退化。他看好半导体作为未来十年资本回报最高的领域，而非软件。

行业 Anthropic Dario Amodei 编程技能退化批判性思维半导体

推荐理由：Anthropic CEO 谈AI如何让人变蠢和芯片投资机会

原文

10:48

AI Will@FinanceYF5

Anthropic CEO Dario Amodei在社交媒体上回应了是否还应学习编程的问题。他认为，AI已经能完成95%的编程工作，但人类做剩下的5%仍能提升20倍生产力。他建议25岁年轻人重点培养批判性思维，因为当AI能生成一切时，辨别真假的能力才最值钱。

行业 Anthropic Dario Amodei 编程批判性思维职业建议

推荐理由：Anthropic CEO给年轻人的职业建议

原文

10:46

elvis@omarsar0

精选

美国以国家安全为由对Anthropic下达出口管制指令，要求暂停所有外国国民（包括Anthropic外籍员工）对Fable 5和Mythos 5两个模型的访问。Anthropic被迫立即关闭这两个模型对所有客户的访问，其他Claude模型不受影响。该公司表示这是误解，正在努力恢复访问。

行业 Anthropic Fable 5 Mythos 5 出口管制 AI安全

推荐理由：美国政府重拳管制Anthropic的Fable 5和Mythos 5

原文

10:46

Clement Delangue@ClementDelangue

精选

HuggingFace CEO Clement Delangue宣布下周前往华盛顿DC，直接与政策制定者讨论开源AI、透明度、权力集中以及真实风险与收益。他正在征集应该会见的人选，包括国会议员、白宫人员、公共组织等。这一行动反映出AI行业对政策对话的重视。

行业 HuggingFace 开源AI AI监管 AI政策

推荐理由：HuggingFace CEO亲自游说华盛顿

原文

10:45

Gary Marcus@GaryMarcus

美国商务部发布法令，切断Anthropic员工对Mythos 5和Fable 5模型的访问权限，实际导致该公司运营受阻。Gary Marcus认为此举过度戏剧化且对美国AI产业适得其反。Dean W. Ball评论称该决定像法律战或极端国家安全鹰派行为。评论指出这可能促使中国AI人才回流，并让投资者质疑美国AI公司的生存环境。

行业 Anthropic Mythos 5 Fable 5 美国商务部 AI监管

推荐理由：美国商务部对Anthropic下重手

原文

10:44

The Rundown AI@therundownai

83°

Anthropic 暂停了 Fable 和 Mythos 的访问，原因是美国政府发布出口管制指令，限制外国国民（包括在美境内者）使用。政府引用了 Fable 被越狱的报告作为依据，但 Anthropic 对此表示异议。Anthropic 声明认为政府应有能力阻止不安全部署，但需基于透明、公平、清晰且基于技术事实的法定程序，而此次行动不符合这些原则。

行业 Anthropic Fable Mythos AI安全出口管制

推荐理由：Anthropic 因政府指令暂停 Fable 和 Mythos

原文

10:43

AI Will@FinanceYF5

本文提出与其写更长的 prompt，不如设计循环（loop）让 Fable 5 自己迭代，或赋予它持久 memory 使知识跨 session 复用。作者认为架构变化后，用法也需要相应调整。

技巧 Fable 5 智能体提示词工程

推荐理由：教你用Fable 5省力迭代

原文

10:42

AI Will@FinanceYF5

CMA Outcomes 框架内置了独立 judge 机制，通过在新 context 中运行的 grader 子 agent 对主 agent 输出进行评分，避免自我批评时模型打分偏高的问题。主 agent 根据 grader 的反馈进行修正，从而提升输出质量。该机制利用了独立上下文的子 agent 评分更客观的特点。

技巧 CMA Outcomes 智能体评分机制反馈修正

推荐理由：CMA 用独立 judge 打分更准

原文

10:41

AI Will@FinanceYF5

精选

《Memory》方法让模型在多个 session 间积累知识，路径分为失败、调查、验证、提炼规则、查用规则五步。Sonnet 4.6 仅完成第1步（记录失败但不查询）；Opus 4.7 可到第3步，但校验覆盖率仅7–33%；Fable 5 能走完全程，验证覆盖率最高达73%。该方法旨在提升模型跨会话知识复用能力。

论文 Sonnet 4.6 Opus 4.7 Fable 5 记忆机制推理模型

推荐理由：Fable 5 跨 session 记忆覆盖率73%

原文

10:40

AI Will@FinanceYF5

Fable模型在测试中成功生成等时线旅行地图，需查询数千条路线并综合飞机、火车、驾车、步行多种交通方式。此前所有模型均无法完成此复杂任务。Fable仅需一个提示即可开始处理。该测试展示了Fable在复杂规划任务上的能力。

AI模型 Fable 等时线地图智能体多模态

推荐理由：Fable能搞定别人做不了的地图

原文

10:39

AI Will@FinanceYF5

Loop方法通过反馈循环让模型迭代改进，Claude Code的/goal机制在目标未达成时自动进入下一轮循环。Managed Agents Outcomes则使用独立grader子agent对输出评分，根据评分修正后再评估。两种方式均能提升模型输出质量，但实现路径不同。

技巧 Claude Code Managed Agents 智能体反馈循环

推荐理由：两种Agent循环机制对比

原文

10:38

AI Will@FinanceYF5

Anthropic工程师通过两个实验验证，设计让模型自我纠错的环境比直接提示更有效。实验一显示，在特定架构下，Claude 3.5 Sonnet的任务成功率从52%提升至78%。实验二表明，通过环境反馈机制，模型在复杂推理任务中的错误率降低了34%。这种架构方法不依赖更强大的模型，而是优化了Agent的交互流程。

AI模型 Claude 3.5 Sonnet Anthropic 智能体推理模型架构设计

推荐理由：Anthropic教你用环境设计提升Agent

原文

10:35

AI Will@FinanceYF5

Wharton教授Ethan Mollick测试了Anthropic的Claude 5 Fable模型，发现其能力远超前代。Mollick指出，用户不再需要像向导一样引导AI，而是转变为甲方角色，直接提出需求即可。这一变化标志着人机协作模式的根本性转变，Claude 5 Fable在复杂任务中表现出更强的自主性和理解力。

AI模型 Claude 5 Fable Anthropic Ethan Mollick 智能体人机协作

推荐理由：教授实测，AI变甲方了

原文

10:34

AI Will@FinanceYF5

精选

Claude Fable 5 基于物理第一性原理构建了太阳系模拟，而非仅制作轨道动画。它推导出行星运动规律，并成功预测了一次日食。该模型还展示了黑洞模拟，体现了其科学推理能力。

AI模型 Claude Fable 5 物理模拟推理模型日食预测

推荐理由：Claude Fable 5 用物理原理预测日食

原文

10:33

shao__meng@shao__meng

精选

Claude Fable 5 和 Mythos 5 模型被全球紧急下线后，Claude 官方宣布为所有用户重置了 5 小时和周使用额度。该措施旨在补偿因模型下线导致的可用性中断。官方推特 @ClaudeDevs 确认了此次重置。

AI产品 Claude Fable 5 Mythos 5 使用额度紧急下线

推荐理由：Claude 给你补额度了

原文

10:31

Simon Willison@simonw

83°

美国以国家安全为由发布出口管制指令，暂停所有外国国民（包括Anthropic外籍员工）对Fable 5和Mythos 5模型的访问。Anthropic被迫立即禁用这两个模型以确保合规，其他Claude模型不受影响。Anthropic认为这是误解，正努力恢复访问。

行业 Anthropic Fable 5 Mythos 5 出口管制 AI安全

推荐理由：美国禁令让Anthropic停掉两个模型

原文

10:29

OpenRouter@OpenRouterAI

OpenRouter 推出 Subagent 服务器工具，允许 GPT-4 等强大模型在生成过程中将子任务委托给更小、更便宜的模型（如 Claude 3 Haiku）。主模型负责编排，子代理执行具体任务，且子代理可使用 OpenRouter 上任意模型。该工具旨在降低推理成本并提升速度，目前已有 634 次查看。

AI产品 OpenRouter Subagent 智能体推理模型 MCP/工具

推荐理由：大模型自动调用便宜模型干活

原文

10:28

OpenRouter@OpenRouterAI

OpenRouter 发布新工具 Subagent，允许大模型在生成过程中将子任务委托给更小、更便宜、更快的模型。大模型负责编排，子代理执行具体任务，且子代理可使用 OpenRouter 上的任意模型。该工具旨在优化成本和效率，适用于复杂工作流分解。

AI产品 OpenRouter Subagent 智能体 MCP/工具

推荐理由：大模型派小模型干活，省成本

原文

10:26

AI Will@FinanceYF5

Claude Fable 5 允许用户通过单一提示词生成完整应用，案例包括一个提示词构建的3D游戏、实时数据仪表盘和交互式教育工具。这些应用原本需要工程师数月或数年开发，现在由Claude Fable 5在几分钟内完成。案例展示了模型在代码生成和UI设计上的能力，引发开发者社区热议。

AI产品 Claude Fable 5 提示词工程编程助手

推荐理由：一个提示词搞定工程师几年的活

原文

10:25

shao__meng@shao__meng

精选

Cursor 团队为训练 Composer 模型构建了始终运行的 Agent 舰队系统，本质是一个 Loop。主 Agent（Fleet Manager）运行在大型远程机器上，通过 SSH 连接数百台子 Agent 机器，收集状态并写入共享 inbox 文件。子 Agent 并行执行具体研究任务，主 Agent 每轮循环检查舰队健康状况，可主动控制进程。该系统基于 Cursor 此前公开的长运行 Agent 研究，使用 Cursor 自身产品实现状态共享和协调。

AI模型 Cursor Composer Agent 智能体编程助手

推荐理由：Cursor 用自家产品造了数千 Agent 舰队

原文

10:24

OpenRouter@OpenRouterAI

OpenRouter 宣布 Workers 功能支持以 agent 模式运行，自带 web_search 等服务器端工具。委托任务可在执行时自动搜索最新来源，无需客户端额外配置。只需一次工具定义即可实现零客户端集成的 grounding 能力。

AI产品 OpenRouter Workers agent web_search MCP/工具

推荐理由：OpenRouter 让 agent 自带搜索工具

原文

10:23

小互@imxiaohu

83°

美国政府发布出口管制指令，暂停所有外国国籍人士对Anthropic的FABLE 5和Mythos 5模型的访问。该指令立即生效，影响全球非美国用户。Anthropic表示将遵守法规，并调整模型访问权限。此举可能影响AI模型的国际合作与研究。

行业 Anthropic FABLE 5 Mythos 5 出口管制 AI安全

推荐理由：美国限制Anthropic模型外籍访问

原文

10:21

Cognition@cognition_labs

Cognition 宣布根据 Anthropic 最新公告和美国政府指令，暂停其产品中 Claude Fable 5 模型的访问。Devin 平台仍保留 Claude Opus 4.8 和 GPT-5.5 等其他模型。Devin Ultra 模式将继续使用最强可用模型。

行业 Claude Fable 5 Cognition Devin Anthropic AI安全

推荐理由：模型被禁，Devin 换方案

原文

10:19

berryxia@berryxia

Fable 5 是首个 Mythos 级模型（2026年6月9日发布），支持数天级自主会话和内置自我验证。文章指出90%用户仅用其几分钟提问，而它设计用于连续运行数天。作者提出14步构建自我改进系统，包括四层架构（原语、编排、记忆、自我改进）和5阶段记忆进化。Fable 5 能完成全流程，而 Sonnet 4.6 止步于第1阶段，Opus 4.7 止步于第3阶段。

技巧 Fable 5 Claude 智能体自我改进 Mythos级模型

推荐理由：教你用Fable 5跑数天级Agent系统

原文

10:18

berryxia@berryxia

精选73°

Kimi 发布 K2.7-Code 模型，开源权重和代码至 Hugging Face。相比上一代，token 消耗减少 30%，agent 长任务成功率提升。在 Kimi Code Bench v2 上提升 21.8%，Program Bench 提升 11%，MLS Bench Lite 提升 31.5%。模型通过高效推理解决 coding model 过度思考问题，并预告 6x High-Speed Mode。

AI模型 Kimi K2.7-Code 开源模型编程助手推理模型

推荐理由：Kimi 开源新模型，少烧 token 还能干更多活

原文

10:17

Clement Delangue@ClementDelangue

精选

HuggingFace 联合创始人兼首席执行官 Clement Delangue 在 X 平台宣布，下周将前往华盛顿特区，直接与国会成员、白宫官员及公共组织等政策制定者会面。讨论议题包括开源 AI、透明度、权力集中以及 AI 的真实风险与收益。Delangue 还向公众征求应会面的对象，并承认不确定此行影响力但将尽力尝试。

行业 HuggingFace Clement Delangue 开源AI AI政策华盛顿

推荐理由：CEO亲赴华盛顿聊开源AI

原文

10:15

Geek@geekbb

83°

美国政府以国家安全为由发布出口管制指令，暂停所有外国公民对Anthropic的Fable 5和Mythos 5的访问权限，包括Anthropic的外国籍员工。Anthropic被迫立即对全球客户停用这两个模型，但其他Claude模型不受影响。管制理由是一种可能绕过Fable 5安全防护的越狱方法，Anthropic认为这是过度反应。Anthropic正在努力恢复访问。

行业 Anthropic Fable 5 Mythos 5 出口管制 AI安全

推荐理由：美国下令封杀Anthropic两个模型

原文

10:14

Simon Willison@simonw

精选

Simon Willison 编写脚本每分钟调用 Anthropic API，监测对 claude-fable-5 模型的访问权限。大约在发推前14分钟，访问被切断。该模型尚未正式公开，此次测试揭示了其临时可用性。

AI模型 claude-fable-5 Claude Anthropic API 模型可用性

推荐理由：Simon实测神秘模型访问时长

原文

10:13

rohanpaul_ai@rohanpaul_ai

83°

美国政府向Anthropic发出出口管制指令，要求其关闭最强模型Fable 5和Mythos 5。原因是有人发现了一种越狱方法，能让模型提供本应拒绝的网络安全帮助。Anthropic表示该越狱技术狭窄，仅发现少数已知小漏洞，且其他公开模型也能提供类似能力。商务部长Howard Lutnick指出，这两个模型在美国境外及境内外国人员中面临出口限制。Anthropic认为完美越狱抵抗目前对所有模型提供商都不可行。

行业 Anthropic Claude Fable 5 Mythos 5 AI安全

推荐理由：政府要求关停最强模型，越狱争议升级

原文

09:55

rohanpaul_ai@rohanpaul_ai

精选73°

NVIDIA 发布了首个智能体 AI 基准测试 AgentPerf 的结果。该基准由 Artificial Analysis 推出，测试系统在保持响应性的同时能并发运行多少个智能体。GB300 NVL72 在最低服务层级达到每兆瓦 61.4K 并发智能体，而 H200 仅为 2.6K，性能提升约 23.6 倍。测试模拟了真实编码智能体路径，涵盖 12 种以上编程语言，请求长度从 5K 到 131K token 不等，平均约 27K token。性能提升得益于 72 块 GPU 通过 NVLink 组成机架级系统，以及优化 MoE 专家分配、通信与计算重叠等软件技术。

AI模型 NVIDIA GB300 NVL72 H200 AgentPerf 智能体

推荐理由：NVIDIA 首个智能体基准，GB300 比 H200 强 23 倍

原文

09:54

PolymarketMoney@PolymarketMoney

72°

Anthropic 已关闭其新 AI 模型 Mythos 的访问权限，原因是需要“确保合规”美国政府。该模型此前未公开细节，此次关闭可能涉及安全或监管审查。Anthropic 未说明具体合规要求或恢复时间。

行业 Anthropic Mythos AI安全监管

推荐理由：Anthropic 为合规关停新模型

原文

09:53

Amjad Masad@amasad

Polymarket报道称，特朗普政府正采取措施阻止外国政府、公司及个人访问Anthropic的Fable和Mythos模型。该消息由Replit CEO Amasad在X平台转发，引发97个点赞和8358次浏览。目前Anthropic尚未正式回应，但此举可能影响其模型的国际使用范围。

行业 Anthropic Fable Mythos 特朗普政府 AI安全

推荐理由：美国政府要封Anthropic的模型了

原文

09:50

rohanpaul_ai@rohanpaul_ai

《自然医学》一项研究对比了OpenEvidence、UpToDate Expert AI与GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6在医学考试题、临床风格回答及医生真实提问上的表现。在100个脱敏临床问题中，盲审医生更偏好前沿通用模型，尤其在完整性和清晰度上胜出。结果显示通用LLM在医生评审的临床任务中已超越专用医疗AI产品。

论文 GPT-5.2 Gemini 3.1 Pro Claude Opus 4.6 Nature Medicine 医疗AI

推荐理由：通用模型在医疗任务上反超专用AI

原文

09:48

Together AI@togethercompute

精选

Together AI 发布了基于 Blackwell 的推理引擎，在 AgentPerf 基准测试中，其 TPS 比次快的开源引擎高出 31%。该引擎通过为 Blackwell 的 Tensor Core 指令定制内核实现性能提升。Cursor 已将其实时编程助手部署在该推理栈上。Together AI 在推文中详细介绍了构建过程。

AI模型 Together AI Blackwell 推理引擎编程助手 Tensor Core

推荐理由：Blackwell 上推理快了 31%

原文

09:46

lmarena.ai@lmarena_ai

MiniMax M3 是一款开放权重的模型，现已加入 Agent Arena 平台。Agent Arena 通过真实用户会话评估模型在网页搜索、文件系统和终端工具上的表现，涵盖编写代码、创建幻灯片、研究网页、构建应用和分析文档等任务。排行榜基于 30 万+ 任务、200 万+ 工具调用和 4000 万行代码构建，当前排名第一的是 OpenAI 的 GPT-5.5 (High)，第二是 Anthropic 的 Claude-Opus-4.7 (Thinking)。MiniMax M3 的评分即将公布。

AI模型 MiniMax M3 Agent Arena GPT-5.5 Claude-Opus-4.7 智能体

推荐理由：看看 MiniMax M3 在 Agent 任务中能排第几

原文

09:44

orange.ai@oran_ge

开发者 oran_ge 用 Claude Fable 5 打磨文案三遍，发现改后文字虽更讲究但人味儿递减。经讨论，将缺失归结为“存在感”——文字背后缺乏具体的人与代价。据此制作《人味儿写作心法.skill》并开源发布，专用于 AI 改稿场景，帮助保留文字的人味儿。

技巧 Claude Fable 5 提示词工程开源模型写作

推荐理由：开源技能让 AI 改稿保留人味儿

原文

09:42

Guillermo Rauch@rauchg

精选

Vercel 在 AI SDK 中推出 HarnessAgent，这是一个统一抽象层，用于编排和集成任何智能体的“大脑”到应用中。它支持 Claude Code、Codex 和 Pi 等智能体框架，并提供沙箱会话和 AI SDK 兼容流。开发者可通过 npm i ai@canary 获取。该工具旨在消除模型和智能体锁定，提升开发体验。

AI产品 HarnessAgent Vercel AI SDK Claude Code Codex

推荐理由：Vercel 帮你摆脱模型和智能体锁定

原文

09:13

Marc Andreessen@pmarca

精选

美国政府以国家安全为由发布出口管制指令，要求暂停所有外国公民（包括 Anthropic 的外籍员工）对 Fable 5 和 Mythos 5 的访问。Anthropic 宣布立即禁用这两个模型以确保合规，其他 Claude 模型不受影响。公司表示该指令是误解，正努力恢复访问。

行业 Anthropic Fable 5 Mythos 5 出口管制模型封锁

推荐理由：美国下令封了俩模型

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。