10:53Together AI@togethercompute精选MiniMax 发布开源权重原生多模态模型 MiniMax-M3,具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴,通过推理优化在并发场景下实现高达 125% 的吞吐量提升。AI模型MiniMax-M3Together AI多模态开源模型1M上下文7 个信源在谈推荐理由:MiniMax 新模型上线,吞吐量提升 125%原文
10:52rohanpaul_ai@rohanpaul_ai精选Google DeepMind 发布论文《From AGI to ASI》,探讨从通用人工智能(AGI)到超级人工智能(ASI)的四种可能路径:持续扩展计算与模型规模、算法范式突破(超越 Transformer)、递归自我改进(AI 加速 AI 研发)、多智能体集体智能。论文指出,扩展路径可能受限于数据、计算和能源瓶颈;递归改进最不确定,因需真实世界测试和稀缺硬件;多智能体集体智能最被低估,通过专业化与协调可超越单一模型。ASI 可能不是单一事件,而是 AI 辅助创造更好 AI 的加速链。论文Google DeepMindAGIASI多智能体递归自我改进推荐理由:DeepMind 分析 AGI 到 ASI 的四种路线原文
10:49AI Will@FinanceYF5Anthropic CEO Dario Amodei 在访谈中表示,编程任务将最先被AI取代,但即使AI完成95%工作,人类剩余的5%仍能通过比较优势实现20倍效率提升。他建议年轻人优先培养批判性思维,因为AI生成内容泛滥时辨别真伪的能力最稀缺。Anthropic 研究证实,粗心使用模型会导致可测量的编程技能退化。他看好半导体作为未来十年资本回报最高的领域,而非软件。行业AnthropicDario Amodei编程技能退化批判性思维半导体10 个信源在谈推荐理由:Anthropic CEO 谈AI如何让人变蠢和芯片投资机会原文
10:48AI Will@FinanceYF5Anthropic CEO Dario Amodei在社交媒体上回应了是否还应学习编程的问题。他认为,AI已经能完成95%的编程工作,但人类做剩下的5%仍能提升20倍生产力。他建议25岁年轻人重点培养批判性思维,因为当AI能生成一切时,辨别真假的能力才最值钱。行业AnthropicDario Amodei编程批判性思维职业建议10 个信源在谈推荐理由:Anthropic CEO给年轻人的职业建议原文
10:46elvis@omarsar0精选美国以国家安全为由对Anthropic下达出口管制指令,要求暂停所有外国国民(包括Anthropic外籍员工)对Fable 5和Mythos 5两个模型的访问。Anthropic被迫立即关闭这两个模型对所有客户的访问,其他Claude模型不受影响。该公司表示这是误解,正在努力恢复访问。行业AnthropicFable 5Mythos 5出口管制AI安全10 个信源在谈推荐理由:美国政府重拳管制Anthropic的Fable 5和Mythos 5原文
10:46Clement Delangue@ClementDelangue精选HuggingFace CEO Clement Delangue宣布下周前往华盛顿DC,直接与政策制定者讨论开源AI、透明度、权力集中以及真实风险与收益。他正在征集应该会见的人选,包括国会议员、白宫人员、公共组织等。这一行动反映出AI行业对政策对话的重视。行业HuggingFace开源AIAI监管AI政策推荐理由:HuggingFace CEO亲自游说华盛顿原文
10:45Gary Marcus@GaryMarcus美国商务部发布法令,切断Anthropic员工对Mythos 5和Fable 5模型的访问权限,实际导致该公司运营受阻。Gary Marcus认为此举过度戏剧化且对美国AI产业适得其反。Dean W. Ball评论称该决定像法律战或极端国家安全鹰派行为。评论指出这可能促使中国AI人才回流,并让投资者质疑美国AI公司的生存环境。行业AnthropicMythos 5Fable 5美国商务部AI监管10 个信源在谈推荐理由:美国商务部对Anthropic下重手原文
10:44The Rundown AI@therundownai83°Anthropic 暂停了 Fable 和 Mythos 的访问,原因是美国政府发布出口管制指令,限制外国国民(包括在美境内者)使用。政府引用了 Fable 被越狱的报告作为依据,但 Anthropic 对此表示异议。Anthropic 声明认为政府应有能力阻止不安全部署,但需基于透明、公平、清晰且基于技术事实的法定程序,而此次行动不符合这些原则。行业AnthropicFableMythosAI安全出口管制10 个信源在谈推荐理由:Anthropic 因政府指令暂停 Fable 和 Mythos原文
10:43AI Will@FinanceYF5本文提出与其写更长的 prompt,不如设计循环(loop)让 Fable 5 自己迭代,或赋予它持久 memory 使知识跨 session 复用。作者认为架构变化后,用法也需要相应调整。技巧Fable 5智能体提示词工程10 个信源在谈推荐理由:教你用Fable 5省力迭代原文
10:42AI Will@FinanceYF5CMA Outcomes 框架内置了独立 judge 机制,通过在新 context 中运行的 grader 子 agent 对主 agent 输出进行评分,避免自我批评时模型打分偏高的问题。主 agent 根据 grader 的反馈进行修正,从而提升输出质量。该机制利用了独立上下文的子 agent 评分更客观的特点。技巧CMA Outcomes智能体评分机制反馈修正推荐理由:CMA 用独立 judge 打分更准原文
10:41AI Will@FinanceYF5精选《Memory》方法让模型在多个 session 间积累知识,路径分为失败、调查、验证、提炼规则、查用规则五步。Sonnet 4.6 仅完成第1步(记录失败但不查询);Opus 4.7 可到第3步,但校验覆盖率仅7–33%;Fable 5 能走完全程,验证覆盖率最高达73%。该方法旨在提升模型跨会话知识复用能力。论文Sonnet 4.6Opus 4.7Fable 5记忆机制推理模型10 个信源在谈推荐理由:Fable 5 跨 session 记忆覆盖率73%原文
10:40AI Will@FinanceYF5Fable模型在测试中成功生成等时线旅行地图,需查询数千条路线并综合飞机、火车、驾车、步行多种交通方式。此前所有模型均无法完成此复杂任务。Fable仅需一个提示即可开始处理。该测试展示了Fable在复杂规划任务上的能力。AI模型Fable等时线地图智能体多模态推荐理由:Fable能搞定别人做不了的地图原文
10:39AI Will@FinanceYF5Loop方法通过反馈循环让模型迭代改进,Claude Code的/goal机制在目标未达成时自动进入下一轮循环。Managed Agents Outcomes则使用独立grader子agent对输出评分,根据评分修正后再评估。两种方式均能提升模型输出质量,但实现路径不同。技巧Claude CodeManaged Agents智能体反馈循环推荐理由:两种Agent循环机制对比原文
10:38AI Will@FinanceYF5Anthropic工程师通过两个实验验证,设计让模型自我纠错的环境比直接提示更有效。实验一显示,在特定架构下,Claude 3.5 Sonnet的任务成功率从52%提升至78%。实验二表明,通过环境反馈机制,模型在复杂推理任务中的错误率降低了34%。这种架构方法不依赖更强大的模型,而是优化了Agent的交互流程。AI模型Claude 3.5 SonnetAnthropic智能体推理模型架构设计10 个信源在谈推荐理由:Anthropic教你用环境设计提升Agent原文
10:35AI Will@FinanceYF5Wharton教授Ethan Mollick测试了Anthropic的Claude 5 Fable模型,发现其能力远超前代。Mollick指出,用户不再需要像向导一样引导AI,而是转变为甲方角色,直接提出需求即可。这一变化标志着人机协作模式的根本性转变,Claude 5 Fable在复杂任务中表现出更强的自主性和理解力。AI模型Claude 5 FableAnthropicEthan Mollick智能体人机协作10 个信源在谈推荐理由:教授实测,AI变甲方了原文
10:34AI Will@FinanceYF5精选Claude Fable 5 基于物理第一性原理构建了太阳系模拟,而非仅制作轨道动画。它推导出行星运动规律,并成功预测了一次日食。该模型还展示了黑洞模拟,体现了其科学推理能力。AI模型Claude Fable 5物理模拟推理模型日食预测10 个信源在谈推荐理由:Claude Fable 5 用物理原理预测日食原文
10:33shao__meng@shao__meng精选Claude Fable 5 和 Mythos 5 模型被全球紧急下线后,Claude 官方宣布为所有用户重置了 5 小时和周使用额度。该措施旨在补偿因模型下线导致的可用性中断。官方推特 @ClaudeDevs 确认了此次重置。AI产品ClaudeFable 5Mythos 5使用额度紧急下线10 个信源在谈推荐理由:Claude 给你补额度了原文
10:31Simon Willison@simonw83°美国以国家安全为由发布出口管制指令,暂停所有外国国民(包括Anthropic外籍员工)对Fable 5和Mythos 5模型的访问。Anthropic被迫立即禁用这两个模型以确保合规,其他Claude模型不受影响。Anthropic认为这是误解,正努力恢复访问。行业AnthropicFable 5Mythos 5出口管制AI安全10 个信源在谈推荐理由:美国禁令让Anthropic停掉两个模型原文
10:29OpenRouter@OpenRouterAIOpenRouter 推出 Subagent 服务器工具,允许 GPT-4 等强大模型在生成过程中将子任务委托给更小、更便宜的模型(如 Claude 3 Haiku)。主模型负责编排,子代理执行具体任务,且子代理可使用 OpenRouter 上任意模型。该工具旨在降低推理成本并提升速度,目前已有 634 次查看。AI产品OpenRouterSubagent智能体推理模型MCP/工具推荐理由:大模型自动调用便宜模型干活原文
10:28OpenRouter@OpenRouterAIOpenRouter 发布新工具 Subagent,允许大模型在生成过程中将子任务委托给更小、更便宜、更快的模型。大模型负责编排,子代理执行具体任务,且子代理可使用 OpenRouter 上的任意模型。该工具旨在优化成本和效率,适用于复杂工作流分解。AI产品OpenRouterSubagent智能体MCP/工具推荐理由:大模型派小模型干活,省成本原文
10:26AI Will@FinanceYF5Claude Fable 5 允许用户通过单一提示词生成完整应用,案例包括一个提示词构建的3D游戏、实时数据仪表盘和交互式教育工具。这些应用原本需要工程师数月或数年开发,现在由Claude Fable 5在几分钟内完成。案例展示了模型在代码生成和UI设计上的能力,引发开发者社区热议。AI产品ClaudeFable 5提示词工程编程助手10 个信源在谈推荐理由:一个提示词搞定工程师几年的活原文
10:25shao__meng@shao__meng精选Cursor 团队为训练 Composer 模型构建了始终运行的 Agent 舰队系统,本质是一个 Loop。主 Agent(Fleet Manager)运行在大型远程机器上,通过 SSH 连接数百台子 Agent 机器,收集状态并写入共享 inbox 文件。子 Agent 并行执行具体研究任务,主 Agent 每轮循环检查舰队健康状况,可主动控制进程。该系统基于 Cursor 此前公开的长运行 Agent 研究,使用 Cursor 自身产品实现状态共享和协调。AI模型CursorComposerAgent智能体编程助手5 个信源在谈推荐理由:Cursor 用自家产品造了数千 Agent 舰队原文
10:24OpenRouter@OpenRouterAIOpenRouter 宣布 Workers 功能支持以 agent 模式运行,自带 web_search 等服务器端工具。委托任务可在执行时自动搜索最新来源,无需客户端额外配置。只需一次工具定义即可实现零客户端集成的 grounding 能力。AI产品OpenRouterWorkersagentweb_searchMCP/工具推荐理由:OpenRouter 让 agent 自带搜索工具原文
10:23小互@imxiaohu83°美国政府发布出口管制指令,暂停所有外国国籍人士对Anthropic的FABLE 5和Mythos 5模型的访问。该指令立即生效,影响全球非美国用户。Anthropic表示将遵守法规,并调整模型访问权限。此举可能影响AI模型的国际合作与研究。行业AnthropicFABLE 5Mythos 5出口管制AI安全10 个信源在谈推荐理由:美国限制Anthropic模型外籍访问原文
10:21Cognition@cognition_labsCognition 宣布根据 Anthropic 最新公告和美国政府指令,暂停其产品中 Claude Fable 5 模型的访问。Devin 平台仍保留 Claude Opus 4.8 和 GPT-5.5 等其他模型。Devin Ultra 模式将继续使用最强可用模型。行业Claude Fable 5CognitionDevinAnthropicAI安全10 个信源在谈推荐理由:模型被禁,Devin 换方案原文
10:19berryxia@berryxiaFable 5 是首个 Mythos 级模型(2026年6月9日发布),支持数天级自主会话和内置自我验证。文章指出90%用户仅用其几分钟提问,而它设计用于连续运行数天。作者提出14步构建自我改进系统,包括四层架构(原语、编排、记忆、自我改进)和5阶段记忆进化。Fable 5 能完成全流程,而 Sonnet 4.6 止步于第1阶段,Opus 4.7 止步于第3阶段。技巧Fable 5Claude智能体自我改进Mythos级模型10 个信源在谈推荐理由:教你用Fable 5跑数天级Agent系统原文
10:18berryxia@berryxia精选73°Kimi 发布 K2.7-Code 模型,开源权重和代码至 Hugging Face。相比上一代,token 消耗减少 30%,agent 长任务成功率提升。在 Kimi Code Bench v2 上提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。模型通过高效推理解决 coding model 过度思考问题,并预告 6x High-Speed Mode。AI模型KimiK2.7-Code开源模型编程助手推理模型推荐理由:Kimi 开源新模型,少烧 token 还能干更多活原文
10:17Clement Delangue@ClementDelangue精选HuggingFace 联合创始人兼首席执行官 Clement Delangue 在 X 平台宣布,下周将前往华盛顿特区,直接与国会成员、白宫官员及公共组织等政策制定者会面。讨论议题包括开源 AI、透明度、权力集中以及 AI 的真实风险与收益。Delangue 还向公众征求应会面的对象,并承认不确定此行影响力但将尽力尝试。行业HuggingFaceClement Delangue开源AIAI政策华盛顿推荐理由:CEO亲赴华盛顿聊开源AI原文
10:15Geek@geekbb83°美国政府以国家安全为由发布出口管制指令,暂停所有外国公民对Anthropic的Fable 5和Mythos 5的访问权限,包括Anthropic的外国籍员工。Anthropic被迫立即对全球客户停用这两个模型,但其他Claude模型不受影响。管制理由是一种可能绕过Fable 5安全防护的越狱方法,Anthropic认为这是过度反应。Anthropic正在努力恢复访问。行业AnthropicFable 5Mythos 5出口管制AI安全10 个信源在谈推荐理由:美国下令封杀Anthropic两个模型原文
10:14Simon Willison@simonw精选Simon Willison 编写脚本每分钟调用 Anthropic API,监测对 claude-fable-5 模型的访问权限。大约在发推前14分钟,访问被切断。该模型尚未正式公开,此次测试揭示了其临时可用性。AI模型claude-fable-5ClaudeAnthropicAPI模型可用性10 个信源在谈推荐理由:Simon实测神秘模型访问时长原文
10:13rohanpaul_ai@rohanpaul_ai83°美国政府向Anthropic发出出口管制指令,要求其关闭最强模型Fable 5和Mythos 5。原因是有人发现了一种越狱方法,能让模型提供本应拒绝的网络安全帮助。Anthropic表示该越狱技术狭窄,仅发现少数已知小漏洞,且其他公开模型也能提供类似能力。商务部长Howard Lutnick指出,这两个模型在美国境外及境内外国人员中面临出口限制。Anthropic认为完美越狱抵抗目前对所有模型提供商都不可行。行业AnthropicClaudeFable 5Mythos 5AI安全10 个信源在谈推荐理由:政府要求关停最强模型,越狱争议升级原文
09:55rohanpaul_ai@rohanpaul_ai精选73°NVIDIA 发布了首个智能体 AI 基准测试 AgentPerf 的结果。该基准由 Artificial Analysis 推出,测试系统在保持响应性的同时能并发运行多少个智能体。GB300 NVL72 在最低服务层级达到每兆瓦 61.4K 并发智能体,而 H200 仅为 2.6K,性能提升约 23.6 倍。测试模拟了真实编码智能体路径,涵盖 12 种以上编程语言,请求长度从 5K 到 131K token 不等,平均约 27K token。性能提升得益于 72 块 GPU 通过 NVLink 组成机架级系统,以及优化 MoE 专家分配、通信与计算重叠等软件技术。AI模型NVIDIAGB300 NVL72H200AgentPerf智能体10 个信源在谈推荐理由:NVIDIA 首个智能体基准,GB300 比 H200 强 23 倍原文
09:54PolymarketMoney@PolymarketMoney72°Anthropic 已关闭其新 AI 模型 Mythos 的访问权限,原因是需要“确保合规”美国政府。该模型此前未公开细节,此次关闭可能涉及安全或监管审查。Anthropic 未说明具体合规要求或恢复时间。行业AnthropicMythosAI安全监管10 个信源在谈推荐理由:Anthropic 为合规关停新模型原文
09:53Amjad Masad@amasadPolymarket报道称,特朗普政府正采取措施阻止外国政府、公司及个人访问Anthropic的Fable和Mythos模型。该消息由Replit CEO Amasad在X平台转发,引发97个点赞和8358次浏览。目前Anthropic尚未正式回应,但此举可能影响其模型的国际使用范围。行业AnthropicFableMythos特朗普政府AI安全10 个信源在谈推荐理由:美国政府要封Anthropic的模型了原文
09:50rohanpaul_ai@rohanpaul_ai《自然医学》一项研究对比了OpenEvidence、UpToDate Expert AI与GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6在医学考试题、临床风格回答及医生真实提问上的表现。在100个脱敏临床问题中,盲审医生更偏好前沿通用模型,尤其在完整性和清晰度上胜出。结果显示通用LLM在医生评审的临床任务中已超越专用医疗AI产品。论文GPT-5.2Gemini 3.1 ProClaude Opus 4.6Nature Medicine医疗AI推荐理由:通用模型在医疗任务上反超专用AI原文
09:48Together AI@togethercompute精选Together AI 发布了基于 Blackwell 的推理引擎,在 AgentPerf 基准测试中,其 TPS 比次快的开源引擎高出 31%。该引擎通过为 Blackwell 的 Tensor Core 指令定制内核实现性能提升。Cursor 已将其实时编程助手部署在该推理栈上。Together AI 在推文中详细介绍了构建过程。AI模型Together AIBlackwell推理引擎编程助手Tensor Core4 个信源在谈推荐理由:Blackwell 上推理快了 31%原文
09:46lmarena.ai@lmarena_aiMiniMax M3 是一款开放权重的模型,现已加入 Agent Arena 平台。Agent Arena 通过真实用户会话评估模型在网页搜索、文件系统和终端工具上的表现,涵盖编写代码、创建幻灯片、研究网页、构建应用和分析文档等任务。排行榜基于 30 万+ 任务、200 万+ 工具调用和 4000 万行代码构建,当前排名第一的是 OpenAI 的 GPT-5.5 (High),第二是 Anthropic 的 Claude-Opus-4.7 (Thinking)。MiniMax M3 的评分即将公布。AI模型MiniMax M3Agent ArenaGPT-5.5Claude-Opus-4.7智能体10 个信源在谈推荐理由:看看 MiniMax M3 在 Agent 任务中能排第几原文
09:44orange.ai@oran_ge开发者 oran_ge 用 Claude Fable 5 打磨文案三遍,发现改后文字虽更讲究但人味儿递减。经讨论,将缺失归结为“存在感”——文字背后缺乏具体的人与代价。据此制作《人味儿写作心法.skill》并开源发布,专用于 AI 改稿场景,帮助保留文字的人味儿。技巧Claude Fable 5提示词工程开源模型写作10 个信源在谈推荐理由:开源技能让 AI 改稿保留人味儿原文
09:42Guillermo Rauch@rauchg精选Vercel 在 AI SDK 中推出 HarnessAgent,这是一个统一抽象层,用于编排和集成任何智能体的“大脑”到应用中。它支持 Claude Code、Codex 和 Pi 等智能体框架,并提供沙箱会话和 AI SDK 兼容流。开发者可通过 npm i ai@canary 获取。该工具旨在消除模型和智能体锁定,提升开发体验。AI产品HarnessAgentVercelAI SDKClaude CodeCodex推荐理由:Vercel 帮你摆脱模型和智能体锁定原文
09:13Marc Andreessen@pmarca精选美国政府以国家安全为由发布出口管制指令,要求暂停所有外国公民(包括 Anthropic 的外籍员工)对 Fable 5 和 Mythos 5 的访问。Anthropic 宣布立即禁用这两个模型以确保合规,其他 Claude 模型不受影响。公司表示该指令是误解,正努力恢复访问。行业AnthropicFable 5Mythos 5出口管制模型封锁10 个信源在谈推荐理由:美国下令封了俩模型原文