全部 AI 动态 · AI 热点

AITOP

6月14日

21:58

Decoder@Jonathan Kemper

精选

Mirage由微软研究院与多所大学联合开发。它直接在潜在空间存储场景信息，而非基于像素的点云。该方法将计算时间和显存需求大幅降低，同时支持长镜头下的空间一致性。模型目前无法可靠追踪跨片段的移动物体。

推荐理由：视频生成空间记忆新方案

原文

16:18

Pandaily@contact@pandaily.com (Pandaily)

72°

智谱AI宣布将GLM-5.2模型以MIT许可证开源，支持100万token上下文长度。此举直接回应美国针对Anthropic模型的出口限制。GLM-5.2在多项基准测试中表现优异，其开源策略旨在推动国内AI生态发展。

AI模型 GLM-5.2 Zhipu AI 开源模型长上下文 MIT许可证

推荐理由：智谱开源百万token模型

原文

11:57

11:57IT之家（博客/媒体）

精选

马斯克透露，特斯拉 AI6 芯片工程评审顺利，有望创下单块晶圆可用算力纪录。AI6 将应用于自动驾驶出租车、FSD、Optimus 机器人及太空数据中心。AI5 芯片已流片，计划 2027 年下半年量产，算力是 AI4 的 5 倍；AI6 性能在 AI5 基础上翻倍，预计 2028 年下半年投产。AI6 将采用 LPDDR6 内存和 SRAM 加速器，由三星 165 亿美元代工合作生产。AI6 将先用于 Optimus 机器人和训练集群，再下放至乘用车。

AI模型特斯拉 AI6 AI5 芯片自动驾驶

推荐理由：特斯拉 AI6 芯片算力翻倍，2028 年投产

原文

07:21

宝玉的分享@宝玉

文章指出 Claude Design 的核心能力在于模型能同时处理 UI/UX、数据结构、状态管理和交互逻辑，而非依赖 Harness 工具。Codex 目前缺乏类似产品，因为其模型在跨领域整合上存在差距。作者分析认为，Codex 需要提升模型对多模态和逻辑的协同处理能力，才能推出类似产品。

AI模型 Codex Claude Design 多模态 UI/UX 模型能力

推荐理由：分析 Codex 与 Claude Design 的差距

原文

01:21

Decoder@Jonathan Kemper

Count Anything 是首个能通过文本提示计数任意图像中物体的 AI 模型，在对比测试中将错误率降低 50%。该模型可处理从人群到显微镜下细胞样本等场景，但在极度密集物体和模糊术语上仍有困难。

AI模型 Count Anything 计数模型多模态图像分析

推荐理由：计数准确率翻倍

原文

6月13日

22:51

量子位@鹭羽

HuggingFace CEO和Bengio团队推荐的HRM模型，参数量仅1B，训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型，如MMLU上达到45.2%，HellaSwag上达到72.1%。其核心创新在于高效训练方法，大幅降低了资源需求。

AI模型 HRM HuggingFace Bengio 开源模型推理模型

推荐理由：1B模型，1500美元，性能超预期

原文

20:47

Decoder@Jonathan Kemper

精选

微软与三所中国大学联合开发了SkillOpt方法，通过优化AI智能体的指令文档来提升性能。该方法仅需一个经过训练的Markdown文件，就能让GPT-5.5在程序性任务上提升约23个基准点。该文件还能跨模型和智能体环境迁移，如Codex和Claude Code。

AI模型 SkillOpt GPT-5.5 微软智能体 Codex

推荐理由：微软用Markdown文件让GPT-5.5涨23分

原文

20:46

Decoder@Matthias Bastian

Google Research 发布了 Gemini-SQL2，这是一个基于 Gemini 3.1 Pro 构建的模型，能将自然语言转换为可执行的 SQL 查询。在 BIRD 基准测试中，Gemini-SQL2 达到了 80.04% 的准确率，大幅领先于 OpenAI 和 Anthropic 的模型。Google 表示该技术有望改进其数据服务中的自然语言功能。

AI模型 Gemini-SQL2 Gemini 3.1 Pro Google Research BIRD基准文本到SQL

推荐理由：Google 的 SQL 模型准确率超 80%

原文

18:21

Decoder@Matthias Bastian

73°

Anthropic 的 Claude Fable 5 在 FrontierMath 最难层级上达到 88% 准确率，较 Opus 4.5 在 2026 年初低于 10% 的成绩大幅提升。OpenAI 的 GPT-5.5 在同一层级上达到约 75%。两者差距为 13 个百分点，显示 AI 数学能力加速提升。

AI模型 Claude Fable 5 GPT-5.5 FrontierMath Anthropic 推理模型

推荐理由：Anthropic 新模型数学碾压 GPT-5.5

原文

17:51

17:51IT之家（博客/媒体）

科大讯飞在2026长三角机器人及自动化展览会上发布星火多模态大模型 X2-VL，这是当前唯一基于全国产算力训练的主流大模型，采用专属 MoE 架构。该模型基于无锡本地算力平台太湖星跃平台加速训练。在高中各科图文试题测试中，X2-VL 答题准确率接近95%。在挑战2026年高考数学全国I卷中，X2-VL 获得148分，超过模型A（144分）和模型B（143分）。

AI模型星火X2-VL 科大讯飞多模态国产算力 MoE架构

推荐理由：国产算力训练的模型，高考数学148分

原文

17:22

量子位@一水

精选

Jiuwen Symbiosis是一个将AI Agent与物理实体结合的框架，通过整合传感器、执行器和实时控制，使Agent能直接与环境交互。该框架在工业机器人测试中实现了90%的任务完成率，相比传统方案提升30%。它支持多模态感知（视觉、触觉、力觉）和动态规划，已在仓储物流场景中部署。实践表明，这种具身智能系统能有效处理非结构化环境中的复杂操作。

AI模型 Jiuwen Symbiosis 智能体具身智能多模态工业机器人

推荐理由：让AI Agent动起来干活

原文

16:54

Decoder@Matthias Bastian

Moonshot AI 发布了开源模型 Kimi K2.7 Code，拥有 1 万亿参数，专为编程任务设计。在编程基准测试中，Kimi K2.7 Code 仍落后于 GPT-5.5 和 Claude Opus 4.8，但每 token 价格比它们低 12 倍。用户需权衡：在相同预算下，使用 Kimi K2.7 Code 能获得更多推理次数，但质量可能有所下降。

AI模型 Kimi K2.7 Code Moonshot AI GPT-5.5 Claude Opus 4.8 开源模型

推荐理由：编程省钱利器，12倍性价比

原文

14:36

14:36IT之家（博客/媒体）

智谱宣布 GLM-5.2 将面向 GLM Coding Plan 全量用户开放，覆盖 Lite、Pro、Max 及团队版。该模型支持 1M 上下文，是智谱迄今能力最强的开源模型，在长程任务中保持领先。GLM-5.2 API 将于下周上线，模型将遵循 MIT 协议正式开源。此前智谱于 3 月发布 GLM-5.1，5 月发布输出速度达 400 tokens/s 的 GLM-5.1 高速版。

AI模型 GLM-5.2 智谱开源模型 1M上下文

推荐理由：智谱最强开源模型下周上线

原文

13:54

13:54IT之家（博客/媒体）

精选

Google Research 推出 Gemini-SQL2 模型，基于 Gemini 3.1 Pro 打造，专攻 Text-to-SQL 任务。在 BIRD 基准的单模型赛道中，执行准确率达 80.04%，超越此前 Gemini-SQL。BIRD 覆盖 95 个数据库、37 个领域和 12751 组问题，数据量 33.4GB，模拟真实企业环境。该模型可让业务人员用自然语言查询营收、流失等数据，但谷歌尚未公布 API 或接入产品。

AI模型 Gemini-SQL2 Google Research Text-to-SQL BIRD 推理模型

推荐理由：谷歌新模型让自然语言查数据库更准

原文

13:23

13:23IT之家（博客/媒体）

6月12日，MiniMax 开源了新一代原生多模态旗舰模型 M3。同日，摩尔线程宣布其旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。MTT S5000 凭借硬件级原生 FP8 加速，单卡 AI 算力（稠密）高达 1000 TFLOPS，配备 80GB 显存与 1.6TB/s 带宽，支撑百万 token 级长序列。适配通过原生算子定制提升推理吞吐并降低延迟，同时同步拉起 vLLM 与 SGLang 两大推理框架。

AI模型 MiniMax M3 摩尔线程 MTT S5000 多模态推理框架

推荐理由：摩尔线程让国产模型跑得更快

原文

13:03

marktechpost@Asif Razzaq

Moonshot AI 开源了 Kimi K2.7-Code，这是一个基于 Kimi K2.6 构建的编程智能体模型，采用 Modified MIT 许可证。该模型拥有 256K 上下文窗口，推理 token 使用量降低约 30%。在 Kimi Code Bench v2 上，K2.7-Code 相比 K2.6 提升了 21.8%，并在其他五个基准上也有增长。模型已通过 Kimi API 和 Kimi Code 提供。

AI模型 Kimi K2.7-Code Moonshot AI 编程助手开源模型智能体

推荐理由：编程模型开源，性能提升明显

原文

11:00

Decoder@Matthias Bastian

Anthropic发布的Claude Fable 5在Artificial Analysis Intelligence Index上获得64.9分，创下十项基准测试中的五项纪录。相比Opus 4.8，性能仅提升5.7%，但token价格翻倍。安全过滤器和回退路由进一步推高使用成本。

AI模型 Claude Fable 5 Anthropic Opus 4.8 推理模型基准测试

推荐理由：性能微涨价格翻倍，谨慎升级

原文

10:59

10:59IT之家（博客/媒体）

英特尔酷睿Ultra 7 251HX处理器在PassMark平台跑分曝光，单核4666分，多核48713分。该处理器隶属Arrow Lake-HX家族，采用18核心配置，TDP为55W。单核性能比同系列20核的Ultra 7 255HX和265HX高出2-3%，多核跑分也超越这两款20核竞品。此前Cinebench R23测试显示，251HX在低于100W TDP区间效率优于Core i9-14900HX，体现Arrow Lake架构能效优化。

AI模型 Intel Core Ultra 7 251HX Arrow Lake-HX PassMark 能效比

推荐理由：18核打20核，还更省电

原文

09:47

09:47IT之家（博客/媒体）

精选

华为云与MiniMax达成深化合作，基于昇腾算力底座为M3模型提供Tokens算力支持。M3采用MSA注意力架构，支持1M超长上下文，是原生多模态模型，可处理图片、视频输入并操作电脑桌面。在SWE-Bench Pro上，M3超过GPT-5.5和Gemini 3.1 Pro，接近Opus 4.7；在SVG-Bench上超过Opus 4.7；在OmniDocBench上超过Gemini 3.1 Pro；在Claw-Eval上获得最高分。华为云通过昇腾算力优化MSA算子和MOE均衡，保障M3大规模推理性能。

AI模型 MiniMax M3 华为云昇腾多模态

推荐理由：华为云联手MiniMax，M3多模态模型开源

原文

09:43

marktechpost@Asif Razzaq

精选

Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2，基于 Gemini 3.1 Pro 模型。该模型在 BIRD 单模型排行榜上取得 80.04% 的执行准确率。文章解释了该分数含义、排行榜对比情况，以及 Google 未披露的细节。同时介绍了使用场景和基于 schema 的实现模式。

AI模型 Gemini-SQL2 Gemini 3.1 Pro BIRD Text-to-SQL 推理模型

推荐理由：Google 新模型 SQL 准确率破 80%

原文

6月12日

18:45

18:45IT之家（博客/媒体）

月之暗面今日发布并开源 Kimi K2.7 Code 编程模型，相比 K2.6 在长上下文编程、指令遵循和长程任务性能上显著提升，平均 token 消耗减少 30%。内外部基准测试显示，代码能力提升 11%-31.5%，Agent 自主化执行能力提升约 10%。模型已通过 Kimi API 开放平台提供，价格与 K2.6 一致，并预告 6 月 15 日推出 5-6 倍输出速度的高速版，仅需 2 倍价格。非编程任务仍推荐使用 K2.6 模型。

AI模型月之暗面 Kimi K2.7 Code 编程模型开源/仓库 API

推荐理由：Kimi K2.7 Code 在编程场景下 token 消耗降低 30%，做 AI 编程的开发者可以立刻通过 API 体验，高速版下周上线值得关注。

原文

17:01

17:01IT之家（博客/媒体）

商汤科技开源了 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 模型，专为图文交错创作场景优化。该模型解决了多轮生成中角色形象飘移、画风断裂、图文脱节等痛点，支持绘本、故事书、多页 PPT 等连续内容创作。核心升级包括叙事连贯性与角色一致性提升、图文语义对齐增强、视觉质量改善，以及新增多页 PPT 自动生成能力。模型已在 Hugging Face 开源，适合需要高质量图文内容生成的创作者和开发者。

AI模型商汤 SenseNova U1 图文交错生成开源/仓库多模态模型

推荐理由：做绘本、PPT 或教程的创作者终于不用反复修图了——这个模型能保持角色和画风从头到尾一致，直接生成多页内容，建议试试。

原文

16:13

marktechpost@Asif Razzaq

Zyphra 发布了 Zamba2-VL 系列开源视觉语言模型，包含 1.2B、2.7B 和 7B 三个参数版本。该模型采用混合 Mamba2 状态空间和 Transformer 骨干架构，在 Apache 2.0 许可下发布。与同类 Transformer 视觉语言模型相比，Zamba2-VL 在保持竞争力的同时，将首 token 生成时间降低了约一个数量级。这标志着在高效视觉语言推理方面的重要进展，尤其适合对延迟敏感的应用场景。

AI模型视觉语言模型 Mamba2 Transformer 开源/仓库低延迟

推荐理由：做视觉语言模型部署或实时推理的开发者，Zamba2-VL 的首 token 延迟优势能显著提升用户体验，值得直接尝试。

原文

15:56

pandaily@contact@pandaily.com (Pandaily)

在第八届BAAI大会上，图灵奖得主Whitfield Diffie和Andrew Barto分别发表主题演讲，共同关注AGI安全与对齐背后的基础理论挑战。Diffie指出当前AI系统缺乏可验证的安全机制，Barto则强调强化学习中的奖励设计难题。两位学者认为，AGI的安全问题不仅是工程问题，更是理论问题，需要从数学和哲学层面重新思考。这一讨论为AI安全研究提供了新的视角，提醒业界在追求能力提升的同时不能忽视理论基础。

AI模型 AGI安全图灵奖理论挑战对齐 BAAI

推荐理由：两位图灵奖得主同时敲响AGI安全理论警钟，做AI安全研究的团队值得关注——这可能是未来几年最核心的学术方向。

原文

15:48

marktechpost@Sana Hassan

本文基于 MONAI 框架，构建了完整的 3D 医学图像分割流程，使用 Medical Segmentation Decathlon 的脾脏数据集。流程包括 CT 体素方向对齐、间距归一化、强度窗宽、前景裁剪和补丁采样等医学影像专用预处理，然后训练 3D UNet 模型。该教程提供了可复现的代码实现，适合医学影像 AI 开发者快速上手。

AI模型 MONAI 3D UNet 医学图像分割 CT 体素端到端流程

推荐理由：医学影像分割的端到端流程往往繁琐，MONAI 这套实现把预处理到训练串起来了，做 CT 分割的团队可以直接复用代码，省去踩坑时间。

原文

15:07

15:07IT之家（博客/媒体）

73°

华为在 HDC 2026 上正式发布开源盘古 openPangu 2.0 模型，包含 Pro（505B 总参数/18B 激活）和 Flash（92B 总参数/6B 激活）两个版本，支持 512K 上下文。该模型针对昇腾算力优化，单卡吞吐率是业界主流开源模型的 2 倍，并适配鸿蒙系统，在 Agent 任务上更快更准更省。华为计划从 6 月 30 日起陆续开源 7 大组件，包括预训练代码、后训练代码和训练算子。余承东坦言，由于算力大量支持国内其他企业，华为自留算力有限，因此模型参数规模控制在 505B，更聚焦时延和吞吐率提升。

AI模型华为盘古 2.0 开源模型昇腾鸿蒙

推荐理由：华为开源盘古 2.0 解决了国产大模型在昇腾生态下的部署效率问题，使用昇腾算力的开发者和企业可以直接受益，建议关注 6 月 30 日的开源组件发布。

原文

6月11日

16:38

marktechpost@Asif Razzaq

Cohere 推出了其首个面向开发者的编程模型 North Mini Code，采用混合专家架构，总参数量 30B，但每次推理仅激活 3B 参数，可在单张 H100 GPU 上运行。该模型支持 256K 上下文长度，专为智能体编程场景设计，能够高效处理代码生成、调试和自动化任务。作为开源权重模型，它降低了开发者部署高性能编程模型的门槛，尤其适合资源受限的团队。这一发布标志着 Cohere 正式进入 AI 编程助手领域，与 Code Llama、StarCoder 等模型竞争。

AI模型 Cohere North Mini Code 混合专家模型编程助手智能体

推荐理由：Cohere 用 3B 活跃参数实现了 30B 模型的效果，做智能体编程的团队可以在单卡 H100 上直接部署，省成本又高效，建议做代码自动化的开发者试试。

原文

06:54

06:54IT之家（博客/媒体）

72°

谷歌发布 DiffusionGemma，一种基于文本扩散机制的开源 AI 模型，在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出，避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token，DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色，但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源，可从 Hugging Face 下载。

AI模型扩散模型谷歌 Gemma 本地推理开源

推荐理由：本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行，做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。

原文

04:44

04:44Simon Willison’s Weblog（博客/媒体）

76°

Google 去年曾短暂发布实验性的 Gemini Diffusion 模型，如今以开源形式回归，推出 DiffusionGemma-26B-A4B-it 模型，采用 Apache 2 许可证。该模型在 NVIDIA NIM 云 API 上免费托管，生成速度可达 500+ tokens/秒。作者实测生成 2409 tokens 仅需 4.4 秒，性能出色。这是 Google 在扩散模型领域的重要开源动作，为开发者提供了高性能的生成式 AI 选项。

AI模型 Google DiffusionGemma 开源/仓库 NVIDIA 生成式AI

推荐理由：Google 把去年惊艳的扩散模型开源了，做图像/文本生成的开发者可以直接用 NVIDIA 免费 API 体验，速度超 500 tokens/秒，值得立刻上手试。

原文

03:39

Decoder@Jonathan Kemper

72°

Google 发布了 DiffusionGemma，一个 260 亿参数的开源模型。它不采用传统的逐词生成方式，而是通过扩散过程从噪声中生成文本，类似于图像 AI 的工作方式。据 Nvidia 称，该模型在单个 H100 GPU 上每秒可处理约 1000 个 token，速度是同类自回归模型的约 4 倍。但输出质量较低，因此 Google 目前将其定位为面向开发者的实验性工具。

AI模型 Google DiffusionGemma 扩散模型开源模型推理加速

推荐理由：DiffusionGemma 为文本生成开辟了新路径，追求推理速度的开发者可以尝试这种非自回归方案，尤其适合对实时性要求高的场景。

原文

02:55

02:55Google DeepMind: Blog（博客/媒体）

Google DeepMind 推出 DiffusionGemma，一种基于扩散模型的文本生成方法，相比传统自回归模型，生成速度提升 4 倍。该模型在保持生成质量的同时，显著降低了推理延迟，适用于需要快速响应的应用场景。DiffusionGemma 通过并行生成 token 而非逐个生成，实现了速度飞跃。这一进展对实时对话系统、内容生成等场景具有重要意义。

AI模型文本生成扩散模型推理加速 DeepMind DiffusionGemma

推荐理由：做文本生成应用的开发者，如果你的产品对延迟敏感，DiffusionGemma 的 4 倍加速值得一试，能直接提升用户体验。

原文

02:54

marktechpost@Asif Razzaq

76°

Google DeepMind 推出 DiffusionGemma，一款 26B 参数的混合专家（MoE）开源模型，采用文本扩散技术，在 GPU 上生成速度最高提升 4 倍。该模型在保持生成质量的同时，显著降低了推理延迟，适合对实时性要求高的场景。DiffusionGemma 已开源，开发者可直接下载使用。

AI模型 DiffusionGemma Google DeepMind MoE 文本扩散开源模型

推荐理由：做文本生成或实时 AI 应用的开发者，这个模型用扩散方法把生成速度翻了 4 倍，值得下载实测。

原文

6月10日

22:18

22:18IT之家（博客/媒体）

精选

AMD 在 SPEC CPU 2017 基准测试中，以 100kW 机柜功耗为限制，展示了新一代 256 核 EPYC Venice 处理器的性能。以英伟达 88 核 Vera 处理器的得分为 1.0 基准，Intel 128 核至强 6980P 得分为 1.46，上代 192 核 EPYC Turin 得分为 2.37，而 Venice 得分达到 3.30，约为 Vera 的三倍多。单核性能方面，256 核 Venice 相比 Vera 有 27% 优势，但降档至 96 核版本时优势缩至 11%。AMD 强调数据中心客户更关注固定功耗机柜的实际性能，而非单芯片峰值。

AI模型 AMD Venice EPYC 数据中心基准测试

推荐理由：AMD Venice性能碾压对手

原文

21:51

Decoder@Maximilian Schreiner

88°

Anthropic推出了Claude Fable 5，这是其新Mythos模型系列的首款产品。该模型在几乎所有基准测试中领先，包括SWE-bench Verified达到95%，但价格是Opus 4.8的两倍，每百万token收费10或50美元。严格的安全过滤器会阻止约9%的请求，并且新的30天数据保留政策甚至适用于零数据保留合同。这标志着Anthropic在追求极致性能的同时，也加强了安全控制和商业化策略。

AI模型 Claude Fable 5 Mythos系列推理模型安全过滤定价策略

推荐理由：Claude Fable 5在编程和推理任务上创下新高，但高昂成本和严格过滤让开发者需要权衡。做AI应用或自动化流程的团队，建议先评估预算和合规需求再决定是否接入。

原文

16:45

marktechpost@Asif Razzaq

Anthropic 推出了 Claude Fable 5 和 Claude Mythos 5 两款新模型，它们基于相同的底层架构，但安全防护级别不同。Fable 5 已全面可用，内置分类器以增强安全性；而 Mythos 5 则通过 Project Glasswing 项目有限开放，移除了网络安全相关的防护措施，面向更高级的用例。这一举措标志着 Anthropic 在模型安全分级上的新尝试，为不同风险承受能力的用户提供差异化选择。

AI模型 Anthropic Claude 模型安全分级发布 Project Glasswing

推荐理由：Anthropic 首次推出同一模型的不同安全版本，做安全敏感或高风险 AI 应用的团队可以按需选择，值得关注 Mythos 5 的开放程度。

原文

16:25

16:25IT之家（博客/媒体）

精选72°

摩尔线程发布并开源了首个基于国产 GPU 算力底座全链路训练的代码大模型 MusaCoder，包含 9B 和 27B 两个参数规模。该模型专注于 GPU 底层算子生成，可从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码，降低开发者手写门槛。在 KernelBench 评测中，MusaCoder-27B-RL 以 Overall Pass@8 93.2% 的成绩超越 Claude Opus 4.7、DeepSeek-V4 Pro 等主流模型，性能领先。模型已在 Hugging Face 开源，论文同步发布。

AI模型代码大模型 GPU 算子开源/仓库国产算力 MusaCoder

推荐理由：国产 GPU 生态终于有了自己的代码大模型，做 GPU 算子开发或国产算力适配的团队可以直接试用，降低底层开发门槛。

原文

09:40

09:40SuperTechFans（博客/媒体）

88°

Anthropic推出两款新模型：Fable 5（安全版）和Mythos 5（无安全限制版）。Fable 5在软件工程、知识工作、视觉识别等领域达到最先进水平，可自主完成复杂任务，如一天内完成Stripe代码库迁移（原需团队两个月）。Mythos 5面向网络安全，在药物设计、分子生物学等领域表现超越人类专家。两款模型定价均为每百万输入令牌10美元、输出令牌50美元，比预览版低一半以上。但Fable 5的安全措施过于激进，误判大量正常内容，引发用户不满。

AI模型 Anthropic Fable 5 Mythos 5 推理模型安全对齐

推荐理由：Anthropic新模型价格腰斩且能力大幅提升，做复杂自动化或安全研究的团队值得关注；但安全版误判问题严重，实际使用前建议先测试边界。

原文

08:12

08:12Simon Willison’s Weblog（博客/媒体）

88°

Simon Willison 在 Claude Fable 5 发布后第一时间进行了约 5.5 小时的测试。该模型与 Claude Mythos 5 性能相同，但增加了严格的安全护栏，触发时 API 会通知用户并可自动回退到其他模型。Fable 5 拥有 100 万 token 上下文窗口、12.8 万最大输出 token，知识截止于 2026 年 1 月，价格是 Opus 4.8 的两倍。Willison 认为它“感觉很大”，不仅体现在速度和成本上，更在于其知识深度，例如能准确列出他的开源项目。当前挑战已从“模型能做什么”转向“找到它做不了的事”。

AI模型 Claude Fable 5 Claude Mythos 5 安全护栏长上下文推理模型

推荐理由：Claude Fable 5 的“大模型感”让开发者重新思考任务边界——如果你经常用 Claude 处理复杂推理或长上下文任务，这个模型值得一试，但要做好预算准备。

原文

06:51

06:51IT之家（博客/媒体）

88°

Anthropic 于 6 月 9 日发布 Claude Fable 5 和 Claude Mythos 5 两款 AI 模型，其中 Fable 5 面向普通用户，是当前公开可用能力最强的 Claude 模型，在软件工程、知识工作、视觉和科学研究领域表现卓越，自主运行时间更长。Mythos 5 则通过 Project Glasswing 项目向网络安全和基础设施提供商开放，具备全球最强的网络安全能力，并在药物设计和分子生物学研究中提速约 10 倍。两款模型定价均为每百万输入 10 美元、输出 50 美元，Fable 5 已全面上线，Mythos 5 暂限特定合作伙伴使用。

AI模型 Claude Fable 5 Claude Mythos 5 Anthropic 推理模型网络安全

推荐理由：Claude 用户终于等来最强公开模型——Fable 5 在长任务和复杂推理上超越 Opus，做软件工程、金融分析或科研的可以直接上手体验。

原文

02:33

Decoder@Matthias Bastian

88°

Anthropic推出了两款新模型Claude Fable 5和Mythos 5，在编程和科学研究方面显著超越当前Opus系列。Fable 5在一天内完成了Stripe的代码迁移任务，而这项工作原本需要一个团队两个月。Mythos 5能自主设计候选药物，但由于其强大的网络攻击能力，目前被限制使用。这些模型展示了AI在复杂任务中的巨大潜力，但也引发了安全担忧。

AI模型 Anthropic Claude Fable 5 Mythos 5 编程助手科学研究

推荐理由：编程和科研团队将看到AI效率的飞跃——Fable 5一天完成两个月的工作量，值得开发者关注；Mythos 5的自主药物设计能力则让生物医药研究者眼前一亮，但安全限制也提醒我们技术双刃剑的特性。

原文