21:58Decoder@Jonathan Kemper精选Mirage由微软研究院与多所大学联合开发。它直接在潜在空间存储场景信息,而非基于像素的点云。该方法将计算时间和显存需求大幅降低,同时支持长镜头下的空间一致性。模型目前无法可靠追踪跨片段的移动物体。AI模型MirageMicrosoft Research视频生成世界模型潜在空间推荐理由:视频生成空间记忆新方案原文
16:18Pandaily@contact@pandaily.com (Pandaily)72°智谱AI宣布将GLM-5.2模型以MIT许可证开源,支持100万token上下文长度。此举直接回应美国针对Anthropic模型的出口限制。GLM-5.2在多项基准测试中表现优异,其开源策略旨在推动国内AI生态发展。AI模型GLM-5.2Zhipu AI开源模型长上下文MIT许可证10 个信源在谈推荐理由:智谱开源百万token模型原文
11:57IT之家(博客/媒体)精选马斯克透露,特斯拉 AI6 芯片工程评审顺利,有望创下单块晶圆可用算力纪录。AI6 将应用于自动驾驶出租车、FSD、Optimus 机器人及太空数据中心。AI5 芯片已流片,计划 2027 年下半年量产,算力是 AI4 的 5 倍;AI6 性能在 AI5 基础上翻倍,预计 2028 年下半年投产。AI6 将采用 LPDDR6 内存和 SRAM 加速器,由三星 165 亿美元代工合作生产。AI6 将先用于 Optimus 机器人和训练集群,再下放至乘用车。AI模型特斯拉AI6AI5芯片自动驾驶推荐理由:特斯拉 AI6 芯片算力翻倍,2028 年投产原文
07:21宝玉的分享@宝玉文章指出 Claude Design 的核心能力在于模型能同时处理 UI/UX、数据结构、状态管理和交互逻辑,而非依赖 Harness 工具。Codex 目前缺乏类似产品,因为其模型在跨领域整合上存在差距。作者分析认为,Codex 需要提升模型对多模态和逻辑的协同处理能力,才能推出类似产品。AI模型CodexClaude Design多模态UI/UX模型能力1 个信源在谈推荐理由:分析 Codex 与 Claude Design 的差距原文
01:21Decoder@Jonathan KemperCount Anything 是首个能通过文本提示计数任意图像中物体的 AI 模型,在对比测试中将错误率降低 50%。该模型可处理从人群到显微镜下细胞样本等场景,但在极度密集物体和模糊术语上仍有困难。AI模型Count Anything计数模型多模态图像分析推荐理由:计数准确率翻倍原文
22:51量子位@鹭羽HuggingFace CEO和Bengio团队推荐的HRM模型,参数量仅1B,训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型,如MMLU上达到45.2%,HellaSwag上达到72.1%。其核心创新在于高效训练方法,大幅降低了资源需求。AI模型HRMHuggingFaceBengio开源模型推理模型推荐理由:1B模型,1500美元,性能超预期原文
20:47Decoder@Jonathan Kemper精选微软与三所中国大学联合开发了SkillOpt方法,通过优化AI智能体的指令文档来提升性能。该方法仅需一个经过训练的Markdown文件,就能让GPT-5.5在程序性任务上提升约23个基准点。该文件还能跨模型和智能体环境迁移,如Codex和Claude Code。AI模型SkillOptGPT-5.5微软智能体Codex推荐理由:微软用Markdown文件让GPT-5.5涨23分原文
20:46Decoder@Matthias BastianGoogle Research 发布了 Gemini-SQL2,这是一个基于 Gemini 3.1 Pro 构建的模型,能将自然语言转换为可执行的 SQL 查询。在 BIRD 基准测试中,Gemini-SQL2 达到了 80.04% 的准确率,大幅领先于 OpenAI 和 Anthropic 的模型。Google 表示该技术有望改进其数据服务中的自然语言功能。AI模型Gemini-SQL2Gemini 3.1 ProGoogle ResearchBIRD基准文本到SQL10 个信源在谈推荐理由:Google 的 SQL 模型准确率超 80%原文
18:21Decoder@Matthias Bastian73°Anthropic 的 Claude Fable 5 在 FrontierMath 最难层级上达到 88% 准确率,较 Opus 4.5 在 2026 年初低于 10% 的成绩大幅提升。OpenAI 的 GPT-5.5 在同一层级上达到约 75%。两者差距为 13 个百分点,显示 AI 数学能力加速提升。AI模型Claude Fable 5GPT-5.5FrontierMathAnthropic推理模型10 个信源在谈推荐理由:Anthropic 新模型数学碾压 GPT-5.5原文
17:51IT之家(博客/媒体)科大讯飞在2026长三角机器人及自动化展览会上发布星火多模态大模型 X2-VL,这是当前唯一基于全国产算力训练的主流大模型,采用专属 MoE 架构。该模型基于无锡本地算力平台太湖星跃平台加速训练。在高中各科图文试题测试中,X2-VL 答题准确率接近95%。在挑战2026年高考数学全国I卷中,X2-VL 获得148分,超过模型A(144分)和模型B(143分)。AI模型星火X2-VL科大讯飞多模态国产算力MoE架构推荐理由:国产算力训练的模型,高考数学148分原文
17:22量子位@一水精选Jiuwen Symbiosis是一个将AI Agent与物理实体结合的框架,通过整合传感器、执行器和实时控制,使Agent能直接与环境交互。该框架在工业机器人测试中实现了90%的任务完成率,相比传统方案提升30%。它支持多模态感知(视觉、触觉、力觉)和动态规划,已在仓储物流场景中部署。实践表明,这种具身智能系统能有效处理非结构化环境中的复杂操作。AI模型Jiuwen Symbiosis智能体具身智能多模态工业机器人推荐理由:让AI Agent动起来干活原文
16:54Decoder@Matthias BastianMoonshot AI 发布了开源模型 Kimi K2.7 Code,拥有 1 万亿参数,专为编程任务设计。在编程基准测试中,Kimi K2.7 Code 仍落后于 GPT-5.5 和 Claude Opus 4.8,但每 token 价格比它们低 12 倍。用户需权衡:在相同预算下,使用 Kimi K2.7 Code 能获得更多推理次数,但质量可能有所下降。AI模型Kimi K2.7 CodeMoonshot AIGPT-5.5Claude Opus 4.8开源模型7 个信源在谈推荐理由:编程省钱利器,12倍性价比原文
14:36IT之家(博客/媒体)智谱宣布 GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite、Pro、Max 及团队版。该模型支持 1M 上下文,是智谱迄今能力最强的开源模型,在长程任务中保持领先。GLM-5.2 API 将于下周上线,模型将遵循 MIT 协议正式开源。此前智谱于 3 月发布 GLM-5.1,5 月发布输出速度达 400 tokens/s 的 GLM-5.1 高速版。AI模型GLM-5.2智谱开源模型1M上下文推荐理由:智谱最强开源模型下周上线原文
13:54IT之家(博客/媒体)精选Google Research 推出 Gemini-SQL2 模型,基于 Gemini 3.1 Pro 打造,专攻 Text-to-SQL 任务。在 BIRD 基准的单模型赛道中,执行准确率达 80.04%,超越此前 Gemini-SQL。BIRD 覆盖 95 个数据库、37 个领域和 12751 组问题,数据量 33.4GB,模拟真实企业环境。该模型可让业务人员用自然语言查询营收、流失等数据,但谷歌尚未公布 API 或接入产品。AI模型Gemini-SQL2Google ResearchText-to-SQLBIRD推理模型4 个信源在谈推荐理由:谷歌新模型让自然语言查数据库更准原文
13:23IT之家(博客/媒体)6月12日,MiniMax 开源了新一代原生多模态旗舰模型 M3。同日,摩尔线程宣布其旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。MTT S5000 凭借硬件级原生 FP8 加速,单卡 AI 算力(稠密)高达 1000 TFLOPS,配备 80GB 显存与 1.6TB/s 带宽,支撑百万 token 级长序列。适配通过原生算子定制提升推理吞吐并降低延迟,同时同步拉起 vLLM 与 SGLang 两大推理框架。AI模型MiniMax M3摩尔线程MTT S5000多模态推理框架7 个信源在谈推荐理由:摩尔线程让国产模型跑得更快原文
13:03marktechpost@Asif RazzaqMoonshot AI 开源了 Kimi K2.7-Code,这是一个基于 Kimi K2.6 构建的编程智能体模型,采用 Modified MIT 许可证。该模型拥有 256K 上下文窗口,推理 token 使用量降低约 30%。在 Kimi Code Bench v2 上,K2.7-Code 相比 K2.6 提升了 21.8%,并在其他五个基准上也有增长。模型已通过 Kimi API 和 Kimi Code 提供。AI模型Kimi K2.7-CodeMoonshot AI编程助手开源模型智能体6 个信源在谈推荐理由:编程模型开源,性能提升明显原文
11:00Decoder@Matthias BastianAnthropic发布的Claude Fable 5在Artificial Analysis Intelligence Index上获得64.9分,创下十项基准测试中的五项纪录。相比Opus 4.8,性能仅提升5.7%,但token价格翻倍。安全过滤器和回退路由进一步推高使用成本。AI模型Claude Fable 5AnthropicOpus 4.8推理模型基准测试10 个信源在谈推荐理由:性能微涨价格翻倍,谨慎升级原文
10:59IT之家(博客/媒体)英特尔酷睿Ultra 7 251HX处理器在PassMark平台跑分曝光,单核4666分,多核48713分。该处理器隶属Arrow Lake-HX家族,采用18核心配置,TDP为55W。单核性能比同系列20核的Ultra 7 255HX和265HX高出2-3%,多核跑分也超越这两款20核竞品。此前Cinebench R23测试显示,251HX在低于100W TDP区间效率优于Core i9-14900HX,体现Arrow Lake架构能效优化。AI模型IntelCore Ultra 7 251HXArrow Lake-HXPassMark能效比推荐理由:18核打20核,还更省电原文
09:47IT之家(博客/媒体)精选华为云与MiniMax达成深化合作,基于昇腾算力底座为M3模型提供Tokens算力支持。M3采用MSA注意力架构,支持1M超长上下文,是原生多模态模型,可处理图片、视频输入并操作电脑桌面。在SWE-Bench Pro上,M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;在SVG-Bench上超过Opus 4.7;在OmniDocBench上超过Gemini 3.1 Pro;在Claw-Eval上获得最高分。华为云通过昇腾算力优化MSA算子和MOE均衡,保障M3大规模推理性能。AI模型MiniMaxM3华为云昇腾多模态1 个信源在谈推荐理由:华为云联手MiniMax,M3多模态模型开源原文
09:43marktechpost@Asif Razzaq精选Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2,基于 Gemini 3.1 Pro 模型。该模型在 BIRD 单模型排行榜上取得 80.04% 的执行准确率。文章解释了该分数含义、排行榜对比情况,以及 Google 未披露的细节。同时介绍了使用场景和基于 schema 的实现模式。AI模型Gemini-SQL2Gemini 3.1 ProBIRDText-to-SQL推理模型3 个信源在谈推荐理由:Google 新模型 SQL 准确率破 80%原文
18:45IT之家(博客/媒体)月之暗面今日发布并开源 Kimi K2.7 Code 编程模型,相比 K2.6 在长上下文编程、指令遵循和长程任务性能上显著提升,平均 token 消耗减少 30%。内外部基准测试显示,代码能力提升 11%-31.5%,Agent 自主化执行能力提升约 10%。模型已通过 Kimi API 开放平台提供,价格与 K2.6 一致,并预告 6 月 15 日推出 5-6 倍输出速度的高速版,仅需 2 倍价格。非编程任务仍推荐使用 K2.6 模型。AI模型月之暗面Kimi K2.7 Code编程模型开源/仓库API5 个信源在谈推荐理由:Kimi K2.7 Code 在编程场景下 token 消耗降低 30%,做 AI 编程的开发者可以立刻通过 API 体验,高速版下周上线值得关注。原文
17:01IT之家(博客/媒体)商汤科技开源了 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 模型,专为图文交错创作场景优化。该模型解决了多轮生成中角色形象飘移、画风断裂、图文脱节等痛点,支持绘本、故事书、多页 PPT 等连续内容创作。核心升级包括叙事连贯性与角色一致性提升、图文语义对齐增强、视觉质量改善,以及新增多页 PPT 自动生成能力。模型已在 Hugging Face 开源,适合需要高质量图文内容生成的创作者和开发者。AI模型商汤SenseNova U1图文交错生成开源/仓库多模态模型推荐理由:做绘本、PPT 或教程的创作者终于不用反复修图了——这个模型能保持角色和画风从头到尾一致,直接生成多页内容,建议试试。原文
16:13marktechpost@Asif RazzaqZyphra 发布了 Zamba2-VL 系列开源视觉语言模型,包含 1.2B、2.7B 和 7B 三个参数版本。该模型采用混合 Mamba2 状态空间和 Transformer 骨干架构,在 Apache 2.0 许可下发布。与同类 Transformer 视觉语言模型相比,Zamba2-VL 在保持竞争力的同时,将首 token 生成时间降低了约一个数量级。这标志着在高效视觉语言推理方面的重要进展,尤其适合对延迟敏感的应用场景。AI模型视觉语言模型Mamba2Transformer开源/仓库低延迟推荐理由:做视觉语言模型部署或实时推理的开发者,Zamba2-VL 的首 token 延迟优势能显著提升用户体验,值得直接尝试。原文
15:56pandaily@contact@pandaily.com (Pandaily)在第八届BAAI大会上,图灵奖得主Whitfield Diffie和Andrew Barto分别发表主题演讲,共同关注AGI安全与对齐背后的基础理论挑战。Diffie指出当前AI系统缺乏可验证的安全机制,Barto则强调强化学习中的奖励设计难题。两位学者认为,AGI的安全问题不仅是工程问题,更是理论问题,需要从数学和哲学层面重新思考。这一讨论为AI安全研究提供了新的视角,提醒业界在追求能力提升的同时不能忽视理论基础。AI模型AGI安全图灵奖理论挑战对齐BAAI推荐理由:两位图灵奖得主同时敲响AGI安全理论警钟,做AI安全研究的团队值得关注——这可能是未来几年最核心的学术方向。原文
15:48marktechpost@Sana Hassan本文基于 MONAI 框架,构建了完整的 3D 医学图像分割流程,使用 Medical Segmentation Decathlon 的脾脏数据集。流程包括 CT 体素方向对齐、间距归一化、强度窗宽、前景裁剪和补丁采样等医学影像专用预处理,然后训练 3D UNet 模型。该教程提供了可复现的代码实现,适合医学影像 AI 开发者快速上手。AI模型MONAI3D UNet医学图像分割CT 体素端到端流程推荐理由:医学影像分割的端到端流程往往繁琐,MONAI 这套实现把预处理到训练串起来了,做 CT 分割的团队可以直接复用代码,省去踩坑时间。原文
15:07IT之家(博客/媒体)73°华为在 HDC 2026 上正式发布开源盘古 openPangu 2.0 模型,包含 Pro(505B 总参数/18B 激活)和 Flash(92B 总参数/6B 激活)两个版本,支持 512K 上下文。该模型针对昇腾算力优化,单卡吞吐率是业界主流开源模型的 2 倍,并适配鸿蒙系统,在 Agent 任务上更快更准更省。华为计划从 6 月 30 日起陆续开源 7 大组件,包括预训练代码、后训练代码和训练算子。余承东坦言,由于算力大量支持国内其他企业,华为自留算力有限,因此模型参数规模控制在 505B,更聚焦时延和吞吐率提升。AI模型华为盘古 2.0开源模型昇腾鸿蒙推荐理由:华为开源盘古 2.0 解决了国产大模型在昇腾生态下的部署效率问题,使用昇腾算力的开发者和企业可以直接受益,建议关注 6 月 30 日的开源组件发布。原文
16:38marktechpost@Asif RazzaqCohere 推出了其首个面向开发者的编程模型 North Mini Code,采用混合专家架构,总参数量 30B,但每次推理仅激活 3B 参数,可在单张 H100 GPU 上运行。该模型支持 256K 上下文长度,专为智能体编程场景设计,能够高效处理代码生成、调试和自动化任务。作为开源权重模型,它降低了开发者部署高性能编程模型的门槛,尤其适合资源受限的团队。这一发布标志着 Cohere 正式进入 AI 编程助手领域,与 Code Llama、StarCoder 等模型竞争。AI模型CohereNorth Mini Code混合专家模型编程助手智能体10 个信源在谈推荐理由:Cohere 用 3B 活跃参数实现了 30B 模型的效果,做智能体编程的团队可以在单卡 H100 上直接部署,省成本又高效,建议做代码自动化的开发者试试。原文
06:54IT之家(博客/媒体)72°谷歌发布 DiffusionGemma,一种基于文本扩散机制的开源 AI 模型,在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出,避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token,DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色,但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源,可从 Hugging Face 下载。AI模型扩散模型谷歌Gemma本地推理开源6 个信源在谈推荐理由:本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行,做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。原文
04:44Simon Willison’s Weblog(博客/媒体)76°Google 去年曾短暂发布实验性的 Gemini Diffusion 模型,如今以开源形式回归,推出 DiffusionGemma-26B-A4B-it 模型,采用 Apache 2 许可证。该模型在 NVIDIA NIM 云 API 上免费托管,生成速度可达 500+ tokens/秒。作者实测生成 2409 tokens 仅需 4.4 秒,性能出色。这是 Google 在扩散模型领域的重要开源动作,为开发者提供了高性能的生成式 AI 选项。AI模型GoogleDiffusionGemma开源/仓库NVIDIA生成式AI10 个信源在谈推荐理由:Google 把去年惊艳的扩散模型开源了,做图像/文本生成的开发者可以直接用 NVIDIA 免费 API 体验,速度超 500 tokens/秒,值得立刻上手试。原文
03:39Decoder@Jonathan Kemper72°Google 发布了 DiffusionGemma,一个 260 亿参数的开源模型。它不采用传统的逐词生成方式,而是通过扩散过程从噪声中生成文本,类似于图像 AI 的工作方式。据 Nvidia 称,该模型在单个 H100 GPU 上每秒可处理约 1000 个 token,速度是同类自回归模型的约 4 倍。但输出质量较低,因此 Google 目前将其定位为面向开发者的实验性工具。AI模型GoogleDiffusionGemma扩散模型开源模型推理加速10 个信源在谈推荐理由:DiffusionGemma 为文本生成开辟了新路径,追求推理速度的开发者可以尝试这种非自回归方案,尤其适合对实时性要求高的场景。原文
02:55Google DeepMind: Blog(博客/媒体)Google DeepMind 推出 DiffusionGemma,一种基于扩散模型的文本生成方法,相比传统自回归模型,生成速度提升 4 倍。该模型在保持生成质量的同时,显著降低了推理延迟,适用于需要快速响应的应用场景。DiffusionGemma 通过并行生成 token 而非逐个生成,实现了速度飞跃。这一进展对实时对话系统、内容生成等场景具有重要意义。AI模型文本生成扩散模型推理加速DeepMindDiffusionGemma推荐理由:做文本生成应用的开发者,如果你的产品对延迟敏感,DiffusionGemma 的 4 倍加速值得一试,能直接提升用户体验。原文
02:54marktechpost@Asif Razzaq76°Google DeepMind 推出 DiffusionGemma,一款 26B 参数的混合专家(MoE)开源模型,采用文本扩散技术,在 GPU 上生成速度最高提升 4 倍。该模型在保持生成质量的同时,显著降低了推理延迟,适合对实时性要求高的场景。DiffusionGemma 已开源,开发者可直接下载使用。AI模型DiffusionGemmaGoogle DeepMindMoE文本扩散开源模型推荐理由:做文本生成或实时 AI 应用的开发者,这个模型用扩散方法把生成速度翻了 4 倍,值得下载实测。原文
22:18IT之家(博客/媒体)精选AMD 在 SPEC CPU 2017 基准测试中,以 100kW 机柜功耗为限制,展示了新一代 256 核 EPYC Venice 处理器的性能。以英伟达 88 核 Vera 处理器的得分为 1.0 基准,Intel 128 核至强 6980P 得分为 1.46,上代 192 核 EPYC Turin 得分为 2.37,而 Venice 得分达到 3.30,约为 Vera 的三倍多。单核性能方面,256 核 Venice 相比 Vera 有 27% 优势,但降档至 96 核版本时优势缩至 11%。AMD 强调数据中心客户更关注固定功耗机柜的实际性能,而非单芯片峰值。AI模型AMDVeniceEPYC数据中心基准测试推荐理由:AMD Venice性能碾压对手原文
21:51Decoder@Maximilian Schreiner88°Anthropic推出了Claude Fable 5,这是其新Mythos模型系列的首款产品。该模型在几乎所有基准测试中领先,包括SWE-bench Verified达到95%,但价格是Opus 4.8的两倍,每百万token收费10或50美元。严格的安全过滤器会阻止约9%的请求,并且新的30天数据保留政策甚至适用于零数据保留合同。这标志着Anthropic在追求极致性能的同时,也加强了安全控制和商业化策略。AI模型Claude Fable 5Mythos系列推理模型安全过滤定价策略10 个信源在谈推荐理由:Claude Fable 5在编程和推理任务上创下新高,但高昂成本和严格过滤让开发者需要权衡。做AI应用或自动化流程的团队,建议先评估预算和合规需求再决定是否接入。原文
16:45marktechpost@Asif RazzaqAnthropic 推出了 Claude Fable 5 和 Claude Mythos 5 两款新模型,它们基于相同的底层架构,但安全防护级别不同。Fable 5 已全面可用,内置分类器以增强安全性;而 Mythos 5 则通过 Project Glasswing 项目有限开放,移除了网络安全相关的防护措施,面向更高级的用例。这一举措标志着 Anthropic 在模型安全分级上的新尝试,为不同风险承受能力的用户提供差异化选择。AI模型AnthropicClaude模型安全分级发布Project Glasswing10 个信源在谈推荐理由:Anthropic 首次推出同一模型的不同安全版本,做安全敏感或高风险 AI 应用的团队可以按需选择,值得关注 Mythos 5 的开放程度。原文
16:25IT之家(博客/媒体)精选72°摩尔线程发布并开源了首个基于国产 GPU 算力底座全链路训练的代码大模型 MusaCoder,包含 9B 和 27B 两个参数规模。该模型专注于 GPU 底层算子生成,可从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码,降低开发者手写门槛。在 KernelBench 评测中,MusaCoder-27B-RL 以 Overall Pass@8 93.2% 的成绩超越 Claude Opus 4.7、DeepSeek-V4 Pro 等主流模型,性能领先。模型已在 Hugging Face 开源,论文同步发布。AI模型代码大模型GPU 算子开源/仓库国产算力MusaCoder推荐理由:国产 GPU 生态终于有了自己的代码大模型,做 GPU 算子开发或国产算力适配的团队可以直接试用,降低底层开发门槛。原文
09:40SuperTechFans(博客/媒体)88°Anthropic推出两款新模型:Fable 5(安全版)和Mythos 5(无安全限制版)。Fable 5在软件工程、知识工作、视觉识别等领域达到最先进水平,可自主完成复杂任务,如一天内完成Stripe代码库迁移(原需团队两个月)。Mythos 5面向网络安全,在药物设计、分子生物学等领域表现超越人类专家。两款模型定价均为每百万输入令牌10美元、输出令牌50美元,比预览版低一半以上。但Fable 5的安全措施过于激进,误判大量正常内容,引发用户不满。AI模型AnthropicFable 5Mythos 5推理模型安全对齐10 个信源在谈推荐理由:Anthropic新模型价格腰斩且能力大幅提升,做复杂自动化或安全研究的团队值得关注;但安全版误判问题严重,实际使用前建议先测试边界。原文
08:12Simon Willison’s Weblog(博客/媒体)88°Simon Willison 在 Claude Fable 5 发布后第一时间进行了约 5.5 小时的测试。该模型与 Claude Mythos 5 性能相同,但增加了严格的安全护栏,触发时 API 会通知用户并可自动回退到其他模型。Fable 5 拥有 100 万 token 上下文窗口、12.8 万最大输出 token,知识截止于 2026 年 1 月,价格是 Opus 4.8 的两倍。Willison 认为它“感觉很大”,不仅体现在速度和成本上,更在于其知识深度,例如能准确列出他的开源项目。当前挑战已从“模型能做什么”转向“找到它做不了的事”。AI模型Claude Fable 5Claude Mythos 5安全护栏长上下文推理模型10 个信源在谈推荐理由:Claude Fable 5 的“大模型感”让开发者重新思考任务边界——如果你经常用 Claude 处理复杂推理或长上下文任务,这个模型值得一试,但要做好预算准备。原文
06:51IT之家(博客/媒体)88°Anthropic 于 6 月 9 日发布 Claude Fable 5 和 Claude Mythos 5 两款 AI 模型,其中 Fable 5 面向普通用户,是当前公开可用能力最强的 Claude 模型,在软件工程、知识工作、视觉和科学研究领域表现卓越,自主运行时间更长。Mythos 5 则通过 Project Glasswing 项目向网络安全和基础设施提供商开放,具备全球最强的网络安全能力,并在药物设计和分子生物学研究中提速约 10 倍。两款模型定价均为每百万输入 10 美元、输出 50 美元,Fable 5 已全面上线,Mythos 5 暂限特定合作伙伴使用。AI模型Claude Fable 5Claude Mythos 5Anthropic推理模型网络安全10 个信源在谈推荐理由:Claude 用户终于等来最强公开模型——Fable 5 在长任务和复杂推理上超越 Opus,做软件工程、金融分析或科研的可以直接上手体验。原文
02:33Decoder@Matthias Bastian88°Anthropic推出了两款新模型Claude Fable 5和Mythos 5,在编程和科学研究方面显著超越当前Opus系列。Fable 5在一天内完成了Stripe的代码迁移任务,而这项工作原本需要一个团队两个月。Mythos 5能自主设计候选药物,但由于其强大的网络攻击能力,目前被限制使用。这些模型展示了AI在复杂任务中的巨大潜力,但也引发了安全担忧。AI模型AnthropicClaude Fable 5Mythos 5编程助手科学研究10 个信源在谈推荐理由:编程和科研团队将看到AI效率的飞跃——Fable 5一天完成两个月的工作量,值得开发者关注;Mythos 5的自主药物设计能力则让生物医药研究者眼前一亮,但安全限制也提醒我们技术双刃剑的特性。原文