13:49Ethan Mollick@emollickGLM-5.2是一款开源模型,其性能不及GPT-5.5和Opus 4.8,更远不及Mythos。但它表现扎实,表明开源模型持续追赶前沿。当前开源权重已触及GPT-5.2水平,在该能力区间表现显著。这一进展说明开源模型正在缩小与闭源前沿的差距。AI模型GLM-5.2GPT-5.5Opus 4.8Mythos开源模型推荐理由:GLM-5.2虽然没追上GPT-5.5,但开源模型又往前迈了一大步,能力提升明显,值得关注。原文
11:58elvis@omarsar0动态工作流(即时生成测试框架)被视为一种新的测试时计算形式。然而LLM在自主构建复杂工作流方面表现不佳,作者经常需要手动引导代理生成复杂模式。推文对Mythos/GPT-5.6在动态生成复杂工作流上的效果表示好奇。该推文获得9条评论、4次转发、22个喜欢和3179次浏览。AI模型MythosGPT-5.6动态工作流测试时计算智能体推荐理由:聊动态工作流和LLM的短板,还点名Mythos/GPT-5.6,看它能不能搞定复杂模式生成。原文
04:59elvis@omarsar0精选推文讨论动态工作流适用于少数用例,被视为测试时计算(TTC)的新范式。作者指出动态工作流在爬山式研究实验中表现强劲,且通过精心规划和提高推理水平可获更好结果。文章强调验证器/评审器对结果至关重要,组合不同的编码代理可取得更优效果。当需要从不同代理(如LLM委员会)获取多元视角时,动态工作流非常有用,但前沿模型尚不擅长优化地即时生成测试平台。提到了Mythos等新型模型可能更善于代理编排,且需要更多TTC基准来评估动态工作流的有效性。技巧动态工作流测试时计算推理模型智能体Mythos推荐理由:如果你在做代理编排或研究测试时计算,这条推文给出了非常实用的观察,比如什么时候该用动态工作流、如何用好验证器,还提到了Mythos这类新模型。原文
07:10Ian Goodfellow@goodfellow_ianMythos普及了用LLM寻找漏洞的思路,但Aisle更早开始实践。Aisle使用小规模开源权重模型配合结构化搜索系统,成功匹配了带CVE的公共零日漏洞,且可离线运行。伯克利研究在8个类别中给予Aisle全球第1的排名(3项),团队来自欧洲且规模很小。AI产品AisleMythosLLM零日漏洞AI安全推荐理由:Aisle用开源小模型加搜索,在零日漏洞发现上追平了Mythos,伯克利8项里拿了3项第一,还能离线跑,挺牛的。原文
14:03elvis@omarsar0Sakana AI推出Fugu Ultra模型,这是一个可通过单个API调用的多智能体编排系统。Fugu Ultra在3D渲染任务上表现极佳,性能与Fable和Mythos相当,同时避免了出口管制风险。该模型展示了无需受限制即可获得前沿能力。AI模型Sakana AIFugu UltraFableMythos多智能体推荐理由:Sakana AI的Fugu Ultra多智能体系统,3D渲染强到离谱,性能比肩Fable和Mythos,还不用怕出口管制,快去试试。原文
00:41berryxia@berryxiaSakana发布了Fugu Ultra多智能体编排系统。它通过单个API调用,在工程、科学、推理等基准上匹配Fable和Mythos的性能。系统能动态编排全球各种模型,规避单一供应商出口管制风险。用户无需关心底层编排细节。AI产品SakanaFugu UltraFableMythos多智能体推荐理由:Sakana把多智能体做成了开箱即用的产品,Fugu Ultra一个API就能调用全球模型池,性能对标Fable。不用自己编排,挺省事。原文
12:24歸藏(guizang.ai)@op7418Anthropic已训练完成更强版本的Mythos模型,可能命名为Mythos 5.1或Mythos 6。目前不确定是否会公开发布或仅用于内部加速开发。消息称停止发布Fable 5或Mythos 5不会减慢进展,反而释放资源。竞争压力来自开源模型如GLM-5.2,迫使前沿实验室持续训练更强系统。AI模型AnthropicMythosGLM-5.2推理模型开源模型8 个信源在谈推荐理由:有人说Anthropic偷偷训了个更强的Mythos,但可能不对外放。想了解AI前沿动态可以看看。原文
15:18AI Will@FinanceYF5精选Anthropic在2月完成新模型Mythos的训练。Mythos悄然改变了整个研发节奏。过去5个月AI能力跃升部分源于Mythos。领先模型正帮助训练下一代模型,该循环已启动。AI模型MythosAnthropic推理模型模型迭代8 个信源在谈推荐理由:Anthropic悄悄练成了Mythos,据说它直接改变了研发节奏,领先模型开始帮训练下一代模型了。原文
01:49berryxia@berryxia美国对Claude最强的Mythos模型实施出口管制后,约200家美国机构(包括银行、Cisco、Dragos)依然保留访问权限,而普通用户和大多数组织已被挡在门外。Bloomberg报道了这一情况。评论指出这可能导致AI领域的永久底层阶级。AI鸿沟不仅是API价格差异,而是顶级能力被少数机构垄断。行业ClaudeMythosAnthropic出口管制AI鸿沟10 个信源在谈推荐理由:这篇报道揭露了美国出口管制下200家机构独享顶级AI能力,普通人连模型都见不到,直击AI不平等本质。原文
13:43Marc Andreessen@pmarcaAnthropic CEO Dario Amodei在Polymarket上透露,参与测试Mythos模型的公司警告其威力堪比超级武器,并建议使用需要类似枪支许可证的严格管控。该言论引发对AI安全与监管的讨论。目前Mythos模型的具体细节尚未公开。行业AnthropicDario AmodeiMythosAI安全AI监管10 个信源在谈推荐理由:Anthropic老板自己爆料的内部警告——他们测试的Mythos模型被说成超级武器,建议持证才能用,这瓜很劲爆。原文
00:16宝玉@dotey一条推文表达对Mythos级别开源模型的期待,该推文获得1次转发和9次点赞。目前尚无具体发布信息或基准成绩。行业Mythos开源模型推荐理由:网友在推特上表达对Mythos开源模型的期待,已有1转发9点赞原文
15:31kimmonismus@kimmonismus73°Anthropic顶级安全团队飞往华盛顿,与特朗普政府就Claude Fable 5出口管制谈判,周一会议未达成协议。商务部长Howard Lutnick从G7峰会电话参与,Anthropic联合创始人Tom Brown和外部事务主管Sarah Heck主导讨论。核心分歧在于Fable 5的护栏能否被移除解锁更强大的Mythos能力,NSA认为可行,Anthropic认为风险被夸大。目前无下一步清晰计划。行业AnthropicClaude Fable 5MythosAI安全出口管制10 个信源在谈推荐理由:Anthropic的Fable 5出口管制僵局,NSA和Anthropic对模型安全看法打架,局势微妙。原文
13:40kimmonismus@kimmonismus81°Anthropic因美国出口管制被迫将其顶级模型Mythos和Fable下线。公司现派遣高级技术人员前往华盛顿,与白宫沟通,试图说服官员这些模型可以被安全控制。这一事件成为实时检验AI地缘政治的案例。Axios报道了该动态。行业AnthropicMythosFable出口管制AI安全10 个信源在谈推荐理由:Anthropic的旗舰模型被强制下线,派技术团队去华盛顿谈判,这件事直接反映了AI出口管制的实际影响。原文
13:33Shashikant Kore@kshashiMythos模型的访问被限制后,印度主权模型群体以国家安全为由大力呼吁自主AI模型。他们指出,对仅有数年历史的AI技术依赖令人担忧,却对进口战斗机、潜艇和航空母舰等关键防御硬件保持接受。这种对比凸显了AI自主性争议中的双重标准。行业Mythos印度AI安全模型限制推荐理由:印度一群人拿国家安全说事,要搞自主AI模型,还吐槽为什么进口飞机不怕却怕用外国AI。挺有意思的争论。原文
01:29The Rundown AI@therundownai88°Anthropic 与美国政府在模型出口管制问题上发生冲突,公司已暂停旗下 Fable 和 Mythos 模型的访问。政府援引安全报告称 Fable 存在 jailbreak 风险,但 Anthropic 对此表示异议,认为行动缺乏透明和公正。Axios 消息称双方存在严重沟通障碍,政府曾给予 Anthropic 仅 90 分钟回应时间。数十名安全研究人员和行业人士签署公开信,呼吁恢复模型并建立透明的 AI 风险评估流程。行业AnthropicFableMythosAI安全出口管制10 个信源在谈推荐理由:Anthropic 因为政府要求暂停了两个模型,安全研究者联名反对,这事情挺复杂的,看看双方怎么各执一词。原文
23:03DavidSacks@DavidSacks82°Anthropic发布了Mythos类模型的商业版本Fable,带有安全护栏。但一位高度可信的测试伙伴发现了越狱漏洞,可以暴露Mythos的先进网络能力。美国政府要求Anthropic修复漏洞或下架模型,Dario拒绝。作为回应,美国政府发布了出口管制。Anthropic此前声称安全是最高优先,但在此案中将模型持续运营置于安全之上。行业AnthropicFableMythosAI安全出口管制10 个信源在谈推荐理由:Anthropic因为一个越狱漏洞被美国政府制裁,这事值得了解:他们自己说要安全第一,真出事却拒绝修复。原文
18:19AI Will@FinanceYF5一名用户测试了 Anthropic 的 Claude Fable(代号 Mythos)一周,称其为用过的最强模型,没有之一。该模型在爆火 3 天后被叫停,无法继续访问。用户指出模型有一些真实怪癖,令人又爱又恨。AI模型Claude FableMythosAnthropic10 个信源在谈推荐理由:有个哥们儿实测了一周 Claude Fable,说是迄今为止最强的模型,但已经被叫停了,想看看它到底有多强、有什么怪癖的话,这篇值得刷。原文
12:34AI Will@FinanceYF588°Anthropic 的高级模型 Mythos 和消费版 Fable 5 于上周五晚被美国商务部以国家安全出口管制为由下架,公司仅有 90 分钟响应。导火索是亚马逊向白宫提交报告称成功越狱了这两款模型,而 Anthropic 的 CEO Amodei 坚称只是狭窄绕过。目前双方正密集开会解决争端。行业AnthropicMythosFable 5出口管制AI安全10 个信源在谈推荐理由:Anthropic 模型因安全疑虑被紧急下架原文
11:51小互@imxiaohu彭博社采访中,Anthropic CEO Dario Amodei 透露公司有一个未发布的模型 Mythos,存在上千个漏洞,能黑银行、撬国家机密。他预测 AI 一到五年内将砍掉一半入门级白领工作。他还首次说明离开 OpenAI 的原因是信任崩了而非安全分歧。Amodei 认为文明崩溃概率为 10% 到 25%,并呼吁政府对所有 AI 公司加强监管。行业AnthropicDario AmodeiMythosAI安全监管10 个信源在谈推荐理由:Anthropic 老板亲述 Mythos 模型有多危险原文
01:52Gary Marcus@GaryMarcus精选Gary Marcus在X上发帖称每个模型都已被越狱,需要更好的技术但不应选择性执法。Pliny the Liberator展示了针对Anthropic的Mythos模型的越狱,使用了Unicode、同形字、西里尔字母等文本变换,以及长上下文引用跟踪、分类学与文档结构推理、虚构叙事框架、学术评审风格上下文和意图分类不一致等技术。最有效的方法是后端分解与重组,例如通过获取birch还原法/还原胺化(经典甲基苯丙胺合成途径)等过程信息,而非直接获取“甲基苯丙胺配方”等明确危害名称。Pliny还提到利用越狱的Opus辅助将无害信息片段重组为有害内容。行业Gary MarcusPliny the LiberatorAnthropicMythos越狱AI安全10 个信源在谈推荐理由:所有模型都能被越狱,安全措施需改进原文
11:07The Rundown AI@therundownai83°Anthropic 因美国政府出口管制指令,暂停所有对 Fable 和 Mythos 的访问。该指令限制外国国民(包括在美境内者)访问这些模型。政府引用了 Fable 被越狱的报告,但 Anthropic 对此表示异议。Anthropic 声明认为政府应有能力阻止不安全部署,但需基于透明、公平、清晰且技术事实明确的法定程序,而此次行动不符合这些原则。行业AnthropicFableMythosAI安全出口管制10 个信源在谈推荐理由:Anthropic 因政府指令暂停模型访问原文
10:44The Rundown AI@therundownai83°Anthropic 暂停了 Fable 和 Mythos 的访问,原因是美国政府发布出口管制指令,限制外国国民(包括在美境内者)使用。政府引用了 Fable 被越狱的报告作为依据,但 Anthropic 对此表示异议。Anthropic 声明认为政府应有能力阻止不安全部署,但需基于透明、公平、清晰且基于技术事实的法定程序,而此次行动不符合这些原则。行业AnthropicFableMythosAI安全出口管制10 个信源在谈推荐理由:Anthropic 因政府指令暂停 Fable 和 Mythos原文
09:54PolymarketMoney@PolymarketMoney72°Anthropic 已关闭其新 AI 模型 Mythos 的访问权限,原因是需要“确保合规”美国政府。该模型此前未公开细节,此次关闭可能涉及安全或监管审查。Anthropic 未说明具体合规要求或恢复时间。行业AnthropicMythosAI安全监管10 个信源在谈推荐理由:Anthropic 为合规关停新模型原文
09:53Amjad Masad@amasadPolymarket报道称,特朗普政府正采取措施阻止外国政府、公司及个人访问Anthropic的Fable和Mythos模型。该消息由Replit CEO Amasad在X平台转发,引发97个点赞和8358次浏览。目前Anthropic尚未正式回应,但此举可能影响其模型的国际使用范围。行业AnthropicFableMythos特朗普政府AI安全10 个信源在谈推荐理由:美国政府要封Anthropic的模型了原文
13:31swyx (AI Engineer)@swyxMythos 正式上线,其 FrontierCode 被认定为下一代编程基准。在 FC Diamond 测试中,Opus 4.8 和 GPT 5.5 在随努力扩展方面表现不佳。Mythos/Fable 的后训练方法首次将测试时计算应用于解决超长任务,相当于数十小时人类工作、每任务数百美元。该功能现已在 Cognition 和 Devin 中可用,仅需 1.4x ACUs。AI产品编程基准MythosFrontierCodeOpus 4.8GPT 5.5Devin8 个信源在谈推荐理由:Mythos 的 FrontierCode 基准揭示了当前顶级模型在长任务上的扩展瓶颈,做 AI 编程评估或开发长流程自动化的团队值得关注,可以直接在 Devin 中体验。原文
12:35Mark Chen (OpenAI 研究)@markchen90英国 AI 安全研究所(UK AISI)发布了一项针对前沿模型的长时智能体能力评估,测试了模型在复杂、多步骤任务中的自主执行能力。结果显示,Claude 5.5 与 Mythos 在该评估中表现相似,均展现出较高的智能体能力。该评估强调了前沿模型在长期自主任务中可能带来的风险,但同时也指出通过有效的缓解措施,可以安全地部署这些模型供用户使用。这一测试对于理解模型在实际应用中的安全边界具有重要意义。AI模型Claude 5.5Mythos智能体AI 安全长时任务1 个信源在谈推荐理由:UK AISI 的这项评估直接关系到前沿模型的安全部署,做 AI 安全或智能体开发的团队值得关注——它揭示了长时任务中的真实风险,也展示了缓解措施的有效性。原文
11:52Epoch AI@EpochAIResearchEpoch AI 研究团队分析了 Mythos 在网络安全方面的公开证据,发现其在漏洞发现方面是否领先趋势尚不明确,但在漏洞利用能力上实现了显著跃升。该研究由多位学者共同完成,通过对比历史数据和当前表现,揭示了 Mythos 在攻击性安全任务中的突破性进展。这一发现对 AI 安全领域具有重要警示意义,表明 AI 在自动化攻防中的能力正在快速提升。AI模型Mythos网络安全漏洞利用AI安全能力评估推荐理由:网络安全团队和 AI 安全研究者需要警惕——Mythos 在漏洞利用上的跃升意味着攻击面正在扩大,建议点开了解具体数据,评估自身防御策略。原文
08:08PolymarketMoney@PolymarketMoneyAnthropic 在最近30天内密集推进多项重大动作:已提交IPO申请,营收首次超越OpenAI,最新一轮融资估值高达9690亿美元,并发布了名为“Mythos”的新AI模型。这些进展标志着Anthropic在AI领域的竞争地位显著提升,尤其在商业化和资本市场上对OpenAI形成直接挑战。Mythos模型的发布进一步丰富了其产品线,可能推动AI应用的新方向。行业AnthropicIPO营收估值Mythos10 个信源在谈推荐理由:Anthropic 30天内营收反超OpenAI并冲刺IPO,关注AI行业格局变化的读者值得一看,这可能是AI竞赛的分水岭时刻。原文
19:15The Rundown AI@therundownaiAnthropic 向公众推出了其 Mythos 级别的 AI 模型,标志着其在 AI 能力上的又一次重大提升。Perplexity 发布的数据地图显示了智能体工作模式的转变趋势,表明 AI 代理正在从概念走向实际应用。此外,Dexter 工具实现了金融研究的自动化,而 Codex 则帮助日本一家西兰花农场实现了自动化运营。同时,还有 4 款新的 AI 工具和社区工作流发布,展示了 AI 在各行业的渗透。这些进展共同反映了 AI 在自动化、研究和农业等领域的快速落地。AI产品AnthropicMythosPerplexity智能体自动化10 个信源在谈推荐理由:Anthropic 的 Mythos 级 AI 可能带来更强的推理能力,AI 从业者和开发者值得关注其实际表现;Perplexity 的数据地图则给做智能体产品的团队提供了市场信号,建议点开看看趋势。原文
15:11@koltregaskes@koltregaskes72°Claude Fable 5(Mythos 通用变体)已发布,其算力消耗是 Opus 的两倍。该模型提供低、中、高、极高和最大五个计算级别,用户可根据需求选择。目前 Fable 仅限订阅用户使用至 6 月 22 日,团队计划在算力充足后重新上线。由于消耗巨大,有用户担心在 $20 订阅计划下,一次提示可能耗尽 5 小时会话额度。AI模型ClaudeFable 5Mythos推理模型算力消耗10 个信源在谈推荐理由:Claude Fable 5 的算力消耗翻倍意味着更强的推理能力,但也会快速消耗订阅额度。重度 Claude 用户需要权衡性能与成本,建议在 6 月 22 日前体验并评估是否值得长期使用。原文
08:14小互@imxiaohu72°Anthropic 计划于今晚发布其最强 AI 模型 Mythos,这将是该公司在 AI 领域的重要进展。Mythos 预计在推理、代码生成等任务上超越前代,可能对标 OpenAI 的 GPT-4 系列。消息来自知名爆料者小互,可信度较高。该发布可能引发新一轮 AI 模型竞争,值得关注。AI模型AnthropicMythos推理模型AI 模型发布GPT-4 对标10 个信源在谈推荐理由:Anthropic 新旗舰模型 Mythos 今晚发布,做 AI 应用开发或模型对比的团队可以第一时间关注,看看它能否在推理和代码任务上超越 GPT-4。原文
07:14orange.ai@oran_ge88°Claude Fable 5 今日正式发布,基于 Mythos 底座并新增安全护栏,是自 Claude 4.5 以来最重大的模型升级。该模型在软件工程、知识工作、视觉识别和科学研究等几乎所有基准测试中均处于顶尖水平,任务越复杂优势越明显。Andrej Kapathy 评价其能“解放思想”,用户可交付更大任务而无需检查代码。价格方面,输入 10 美元、输出 50 美元、缓存输入 1 美元,长文本场景下单句可能花费 10 美元,需注意配额。Claude Fable 5 将以原价在 Cola 平台上线供体验。AI模型Claude Fable 5Mythos安全护栏推理模型编程助手10 个信源在谈推荐理由:Fable 5 解决了复杂长任务执行中的模型能力瓶颈,做 AI 开发或重度使用的团队可以直接体验,感受“解放思想”的编程体验——但记得先设好预算配额。原文
04:49Gary Marcus@GaryMarcusAnthropic 在 Mythos/Fable 系统卡中透露,他们不仅为安全添加了护栏,还暗中限制了针对前沿大模型开发的请求,以保护自身知识产权。批评者指出,Anthropic 一边保护自家 IP,一边却大量使用他人的知识产权来训练 AI。这一做法引发了关于 AI 公司知识产权保护双重标准的讨论。行业AnthropicMythos知识产权护栏AI 伦理10 个信源在谈推荐理由:这件事暴露了 AI 公司在知识产权问题上的双标——既想用别人的数据,又严防别人碰自己的模型。关注 AI 伦理和开源生态的读者值得一看。原文
03:45Guillermo Rauch@rauchgAnthropic 的 Mythos 安全验证工具对 Malte Ubl 的 just-bash 项目进行了安全审计,结果未发现严重问题。just-bash 是一个完整的 bash 实现,包含 QuickJS、CPython 和可选文件系统访问,攻击面很大。该项目大部分代码由 Claude Opus 4.5 编写,仅经过最少的人工审查,但通过深度加固循环和机器强制编码规则保证了安全性。这一案例展示了 AI 生成代码在严格安全约束下可以达到的可靠性。AI产品Claude OpusMythos安全验证AI 生成代码just-bash10 个信源在谈推荐理由:AI 写代码的安全性问题一直让人担心,这个案例证明只要加固流程到位,AI 生成的复杂系统也能通过专业审计。做 AI 安全或代码生成的团队值得看看他们的方法论。原文
02:21歸藏(guizang.ai)@op741888°Anthropic 今日发布了 Mythos 模型的低配版本 Fable 5,其测评基准甚至超过之前的 Mythos Preview。Fable 5 在 Agent Coding、工具调用方面表现突出,基准得分显著高于 Opus 4.8。API 定价为输入每百万 Token 10 美元、输出每百万 Token 50 美元,比 Mythos Preview 便宜一半。Fable 5 加强了安全防护,对涉及网络攻击、生化攻击等请求会拒绝服务并回退到 4.8 版本。该模型已向 API、Pro、Max、Team 及企业用户开放,但 6 月 23 日后可能按量计费。AI模型AnthropicFable 5MythosAgent/工具调用API定价10 个信源在谈推荐理由:Fable 5 以更低价格提供接近 Mythos 的性能,做 Agent 和工具调用的开发者可以直接试,性价比很高。原文
01:21PolymarketMoney@PolymarketMoneyAnthropic 正式发布了其迄今为止最强大的 AI 模型 Claude Fable,该模型基于 Mythos 架构。Claude Fable 在推理、创造力和多模态能力上均有显著提升,旨在与 OpenAI 的 GPT-5 和 Google 的 Gemini 2.0 竞争。此次发布标志着 AI 领域新一轮性能竞赛的开始,开发者可期待更智能的对话和任务处理体验。AI模型AnthropicClaude Fable推理模型MythosAI 竞赛10 个信源在谈推荐理由:Claude Fable 是 Anthropic 目前最强的模型,做 AI 应用开发的团队值得第一时间上手测试,看看它在复杂推理和创意任务上的表现是否超越预期。原文
18:42小互@imxiaohu72°据小道消息,Anthropic 计划于今晚发布其最强 AI 模型 Mythos。该消息来自社交媒体,引发广泛关注。Mythos 可能代表 Anthropic 在 AI 能力上的重大突破,具体细节待官方确认。若属实,这将是 AI 领域的重要事件,值得密切关注。AI模型AnthropicMythosAI模型发布前沿10 个信源在谈推荐理由:Anthropic 的新模型可能刷新 AI 能力上限,关注前沿模型的开发者和研究者建议今晚蹲守官方动态。原文
16:23PolymarketMoney@PolymarketMoney72°据 Polymarket 报道,Anthropic 将于明天发布其新 AI 模型“Mythos”。该消息来自社交媒体平台 X 上的爆料,目前尚未得到 Anthropic 官方确认。Mythos 可能延续 Anthropic 在安全性和推理能力上的优势,或将对标 GPT-5 等前沿模型。若消息属实,这将是 AI 领域近期最受瞩目的发布之一。AI模型AnthropicMythos模型发布AI 前沿推理模型10 个信源在谈推荐理由:Anthropic 新模型 Mythos 即将发布,关注前沿 AI 动态的开发者可以提前了解,明天值得蹲守。原文
19:07rohanpaul_ai@rohanpaul_ai83°Anthropic 一款代号为 Oceanus 的未发布模型在中文 API 代理上提前出现,属于即将推出的 Mythos 系列。该模型定价极高,输入每百万 token 16 美元,输出每百万 token 80 美元,几乎是 Claude Opus 的三倍。泄露的模型被重新打包并销售,而 Anthropic 尚未完成其安全测试。这一事件暴露了模型发布前的安全漏洞,可能影响 Anthropic 的发布节奏和定价策略。AI产品AnthropicOceanusMythos模型泄露API 定价10 个信源在谈推荐理由:模型泄露事件暴露了 AI 供应链的安全风险,关注模型定价和发布节奏的开发者、API 用户值得留意——泄露版本可能影响后续正式版的可用性和价格。原文
10:38Gary Marcus@GaryMarcus精选Gary Marcus 引用 scaling01 观点,认为 Mythos 在多项基准测试中优于 GPT-5.5,包括 SWE-bench Pro(77.8% vs 58.6%)、HLE(56.8% vs 41.4%)和网络安全测试。Mythos 在漏洞利用方面表现更强,能更高效地发现安全漏洞,但这也带来严重安全隐患。Marcus 警告,若 Mythos 完全发布,将对未充分防御的现实系统造成巨大混乱。目前最大的未知是 Mythos 在开放真实世界问题中的表现。AI模型MythosGPT-5.5基准测试安全威胁AI模型推荐理由:Mythos 在编程和网络安全基准上碾压 GPT-5.5,做 AI 安全或模型评估的团队需要关注其潜在威胁,建议提前加固防御。原文