claudeopus4.8·product

Claude Opus 4.8

别名Opus 4.8、
首次出现
2026-05-29
最近出现
2026-06-10
累计提及
121
§ 01综述

Anthropic 于 2026 年 5 月 28 日发布了其最新旗舰模型 Claude Opus 4.8,这是继 Opus 4 之后的一次重要升级。该模型在编程、智能体任务和事实可靠性方面有显著提升,在多个基准测试中重夺榜首。

  • 官方宣布 Claude Opus 4.8 在编码和智能体任务中性能大幅提升,并特别强调了诚实性和减少无依据结论的改进 (Anthropic: Newsroom)。
  • 在 LMArena 等第三方测试中,Claude Opus 4.8 通过了超过 200 个前端测试,综合能力得分超过 Gemini 3.1 Pro 等竞品,被评价为“能力夺回第一” (岚叔, lmarena.ai)。
  • 新推出的“快模式”引发关注:速度提升 2.5 倍,价格降低 3 倍,大幅降低了使用成本 (rohanpaul_ai)。
  • 开发者社区迅速适配,如 ZenMux 提供免费体验,生成高细节波音 747 模型成功 (berryxia);llm-anthropic 库也同步更新支持 (Simon Willison’s Weblog)。
  • 当前焦点在于:Opus 4.8 被一些观察者视为“小幅升级”,其实际能力提升是否足以支撑 Anthropic 高达 9650 亿美元的估值?同时,快模式是否会影响输出质量尚未明确。未来需关注 Anthropic 是否会推出更大更新的旗舰模型,以及 Opus 4.8 在企业级 Agent 任务中的实际表现。

    § 02相关报道10 条在档
    1. 01
      Claude Opus 4.8 在 Agent Arena 与 GPT 5.5 并列第一
      lmarena.ai
    2. 02
      FrontierCode 基准测试:Claude Opus 4.8 仅 13.4%,AI 代码离可合并还很远
      rohanpaul_ai
    3. 03
      Cognition 推出 FrontierCode:将 Coding 评估标准从可用提升到可合并,Claude Opus 4.8 领先
      shao__meng
    4. 04
      METR 编码基准饱和?Cognition 发布 FrontierCode 新评测,Claude Opus 4.8 仅 13.4%
      Gary Marcus
    5. 05
      开发者实测:Codex GPT-5.5 写 Mac 应用不如 Claude Opus 4.8
      宝玉
    6. 06
      Greg Isenberg:模型发布已像iPhone迭代,Claude Opus 4.8无实质飞跃
      AI Will
    7. 07
      模型发布正在变成新 iPhone 时刻
      AI Will
    8. 08
      Claude Opus 4.8 在 Skywork 上线
      Skywork
    9. 09
      Claude Opus 4.8 比 4.7 强,但不够颠覆
      shao__meng
    10. 10
      Claude Opus 4.8 登顶 DeepSWE Bench,效率与可靠性领先
      elvis
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Claude%20Opus%204.8