全部 AI 动态 · AI 热点

6月4日

13:01

阶跃星辰 Stepfun@Stepfun_AI

精选

StepFun 发布 Step 3.7 Flash 模型，主打高智能与高速度的平衡。该模型采用 MTP 辅助解码技术，输出速度超过 400 tokens/s，具备更强的智能体性能和原生多模态能力。模型权重以 Apache 2.0 协议开源，适合生产级智能体工作负载。独立评测者 @ArtificialAnlys 对其进行了详细评估。

AI模型推理模型开源/仓库智能体多模态 StepFun

推荐理由：做智能体应用或需要高吞吐推理的团队，Step 3.7 Flash 的开源高速度方案值得直接拿来用，尤其适合生产环境部署。

原文

10:53

lmarena.ai@lmarena_ai

精选

MiniMax M3 在 Document Arena 中排名第14位，该榜单评估模型的文档分析和长内容推理能力。M3 在同等价格点上表现优异，进一步优化了帕累托前沿。这一成绩体现了 MiniMax 在性价比上的竞争力。

AI模型 MiniMax M3 Document Arena 文档分析推理模型

推荐理由：MiniMax M3 文档能力排名 14

原文

08:10

Latent.Space@latentspacepod

精选72°

Axiom Math AI 创始人兼 CEO Carina Hong 在播客中解释，数学验证可能是从代码智能体迈向 AGI 的关键。她认为，通过 Lean 等形式化证明工具，可以将推理转化为更强的奖励信号，从而扩展 AI 的“聪明”而非仅仅修复幻觉。Axiom 将市场定位为所有 AI 生成的代码，并强调未来 AI 的瓶颈可能不是生成，而是验证。该方法还能以自验证方式证明研究猜想。

AI模型 Axiom 数学验证 AGI 形式化证明推理模型

推荐理由：数学验证正在成为 AI 推理的下一个突破口，做代码智能体或形式化验证的开发者值得关注——这可能是从“生成”到“验证”的范式转变。

原文

06:06

Sundar Pichai@sundarpichai

88°

Google CEO Sundar Pichai 宣布推出 Gemma 4 12B 模型，该模型在体积和性能之间取得平衡，可在配备 16GB VRAM 的笔记本电脑上本地运行。它支持多步推理和智能体工作流，采用 Apache 2.0 开源许可。同时，Gemma 4 系列下载量已超过 1.5 亿次。该模型为开发者提供了在本地设备上部署强大 AI 能力的新选择。

AI模型 Gemma 4 12B 本地运行开源推理模型

推荐理由：对于想在笔记本上跑本地 AI 的开发者，Gemma 4 12B 是难得的小体积高性能选择，16GB VRAM 就能运行，建议直接下载试试。

原文

00:31

阶跃星辰 Stepfun@Stepfun_AI

Step 3.7 Flash 模型专为真实世界的智能体编程任务设计，不仅追求代码生成速度，更注重在复杂输出中保持逻辑、视觉和执行的一致性。该模型在演示中展示了其在多步骤、多模态任务中的连贯性，适合需要高可靠性的编程场景。开发者 @atomic_chat_hq 的创意测试进一步验证了其能力。

AI模型智能体编程助手推理模型 Step 3.7 Flash 多模态

推荐理由：做智能体编程的开发者终于有了一个兼顾速度和一致性的模型——Step 3.7 Flash 在复杂任务中保持逻辑连贯，值得在真实项目中试试。

原文

6月3日

13:48

Mustafa Suleyman@mustafasuleyman

88°

微软CEO Mustafa Suleyman宣布推出7款全新MAI系列模型，包括文本基础模型MAI-Thinking-1、图像模型MAI-Image-2.5及高效编程模型MAI-Code-1-Flash。MAI-Thinking-1拥有350亿激活参数的MoE架构，256K上下文窗口，在AIME 2025上达到97%，SWE Bench Pro上53%，与Opus 4.6持平，且盲测中整体质量优于Sonnet 4.6。该模型针对微软自研MAIA 200芯片优化，性能每美元提升30%，每瓦性能提升1.4倍。MAI-Code-1-Flash仅5B参数，SWE Bench Pro达51%，成本更低。微软还推出Frontier Tuning服务，允许企业定制专属模型，早期案例中为McKinsey定制模型以10倍低成本超越GPT-5.5。

AI模型 MAI-Thinking-1 MAI-Code-1-Flash MAI-Image-2.5 推理模型编程助手

推荐理由：微软一口气推出7款新模型，覆盖推理、编程、图像三大方向，MAI-Thinking-1在推理和编码上直接对标Claude Sonnet 4.6和Opus 4.6，做AI应用或企业定制化模型的团队值得关注——尤其是Frontier Tuning让企业用更低成本获得超越GPT-5.5的效果。

原文

09:52

berryxia@berryxia

精选

微软AI今日发布了七个全新MAI模型，包括MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5等，覆盖推理、编码、图像、语音和转录任务。这些模型是从零开始、使用干净数据训练，不依赖蒸馏，强调血统纯净。其中MAI-Code-1-Flash在SWE-Bench Verified上达到71.6分，超越Claude Haiku 4.5，且节省60% token。MAI-Image-2.5在图像编辑和文本生图排名靠前，已集成到PowerPoint和OneDrive。微软的策略是构建专精任务、可协作的模型家族，而非追求单一通用大模型。

AI模型微软 MAI模型编程助手推理模型图像生成

推荐理由：微软这次反主流而行，用干净数据从零训练专精模型，做AI开发或选型的人值得关注——MAI-Code-1-Flash在编码任务上性价比突出，Copilot用户可以直接体验。

原文

08:37

Fireworks AI@FireworksAI_HQ

微软 MAI 模型即将在 Fireworks 平台上架，提供可控的智能和可追溯的端到端数据链。企业用户可针对自身任务对 MAI 推理模型进行微调，使用自己的数据构建定制化模型。这标志着微软将企业级 AI 能力进一步开放给开发者，Fireworks 作为高性能推理平台，将加速 MAI 模型的落地应用。

AI产品微软 MAI Fireworks 企业微调推理模型

推荐理由：企业 AI 团队终于有了可定制的推理模型——MAI 支持端到端数据溯源和私有微调，做企业级 AI 应用的开发者可以直接在 Fireworks 上尝试，省去自建基础设施的麻烦。

原文

08:12

lmarena.ai@lmarena_ai

精选76°

微软在Build大会上发布了七款全新的MAI系列模型，涵盖推理、代码、图像、转录和语音等能力。这些模型从零开始训练，基于干净的数据溯源，设计注重效率，并作为模型家族无缝协作。其中MAI-Image-2.5是图像生成模型，其他模型包括推理、代码生成、语音识别等。这标志着微软在自研AI模型上的重大投入，旨在为开发者提供一体化AI解决方案。

AI模型微软 MAI模型 Build大会图像生成推理模型

推荐理由：微软一口气推出七款自研模型，覆盖推理到语音全场景，做AI应用开发的团队可以直接集成，省去拼凑多家模型的麻烦。

原文

05:02

rohanpaul_ai@rohanpaul_ai

88°

微软发布了 MAI-Thinking-1，这是其自研推理模型系列的首个成果。该模型采用 1T 总参数的混合专家架构，每次推理仅激活 35B 参数，在 AIME 2025 上达到 97.0%，LiveCodeBench v6 上 87.7%，SWE-Bench Pro 上 52.8%。微软称其训练流程为“爬山机器”，通过持续优化数据、训练、奖励和安全测试形成闭环。预训练基于 30T 主要人工生成 token，避免使用第三方模型蒸馏，随后通过强化学习提升数学、编程、工具使用和安全能力。这标志着微软在推理模型领域建立了完整的自研能力。

AI模型推理模型微软 MAI-Thinking-1 混合专家模型强化学习

推荐理由：微软用自研数据+强化学习打造了强推理模型，做 AI 推理或模型训练的团队值得关注其“爬山机器”方法论，尤其是 35B 激活参数就能达到接近顶尖水平的效率。

原文

01:20

LangChain@LangChainAI

LangChain 创始人 Harrison Chase 在 X 上发布视频，用 1 分钟解释了 Managed Deep Agents 的概念。Managed Deep Agents 是一种新型智能体架构，通过将深度推理与受控管理结合，提升复杂任务执行的可靠性和效率。该架构旨在解决传统智能体在长链推理中容易出错的问题，适合需要高精度决策的自动化场景。视频发布后引发社区关注，已有 7000 多次浏览。

AI产品智能体 LangChain 推理模型架构自动化

推荐理由：LangChain 创始人亲自拆解 Managed Deep Agents 架构，做智能体开发的团队值得花 1 分钟理解这个新范式，能帮你避开长链推理的坑。

原文

01:14

OpenRouter@OpenRouterAI

DigitalOcean 的 AI-Native Cloud 现已作为新供应商接入 OpenRouter 平台，提供高性能推理服务。该服务支持多种热门开源模型，在 DeepSeek V3.2 模型上输出速度和延迟均排名第一，数据由 Artificial Analysis 验证。开发者可通过 OpenRouter 直接调用这些模型，获得更快的响应体验。

AI产品 DigitalOcean OpenRouter 推理模型云服务 DeepSeek V3.2

推荐理由：做 AI 应用开发或需要快速推理的团队，现在可以在 OpenRouter 上直接使用 DigitalOcean 的高性能云服务，DeepSeek V3.2 的速度优势值得一试。

原文

6月2日

22:55

阶跃星辰 Stepfun@Stepfun_AI

Step 3.7 Flash 是一款面向快速智能体编码的开源权重模型，支持可靠工具调用和多模态理解。该模型已从模型卡片阶段进入实际编码工作流，由 @kilocode 团队在博客中详细介绍。其设计重点在于提升智能体编码效率，适合开发者集成到自动化编程任务中。这一进展标志着开源模型在实用化方面迈出重要一步。

AI模型开源/仓库推理模型编程助手智能体 MCP/工具

推荐理由：做智能体编码的开发者终于有了一个可直接使用的开源模型——Step 3.7 Flash 的可靠工具调用和多模态能力能显著提升自动化效率，建议点开博客了解具体集成方式。

原文

19:21

Ate-a-Pi@svpino

一个创新的AI推理市场概念被提出，它能够根据实时价格将请求路由到最便宜的合格模型。目前用户通常按固定费率支付给供应商，但这种方式即将改变。该市场声称可节省高达87%的推理成本。这一想法旨在打破固定定价模式，让AI推理更经济高效。

AI产品推理模型成本优化市场/平台 AI推理定价模式

推荐理由：做AI推理的团队终于有了降本利器——动态路由到最便宜模型，直接省87%成本，做模型部署和成本优化的建议点开看看。

原文

10:36

Skywork@Skywork_ai

88°

AI模型 Claude Opus 4.8 推理模型 Skywork Anthropic 模型更新

推荐理由：Claude Opus 4.8 的更强推理能力对需要高精度判断的开发者（如代码审查、逻辑分析）是直接利好，Skywork 用户现在就能体验，建议试试。

原文

10:17

AI Will@FinanceYF5

一款语音Agent现在具备了GPT-5级别的推理能力，能够在说话的同时进行实时思考，实现了真正的智能交互。这一突破意味着语音助手不再只是简单响应指令，而是能像人类一样边思考边表达，大幅提升对话的自然度和深度。该进展可能改变语音交互的应用场景，从客服到个人助理都将受益。

AI产品语音Agent 推理模型 GPT-5 智能交互实时思考

推荐理由：语音Agent终于能边说话边推理了，做语音交互或智能客服的团队值得关注，这可能是体验质变的关键一步。

原文

10:10

Gary Marcus@GaryMarcus

精选

Gary Marcus 转发了一条关于神经符号系统（Neurosymbolic）的突破性进展：通过让一个 80 万参数的 Transformer 像逻辑求解器一样推理，仅用 15 分钟训练计算就能在极难数独（sudoku-extreme）上达到 100% 准确率。这项工作由 Leo 在 Axiom Math AI 完成，标志着神经符号集成在推理任务上的重大进步。它展示了小模型通过符号化推理能力可以超越纯神经网络方法，为 AI 推理效率提供了新思路。

论文神经符号系统推理模型 Transformer 数独小模型

推荐理由：神经符号系统终于有了可量化的突破——小模型+符号推理就能碾压纯神经网络，做推理模型和逻辑 AI 的团队值得关注这个方向。

原文

00:17

Paul Couvert@itsPaulAi

83°

MiniMax 发布开源权重模型 M3，在 SWE-Bench Pro 上达到 59.0%，与 GPT-5.5 持平，并在多项编码基准上与 Opus 4.7 不相上下。M3 还支持 1M 上下文、原生多模态，使用成本仅为 GPT 和 Opus 的十分之一。权重和技术报告将在约 10 天后在 Hugging Face 开放。这标志着开源模型首次在多个前沿能力上追平闭源顶级模型，对 AI 开发者和企业用户意义重大。

AI模型开源/仓库推理模型编程助手 MiniMax M3

推荐理由：开源模型首次在编码和智能体任务上追平 GPT-5.5 和 Opus，成本却低一个数量级。做 AI 应用开发或自建模型的团队，值得关注权重发布后直接试用。

原文

6月1日

12:35

NVIDIA AI@NVIDIAAI

精选

NVIDIA AI 官方推特宣布，新一代大语言模型 Nemotron 3 Ultra 将于本周内推出。这是 Nemotron 系列的最新版本，具体参数和性能细节尚未披露。此前 Nemotron 4 340B 以推理基准上的表现受到关注，业界期待新版本能否进一步在效率和准确性上提升。

AI模型 Nemotron 3 Ultra NVIDIA 开源模型推理模型

推荐理由：NVIDIA 终于要发新模型了

原文

11:16

Together AI@togethercompute

精选

AI模型 MiniMax M3 Together AI 推理模型模型上线

推荐理由：MiniMax M3 上线并由 Together AI 支持推理，意味着模型推理性能有保障，做 AI 应用开发的团队可以直接试用，值得关注。

原文

07:55

阶跃星辰 Stepfun@Stepfun_AI

精选

StepFun 的 Step 3.7 Flash 模型在智能体效率方面取得了新突破，通过优化推理速度和资源占用，显著提升了智能体任务的执行效率。该模型特别适合需要快速响应的自动化场景，如代码生成、数据处理等。开发者可以借助它构建更高效的智能体应用，降低延迟和成本。这一进展为智能体技术的实际落地提供了有力支持。

AI模型 Step 3.7 Flash 智能体效率优化推理模型自动化

推荐理由：做智能体开发的团队会关注——Step 3.7 Flash 直接解决了效率瓶颈，建议试试看能否优化你的自动化流程。

原文

5月30日

10:50

宝玉@dotey

AI 从业者 dotey 分享了自己的使用原则：优先选择推理能力更强的模型（Reasoning Max），而非追求速度（Speed Fast）。他认为慢推理能减少后续验证时间，而快速模型性价比不高。这一观点引发了对 AI 模型选择策略的讨论，尤其适合注重准确性和效率的开发者。

技巧推理模型模型选择效率 dotey AI 使用原则

推荐理由：做 AI 应用或模型选型的开发者，这条原则帮你省下反复验证的时间——慢推理反而更快，值得一试。

原文

05:39

Jeff Dean@JeffDean

精选

在Logan Kilpatrick主持的对话中，Gemini联合负责人Jeff Dean、Oriol Vinyals、Noam Shazeer和Koray Kavukcuoglu分享了Gemini的当前进展、发展历程及下一步计划。对话未披露具体基准分数或版本号，但涉及模型在多模态和推理能力上的方向。

行业 Gemini Google 多模态推理模型

推荐理由：听Gemini团队聊模型走向

原文

5月29日

22:53

rohanpaul_ai@rohanpaul_ai

72°

一场由顶尖研究者参与的 Transformer 与 Post-Transformer 辩论，以拳击擂台形式呈现，兼具技术深度与娱乐性。Transformer 阵营强调其规模化优势、硬件友好性和当前统治地位，认为替代者需 10 倍更好才能迫使生态切换。Post-Transformer 阵营则指出原生推理、持续学习和真正记忆是当前架构的短板，未来可能是混合架构。辩论持续 1 小时 20 分钟，涵盖从注意力机制到 latent reasoning 的多个关键点。

AI模型 Transformer Post-Transformer 推理模型持续学习架构辩论

推荐理由：这场辩论把 AI 架构之争讲得既硬核又好玩，做模型研究或关注下一代架构的开发者看完会有新视角，建议直接看原视频。

原文

17:57

AI SDK@aisdk

Anthropic 发布了 Claude Opus 4.8，这是 Opus 4.7 的升级版本。新模型在判断力上更加敏锐，对自身进展的表述更诚实，并且能够比前代更长时间地独立工作。该模型现已可用，价格与 Opus 4.7 相同。AI SDK 已支持集成该模型，开发者可以立即使用。

AI模型 Claude Opus 4.8 推理模型 AI SDK 自主工作 Anthropic

推荐理由：Claude Opus 4.8 提升了判断力和自主工作能力，做复杂推理和长任务自动化的开发者可以直接用上，价格不变值得升级。

原文

17:54

Dify@dify_ai

Claude Opus 4.8 现已集成到 Dify 平台，用户可以在 Dify 中直接调用该模型构建多步骤 AI 工作流。该模型具备更强的推理能力，能自动化复杂任务。Dify 支持连接模型、工具、知识库和工作流逻辑，帮助用户从早期探索过渡到结构化、可复用的工作流。用户可通过 Dify 市场更新使用。

AI产品 Claude Opus 4.8 Dify AI工作流推理模型自动化

推荐理由：Dify 用户终于能用上 Claude Opus 4.8 的强推理能力来构建多步工作流，做自动化流程的团队可以直接在平台上试，省去模型切换的麻烦。

原文

14:36

阶跃星辰 Stepfun@Stepfun_AI

88°

阶跃星辰发布了 Step 3.7 Flash 模型，专注于智能体效率，在 ClawEval-1.1、SimpleVQA Search 等基准测试中取得领先成绩。该模型采用 198B 稀疏 MoE 架构，约 11B 活跃参数，支持 400 TPS 推理速度和 256K 上下文，并提供三种推理级别。它擅长理解 UI、图表、文档和图像，并能直接编写代码或调用工具执行操作，在 τ²-bench 上工具调用可靠性超过 98%。模型权重以 Apache 2.0 开源，可在 Mac Studio M4 Max、DGX Spark 等设备本地运行，并兼容 Claude Code、MCP 等生态。

AI模型阶跃星辰 Step 3.7 Flash 智能体开源/仓库推理模型

推荐理由：做智能体、编程或搜索应用的开发者终于有了一个兼顾速度、成本和可靠性的开源模型——Step 3.7 Flash 在工具调用和视觉理解上表现突出，而且能在本地跑，建议直接试试。

原文

12:25

Latent.Space@latentspacepod

88°

Anthropic 宣布完成 9650 亿美元 H 轮融资，并同步推出新一代模型 Opus 4.8 以及 Dynamic Workflows/ultracode 功能。Opus 4.8 在推理和代码生成能力上有显著提升，而 Dynamic Workflows 旨在优化复杂任务的多步骤执行。此次融资规模创下 AI 领域新高，显示投资者对 Anthropic 技术路线和商业化前景的强烈信心。新功能将直接面向开发者和企业用户，提升 AI 在编程和自动化场景中的实用性。

AI产品 Anthropic Opus 4.8 Dynamic Workflows 融资推理模型

推荐理由：Anthropic 的巨额融资和 Opus 4.8 发布表明其正在加速追赶 OpenAI，做 AI 应用开发或模型选型的团队值得关注 Dynamic Workflows 对复杂任务编排的改进。

原文

12:15

OpenRouter@OpenRouterAI

精选76°

StepFun 发布了 Step 3.7 Flash 模型，这是一款面向智能体、编码、搜索和多模态工作流的高效模型。该模型采用 198B 稀疏 MoE 架构，仅激活约 11B 参数，支持 256K 上下文和三种推理级别，推理速度达 400 TPS。在 ClawEval-1.1、SimpleVQA Search 和 SWE-PRO 等基准测试中表现领先，并支持视觉理解、工具调用和本地运行。模型权重以 Apache 2.0 开源，可在 Mac Studio、DGX Spark 等设备上运行。

AI模型智能体推理模型开源/仓库编程助手多模态

推荐理由：Step 3.7 Flash 解决了智能体场景中速度与可靠性的平衡问题，做智能体开发、编码自动化和多模态应用的团队可以直接用开源权重部署，值得一试。

原文

11:36

AI Will@FinanceYF5

88°

Anthropic 发布了 Claude Opus 4.8，这是 Opus 4.7 的升级版本。新模型在判断力上更加锐利，对自己的进展更加诚实，并且能够比前代更长时间地独立工作。该模型今日上线，价格保持不变。这一更新提升了 Claude 在复杂任务中的可靠性和自主性，对需要长期推理和决策支持的开发者与团队尤为重要。

AI模型 Claude Opus 4.8 推理模型自主工作判断力 Anthropic

推荐理由：Claude Opus 4.8 在判断力和自主性上的提升，直接解决了长任务执行中的可靠性痛点，做复杂推理和自动化流程的团队值得立即试用。

原文

09:57

歸藏(guizang.ai)@op7418

78°

Anthropic 发布了 Claude Opus 4.8，相比 Opus 4.7 在各项能力上均有提升。最关键的改进是模型自我审查能力显著增强，能够更有效地发现自身代码中的问题，而此前版本的自审几乎无效。新模型还拥有更敏锐的判断力、更诚实的自我评估，并能更长时间独立工作。Opus 4.8 定价与上一代相同，现已可用。

AI模型 Claude Opus 4.8 推理模型编程助手自我纠错

推荐理由：对依赖 AI 编程的开发者来说，Opus 4.8 的自我纠错能力解决了代码审查的痛点——以前让模型自己 review 代码基本没用，现在可以真正信任它帮你发现 bug，建议立即升级体验。

原文

09:18

shao__meng@shao__meng

83°

Anthropic 在宣布 H 轮 650 亿美金融资当天，发布了 Claude Opus 4.8。该模型在编码、Agent 任务和知识工作方面显著提升，SWE-Bench Pro 达到 69.2%，Terminal-Bench 2.1 为 74.6%。关键改进包括更诚实的自我监控（误判减少 4 倍）、更稳定的 Agent 协作质量，以及计算机/浏览器 Agent 能力提升（OSWorld-Verified 83.4%）。同时引入 Claude Code Dynamic Workflows，支持从单 Agent 到规划、并行、验证的协作模式。定价不变，即日可用。

AI模型 Claude Opus 4.8 推理模型 Agent/智能体编程助手浏览器自动化

推荐理由：做复杂编码、Agent 和浏览器自动化的团队可以直接升级——Opus 4.8 在诚实度和任务完成率上都有实质提升，且价格不变，值得立即试用。

原文

08:20

Alex Albert@alexalbert__

精选

Anthropic 在 Opus 4.8 模型上投入了大量工作来校准其思考努力程度，旨在让模型在推理时既不过度思考也不思考不足。团队正在邀请用户测试并反馈模型在具体任务上的思考表现，特别是过度或不足思考的案例。这反映了 Anthropic 对模型推理质量精细调优的重视，有助于提升用户体验。用户可以通过回复或直接联系团队成员来提供反馈。

AI模型 Opus 4.8 思考校准推理模型用户反馈 Anthropic

推荐理由：Anthropic 正在主动校准 Opus 4.8 的思考深度，这对追求模型推理效率与质量平衡的开发者来说是个好消息——如果你在用 Claude 做复杂推理，反馈你的使用体验可以直接影响模型优化方向。

原文

08:10

Lenny Rachitsky@lennysan

Anthropic 发布 Claude Opus 4.8，这是 Opus 4.7 的升级版本。新模型在判断力上更敏锐，能更诚实地评估自身进展，并且比前代能独立工作更长时间。价格保持不变，即日起可用。这次更新聚焦于提升模型的自主性和可靠性，对需要长时间无人干预任务的用户尤其重要。

AI模型 Claude Opus 4.8 推理模型自主工作模型更新

推荐理由：Claude Opus 4.8 提升了自主工作能力和判断诚实度，做复杂长任务或自动化流程的团队可以直接升级，价格不变更值得一试。

原文

08:09

Perplexity@perplexity_ai

Perplexity 宣布 Claude Opus 4.8 现已面向其 Max 订阅用户开放，支持在 Perplexity 和 Computer 平台上使用。这是 Anthropic 最新一代旗舰模型，在推理、编程和长文本处理方面有显著提升。用户可通过 Perplexity 的搜索增强界面直接调用，获得更精准的答案和更长的上下文支持。该更新进一步丰富了 Perplexity 的模型生态，为高级用户提供了更多选择。

AI产品 Claude Opus 4.8 Perplexity 订阅服务推理模型搜索增强

推荐理由：Perplexity 用户终于能用上最新 Claude 旗舰模型了，做深度搜索和复杂推理的 Max 订阅者可以直接体验，不用再切到其他平台。

原文

08:01

Genspark@genspark_ai

Anthropic 的 Claude Opus 4.8 模型已集成至 Genspark AI Chat Agent，用户可立即使用。该版本在 Opus 4.7 基础上提升了判断准确性和自我认知的诚实度，并支持更长时间的自主工作。定价保持不变。这标志着 Claude 系列在推理和自主性上的又一次迭代，适合需要长周期、高可靠性 AI 助手的场景。

AI产品 Claude Opus 4.8 Genspark AI Chat Agent 推理模型自主工作

推荐理由：Claude Opus 4.8 的自主工作能力提升对需要长时间运行复杂任务的开发者是直接利好，Genspark 用户今天就能体验，建议试试新模型的判断力。

原文

02:48

Jerry Liu@jerryjliu0

83°

Anthropic 发布了 Claude Opus 4.8，这是 Opus 4.7 的升级版本。新版本在判断力上更加敏锐，对自己的进展更加诚实，并且能够比前代更长时间地独立工作。该模型今天已可用，价格保持不变。这一更新提升了 Claude 在复杂任务中的自主性和可靠性，对需要长期自主推理的用户尤为重要。

AI模型 Claude Opus 4.8 推理模型自主性 Anthropic

推荐理由：Claude Opus 4.8 在判断力和自主性上的提升，让做复杂推理和长期任务的开发者能更放心地依赖它，值得立即体验。

原文

02:12

OpenRouter@OpenRouterAI

83°

OpenRouter 宣布 Opus 4.8 模型正式上线，价格与 4.7 版本相同，但在智能体编程、推理和计算机使用方面有显著提升。相比 4.7，代码缺陷遗漏率降低约 4 倍。同时推出 Opus 4.8 Fast Mode，成本仅为 2 倍，速度提升 2.5 倍。该更新对依赖 AI 编程和推理的开发者是直接利好。

AI模型 Opus 4.8 OpenRouter 推理模型编程助手智能体

推荐理由：Opus 4.8 在不涨价的前提下大幅提升了编程和推理能力，做智能体开发或代码审查的团队可以直接在 OpenRouter 上体验，性价比很高。

原文

02:01

Claude@claudeai

83°

Anthropic 发布了 Claude Opus 4.8，这是其最新旗舰模型，现已通过网页、Claude Platform 以及所有主流云平台提供。该模型在推理、代码生成和复杂任务处理上有所提升，旨在为开发者和企业用户提供更强的 AI 能力。此次更新标志着 Anthropic 在模型性能上的持续迭代，对依赖大模型的应用场景有直接影响。

AI模型 Claude Opus 4.8 Anthropic 推理模型编程助手云平台

推荐理由：Claude Opus 4.8 是 Anthropic 的最新旗舰，推理和代码能力升级明显，做复杂 AI 应用或需要高精度模型的团队值得第一时间体验。

原文

02:00

Claude@claudeai

93°

Anthropic 发布了 Claude Opus 4.8，这是 Opus 4.7 的升级版本。新模型在判断力、自我认知的诚实度以及独立工作能力上都有显著提升，能够更长时间地自主完成任务。价格保持不变，用户无需额外付费即可使用。该模型已在今天上线，引发了社区广泛讨论。

AI模型 Claude Opus 4.8 推理模型自主工作 Anthropic

推荐理由：Claude Opus 4.8 在判断力和自主性上的提升，对需要长任务执行和复杂推理的开发者是直接利好，建议立即体验。

原文