DeepSeek Pro Max 模式在编码基准上超越 GPT-5.4、Gemini 3.1 Pro 等

Pro Max 模式下,在 LiveCodeBench (93.5%)、Codeforces Rating (3206)、SWE Verified (80.6%) 等编码/工程基准上达到或超越了 GP...

精选理由

DeepSeek 拿 Pro Max 模式在 LiveCodeBench 等三大编码基准上直接碾压 GPT-5.4 和 Claude Opus 4.6,分数拉满,但还没开放下载,先来围观一下。

AI 摘要

DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩:LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%,超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文,并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署,引发社区期待。

AI 翻译 · 中文

DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩:LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%,超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文,并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署,引发社区期待。

GeekPro Max 模式下,在 LiveCodeBench (93.5%)、Codeforces Rating (3206)、SWE Verified (80.6%) 等编码/工程基准上达到或超越了 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等前沿闭源模型。 什么时候我才能本地部署啊,现在存为王,更是遥遥无期了。 nash_su - e/acc @nash_su 漂亮,把价格继续打下来😎😎� hugg