MiniMax M3 开源模型加入 Agent Arena 评测

精选理由

看看 MiniMax M3 在 Agent 任务中能排第几

AI 摘要

MiniMax M3 是一款开放权重的模型，现已加入 Agent Arena 平台。Agent Arena 通过真实用户会话评估模型在网页搜索、文件系统和终端工具上的表现，涵盖编写代码、创建幻灯片、研究网页、构建应用和分析文档等任务。排行榜基于 30 万+ 任务、200 万+ 工具调用和 4000 万行代码构建，当前排名第一的是 OpenAI 的 GPT-5.5 (High)，第二是 Anthropic 的 Claude-Opus-4.7 (Thinking)。MiniMax M3 的评分即将公布。

AI 翻译 · 中文

lmarena.aiOpen-weight model, MiniMax M3 by @MiniMax_AI is available in the Agent Arena. In Agent Arena, models get web search, filesystem, and terminal tools to complete complex workflows: writing code, creating slide deck, resear…

宝玉06-13 19:12原文
Decoder06-13 10:16原文
shao__meng06-11 01:01原文
IT之家06-11 03:15原文
AI Will06-11 07:28原文
SiliconFlowAI06-11 16:26原文
Artificial Analysis06-12 04:49原文
vLLM06-12 14:47原文
LMSYS Org (SGLang)06-12 14:18原文
Together AI06-13 02:53原文

查看原推