13:48Ethan Mollick@emollick一项实验测试了AI在端到端编码任务中的能力。Opus 4.7在14小时内构建了一个软件包,相当于人类工程师2-17周的工作量,总花费251美元。虽然模型仍不完美,但进步速度显著。AI模型Opus 4.7编程助手编码能力AI基准测试推荐理由:Opus 4.7只用14小时和251块就干完了人类几周的活,虽然还有瑕疵,但进步真的快。原文
12:40orange.ai@oran_geGLM-5.2 由 Z.ai 发布,在编码和智能体任务上取得显著进步,首次让开源模型在 Coding 能力上达到 Opus 水平。模型支持 1M 上下文窗口,提供两种推理努力级别(max 和 high),权重采用 MIT 开源许可,API 定价与 GLM-5.1 相同。AI模型GLM-5.2Z.ai开源模型编码能力推理模型推荐理由:Z.ai 开源了 GLM-5.2,编码水平追上 Opus,还给了 1M 上下文和两种推理模式,MIT 许可随便用。原文
01:28SiliconFlowAI@siliconflowai83°MiniMax 最新开源模型 M3 已在 SiliconFlow 平台上线,首周提供 50% 折扣。M3 是首个同时具备编码与智能体能力、1M 上下文窗口和原生多模态的开源模型。在 SWE-Bench Pro 基准测试中,M3 的编码能力超越了 GPT-5.5 和 Gemini 3.1 Pro。其 1M 上下文窗口通过 MiniMax 稀疏注意力技术实现,原生多模态支持图像、视频和计算机使用。定价方面,缓存/输入/输出分别为每百万 token 0.06/0.30/1.20 美元,折扣后性价比突出。AI模型MiniMaxM3开源模型编码能力多模态推荐理由:M3 把编码、长上下文和多模态三合一开源了,做 AI 应用开发的团队可以直接在 SiliconFlow 上低成本试用,编码能力还超过了 GPT-5.5,值得上手体验。原文
10:35Harrison Chase@hwchase17精选76°MiniMax 正式发布 M3 模型,这是首个同时具备编码、智能体能力和原生多模态的开放权重模型。在 SWE-Bench Pro 上达到 59.0%,Terminal Bench 2.1 为 66.0%,并支持 1M 上下文窗口。模型权重和技术报告将在约 10 天后公开。开发者可通过 API 和专属代码平台 code.minimax.io 使用。AI模型MiniMaxM3开源模型编码能力智能体推荐理由:MiniMax M3 把编码、智能体和多模态三合一开源,做 AI 应用和 Agent 开发的团队可以直接拿来用,尤其适合需要长上下文和复杂任务自动化的场景。原文
15:02xiaomimimo@XiaomiMiMo73°小米MiMo-V2.5-Pro在最新Arena排行榜(2026年4月26日)中取得多项突破:在Text Arena专家级排名全球第6、开源模型第1,并在中国模型中排名第1,小米实验室整体排名全球第3,仅次于Anthropic和OpenAI。该模型在Text Arena综合排名中位列开源第2,在Code Arena网页开发排名中位列开源第3。此外,在Hard Prompts、指令遵循、长查询等4个子榜单中均获开源第1。这些成绩基于真实社区盲评,反映了模型的实际能力。AI模型小米MiMo-V2.5-Pro开源模型排行榜编码能力10 个信源在谈推荐理由:小米MiMo-V2.5-Pro在多个高难度榜单中超越众多闭源模型,做模型选型或关注开源生态的开发者值得关注——它证明了开源模型在核心智能和实际编码任务上已能媲美顶级闭源方案。原文