Agent场景下谁才是好用的Flash模型？Step 3.7 Flash实测

精选理由

最近这几个Flash模型我帮你试了，Step 3.7 Flash写博客页和抓GitHub项目都很稳，页面好看，一次跑通，成本也就一两块钱，值得试试。

AI 摘要

文章对比了Step 3.7 Flash、DeepSeek V4 Flash、Gemini 3.5 Flash在Agent场景下的代码生成效率、响应速度和工具调用稳定性。测试采用Claude Code工具，第一个案例从零搭建开发者日志站，Step 3.7 Flash一次生成，输出25.7k tokens，成本¥1.22，耗时2m30s；DeepSeek V4 Flash成本¥0.72，输出14k tokens。第二个案例搭建GitHub项目雷达，Step 3.7 Flash无错误完成，Gemini 3.5 Flash有2次自动修复报错。在视觉效果和稳定性上Step 3.7 Flash表现更优，但DeepSeek V4 Flash成本更低。

AI 翻译 · 中文

掘金本周最热模型圈一直都很热闹，每月都有各种新的模型出来。最近一个月，国产大模型不断推出新模型，Step 3.7 Flash、MiniMax M3、GLM-5.2、Kimi K2.7 Code几乎都是前后脚发布。我仔细研究了一下这几个新的模型，它们的路子还有点不一样，Step 3.7 Flash主攻性价比和低延迟，MiniMax M3死磕超长上下文和Agentic Workflow，GLM-5.2走通用开源路线，Kimi K2.7 Code 则…

arXiv: DeepSeek06-29 09:19原文
Pandaily06-29 08:24原文

阅读原文