DeepSeek V4 Flash 是 DeepSeek 于2026年推出的轻量级高速推理模型,主打极致性价比。近期,该模型因成本优势在业界引发广泛关注。
- 主要进展
- 成本与性能优势显著:DeepSeek-V4-Flash 的推理成本极低,百万 token 仅需 10 美元,被评价为“性价比惊人”,同时保持高推理速度——最快达到 1100 tokens/s,接近 GPT-4o mini 的水平。(DeepSeek-v4-flash 被赞性价比惊人)
- API调用量持续领先:根据第六周周报,中国AI模型API调用量连续六周超过美国,其中前四名均为国产模型,DeepSeek V4 Flash 位列其中,反映出国内模型在应用层面的强劲表现。(中国AI大模型周调用量连续六周超美国)
- 价格大幅下调:腾讯云自6月3日起对 DeepSeek-V4 系列模型实施大幅降价,最高降幅达97.5%,进一步降低了中小企业部署门槛,推动模型普及。(腾讯云DeepSeek-V4系列模型大幅降价)
当前焦点:虽然 DeepSeek V4 Flash 以速度和成本取胜,但其在复杂推理任务中的表现与更大参数模型存在差距。研究同时指出,在某些场景下过度推理反而可能损害输出质量,如何在效率与能力间取得平衡值得用户关注。此外,模型调用量的领先是否可持续,以及后续版本是否会强化复杂任务能力,也是业界讨论的热点。