全部 AI 动态 · AI 热点

6月28日

16:03

16:03

Decoder@Jonathan Kemper

精选

新浪微博发布开源模型VibeThinker-3B，仅30亿参数。在数学和编程基准上，它匹配了DeepSeek V3.2和Kimi K2.5，后两者参数规模大333倍。模型通过多阶段后训练实现高性能。研究人员假设：逻辑推理可压缩进小模型，但广泛世界知识不行。

AI模型 VibeThinker-3B 新浪推理模型开源模型

推荐理由：30亿参数的小模型推理能力居然能打千亿级大模型，新浪VibeThinker-3B在数学和编程上很强，而且开源了。

6月20日

06:15

06:15

marktechpost@Asif Razzaq

VibeThinker-3B是一个3B参数的MIT许可证推理模型，基于Qwen2.5-Coder-3B构建。该模型采用Spectrum-to-Signal后训练流水线。在可验证基准上，它匹配了DeepSeek V3.2和Kimi K2.5的性能。

AI模型 VibeThinker-3B Qwen2.5-Coder-3B DeepSeek V3.2 Kimi K2.5 推理模型

推荐理由：3B参数就能比肩DeepSeek V3.2和Kimi K2.5，基于Qwen2.5-Coder-3B开源，适合资源受限场景的推理任务。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

19:02

19:02

kimmonismus@kimmonismus

VibeThinker-3B是仅3B参数的小模型，在AIME26上取得94.3分，在LiveCodeBench v6上Pass@1达80.2，在未见过的LeetCode比赛中正确率96.1%。其训练基于Qwen2.5-Coder，结合课程SFT、多领域RL、离线自蒸馏和最终RL指导阶段。结果表明，部分可验证推理能力可被高效压缩到小密集模型中。

AI模型 VibeThinker-3B Qwen2.5-Coder 推理模型小模型代码生成

推荐理由：3B的小模型在数学和代码推理上快追上大模型了，适合部署在低算力场景，值得关注。

10:46

10:46

arXiv: DeepSeek@Sen Xu, Shixi Liu, Wei Wang, Jixin Min, Yingwei Dai, Zhibin Yin, Yirong Chen, Xin Zhou, Junlin Zhang

VibeThinker-3B是一个3B参数的小型稠密模型，基于Spectrum-to-Signal后训练范式，通过课程监督微调、多域强化学习和离线自蒸馏提升。在AIME26上达到94.3分（测试时扩展至97.1），LiveCodeBench v6上Pass@1为80.2，最新LeetCode竞赛接受率96.1%。其性能与DeepSeek V3.2、GLM-5和Gemini 3 Pro等旗舰大模型相当或超越。IFEval得分为93.4，表明强推理未损害指令遵循能力。该工作提出了参数压缩-覆盖假说：可验证推理可压缩为紧凑推理核心，而开放域知识需宽参数覆盖。

AI模型 VibeThinker-3B 推理模型可验证推理小语言模型基准成绩

推荐理由：想看看3B小模型怎么打平千亿级大模型？VibeThinker-3B用AIME 94.3分、LiveCodeBench 80.2%的成绩告诉你，小模型也能杀进顶级推理梯队。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？