全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

11:12

11:12

arXiv cs.AI@Hui Geng, Yi Su, Han Yin, Tianjiao Wan, Qisheng Xu, Jiaxin Chen, Zijian Gao, Hengzhu Liu, Xie Chen, Kele Xu

AudioDER是一个约19.1万样本的推理导向后训练数据集，覆盖声音、语音和音乐，每个样本包括音频、多选题、四个候选答案、音频描述和思维链推理。基于声学相似性去重提高多样性，并利用Qwen3-30B生成CoT推理解释。在MMAU-mini、MMSU、MMAR等基准上，使用Qwen2-Audio-7B-Instruct后训练持续提升性能。该数据集开源，旨在推动音频推理研究。

AI模型 AudioDER Qwen3-30B Qwen2-Audio-7B-Instruct 音频推理多模态

推荐理由：去重+CoT，提升音频模型推理能力

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？