全部 AI 动态 · AI 热点

6月18日

10:57

10:57

arXiv cs.AI@Ikram Belmadani, Oumaima El Khettari, Carlos Ramisch, Frederic Bechet, Richard Dufour, Benoit Favre

该研究以法语医疗问答为案例，比较了持续预训练（CPT）、监督微调（SFT）及其组合在Llama 2、Mistral、Bloom三个模型家族、7B-70B多种规模和三种初始化类型上的效果。对于多项选择问答（MCQA），CPT+SFT通常得分最高，但相对于单独SFT的提升很小且常不显著，SFT成为强且成本效益高的默认选择。对于开放问答（OEQA），CPT一致提升基于重叠的指标（如BLEU、ROUGE），而SFT常降低生成质量；指令微调和CPT+SFT在LLM评估中更受偏好。跨语言实验显示，法语适应可有效迁移到英语基准（如MedQA）。

论文 LLM 医疗领域领域适应法语问答微调

推荐理由：这篇论文用扎实的数据告诉你，在医疗领域微调模型时SFT性价比最高，CPT对开放问答有帮助但别盲目上全套，省钱又省力。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？