AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:多任务微调×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月27日
12:14
12:14arXiv: DeepSeek@Mingyue Wang, Xingyu Xie, Hang Yang, Li Gao, Lixin Su, Ge Chen, Dawei Yin, Daiting Shi
精选
百度搜索团队提出QDET(查询驱动事件时间线摘要)系统,用于在搜索中为热点新闻查询构建聚焦的事件时间线。该系统通过多任务监督微调(时序排序、因果判断、时间线补全)和基于强化学习的简洁摘要生成,使7B参数模型在时间线摘要F1得分(76.2%)上超越DeepSeek-R1-671B(76.1%),参数量仅为后者的1%。在线A/B测试显示,QDET使点击率提升5.5%、停留时间延长4.6%、探索深度增加4.4%。该工作证明领域专用优化能以极低成本达到大模型级别的生产质量。
论文事件时间线摘要搜索多任务微调强化学习百度

推荐理由:搜索和新闻聚合团队终于有了可落地的轻量级时间线方案——7B模型干翻671B,CTR和用户停留时间双双提升,做搜索排序或事件摘要的工程师可以直接参考其多任务微调策略。
原文
精选全部日报登录