论文精选

百度搜索用7B模型实现671B级事件时间线摘要,CTR提升5.5%

Large Language Model-Powered Query-Driven Event Timeline Summarization in Industrial Search

精选理由

搜索和新闻聚合团队终于有了可落地的轻量级时间线方案——7B模型干翻671B,CTR和用户停留时间双双提升,做搜索排序或事件摘要的工程师可以直接参考其多任务微调策略。

AI 摘要

百度搜索团队提出QDET(查询驱动事件时间线摘要)系统,用于在搜索中为热点新闻查询构建聚焦的事件时间线。该系统通过多任务监督微调(时序排序、因果判断、时间线补全)和基于强化学习的简洁摘要生成,使7B参数模型在时间线摘要F1得分(76.2%)上超越DeepSeek-R1-671B(76.1%),参数量仅为后者的1%。在线A/B测试显示,QDET使点击率提升5.5%、停留时间延长4.6%、探索深度增加4.4%。该工作证明领域专用优化能以极低成本达到大模型级别的生产质量。

AI 翻译 · 中文

百度搜索团队提出QDET(查询驱动事件时间线摘要)系统,用于在搜索中为热点新闻查询构建聚焦的事件时间线。该系统通过多任务监督微调(时序排序、因果判断、时间线补全)和基于强化学习的简洁摘要生成,使7B参数模型在时间线摘要F1得分(76.2%)上超越DeepSeek-R1-671B(76.1%),参数量仅为后者的1%。在线A/B测试显示,QDET使点击率提升5.5%、停留时间延长4.6%、探索深度增加4.4%。该工作证明领域专用优化能以极低成本达到大模型级别的生产质量。

arXiv: DeepSeekUnderstanding how events evolve over time is essential for search engines handling queries about trending news. We present QDET (Query-Driven Event Timeline Summarization), a production system deployed on Baidu Search th