21:43Decoder@Jonathan Kemper精选72°字节跳动Seed团队研究发现,通过提问方式训练7B参数的多模态大模型(LMM),在处理长文档(尤其是图像密集型文档)时,其可靠性甚至超过更大规模的模型。该模型能处理比训练时见过的文档长四倍的内容,且无需逐页转录文本,而是通过自主寻找相关段落来回答问题。这一方法显著提升了长文档问答的效率与准确性,为多模态模型在复杂文档理解任务中的应用提供了新思路。论文字节跳动多模态模型长文档理解训练方法问答推荐理由:做文档理解或长文本AI应用的团队值得关注——字节跳动用提问替代转录,让7B模型在长文档任务上超越大模型,直接降低了计算成本,建议点开看看具体方法。原文
15:58arXiv cs.AI@Zijun Jia, Yuanchang Ye, Sen Jia, Yiyao Qian, Haoning Wang, Baojie Chen, Diyin Tang, Jinsong Yu, Zhiyuan Wang精选BalanceRAG 提出了一种针对级联检索增强生成(RAG)系统的联合风险校准方法。传统级联RAG会先尝试仅用大模型回答,不确定时再启用RAG,但各阶段独立校准可能过于保守。BalanceRAG 将阈值对视为二维网格上的操作点,通过序贯图形测试识别安全操作点,实现系统级错误率控制。该方法支持多风险校准,能在保证风险水平的同时保留更多样本,减少不必要的检索调用。在多个开放域问答基准测试中,BalanceRAG 在满足预设风险水平的前提下,提高了覆盖率和正确样本接受数。论文RAG风险校准级联系统问答大模型推荐理由:做RAG系统优化的团队终于有了一个能精确控制风险与检索成本的校准工具——BalanceRAG 用联合阈值替代逐级保守校准,在保证准确率的同时减少不必要的检索调用,建议做问答系统的开发者点开看看。原文