13:55arXiv cs.AI@Xinxin Li, Huiyao Chen, Meishan Zhang, Yunxin Li, Zulong Chen, Zhibo Ren, Xiaoqing Dong Baotian Hu, Min Zhang传统ASR纠错仅关注孤立语句或短上下文,但在长文本与语音交错的对话中,需要对话级上下文证据。现有方法依赖当前假设或拼接原始对话历史,难以在冗余噪声中定位稀疏纠错证据。本文提出本体记忆增强的ASR纠错框架,将交互历史组织为动态更新的本体记忆,存储实体、术语、表面变体、潜在ASR混淆及语义关系作为可检索节点。基于MAGIC-RAMC构建的RAMC-Corr数据集实验显示,该方法在10个配对骨干设置组合中9个优于直接纠错,促进更选择性、基于证据的上下文相关ASR错误纠正。论文ASR纠错本体记忆长对话上下文增强语音识别推荐理由:做语音识别或对话系统的团队,这个框架解决了长对话中ASR纠错缺乏上下文的问题,直接提升纠错准确率,值得在长交互场景中尝试。原文
12:09arXiv cs.LG@Yeongseo Jung, Jaehyeok Kim, Eunseo Jung, Jiachuan Wang, Yongqi Zhang, Ka Chun Cheung, Simon See, Lei Chen精选现有对话模型在长对话中因历史累积导致计算冗余和注意力分散,简单截断或摘要会损失信息。研究者提出 C-DIC(Context-Driven Incremental Compression),将对话拆分为可修订的上下文线程,存储紧凑的对话记忆,并通过轻量级检索-修订-回写机制跨轮共享信息、更新过时记忆。该方法还适配了截断反向传播(TBPTT)来学习跨轮依赖,无需完整历史反向传播。实验表明,C-DIC 在数百轮对话中保持稳定的推理延迟和困惑度,为高质量长对话建模提供了可扩展路径。论文对话系统上下文压缩长对话增量学习C-DIC推荐理由:长对话场景(如客服、角色扮演)的开发者终于有了一个兼顾效率与保真度的压缩方案——C-DIC 能稳定处理数百轮对话,值得在长上下文任务中试试。原文