论文精选

MADP:多智能体文档处理管线,结合人工审核实现97%自动化率

MADP: A Multi-Agent Pipeline for Sustainable Document Processing with Human-in-the-Loop

精选理由

企业文档处理团队终于有了可落地的多智能体方案——MADP 用 HITL 机制平衡自动化与准确率,做发票、合同等批量文档处理的团队可以直接参考其部署结果和碳排放数据。

AI 摘要

MADP 是一个面向企业文档处理的多智能体架构,包含分类、拆分、解析、提取和验证五个专用智能体,并引入人工在环(HITL)机制和提示微调反馈继承(PFTFI)方法。在10万张发票/年的生产场景中,MADP 可减少约70%的全职人力需求;实际部署955份文档后,全管线自动化率达97%,仅3%需非AI回退。在100份文档的消融测试中,完整配置下文档级准确率达98.5%。相比传统人工处理,MADP 还减少69%的二氧化碳排放、69%的能耗和63%的水耗,并对比了 Granite-Docling、Mistral-Small、DeepSeek-OCR 等多个 LLM 后端。

AI 翻译 · 中文

MADP 是一个面向企业文档处理的多智能体架构,包含分类、拆分、解析、提取和验证五个专用智能体,并引入人工在环(HITL)机制和提示微调反馈继承(PFTFI)方法。在10万张发票/年的生产场景中,MADP 可减少约70%的全职人力需求;实际部署955份文档后,全管线自动化率达97%,仅3%需非AI回退。在100份文档的消融测试中,完整配置下文档级准确率达98.5%。相比传统人工处理,MADP 还减少69%的二氧化碳排放、69%的能耗和63%的水耗,并对比了 Granite-Docling、Mistral-Small、DeepSeek-OCR 等多个 LLM 后端。

arXiv: DeepSeekDocument processing automation remains a critical challenge in enterprise environments, where traditional manual approaches are labor-intensive and error-prone. We present MADP, a multi-agent architecture that addresses