LlamaIndex 在 CVPR 2026 发布 ParseBench:首个面向 AI 智能体的文档解析基准

We're presenting ParseBench at CVPR 2026 today. 🦙 Come learn why document understanding is an AGI-...

精选理由

做文档解析或构建 AI 智能体的团队终于有了一个标准化的评测工具——ParseBench 覆盖了企业级表格、图表等真实难点,建议直接拿来评估你的解析管线。

AI 摘要

LlamaIndex 在 CVPR 2026 上发布了 ParseBench,这是首个专为 AI 智能体设计的文档解析基准测试。该基准包含 2000 多页人工验证的页面、167K+ 测试规则,覆盖表格、图表、忠实度、格式和接地性五个维度。团队认为文档理解是 AGI 完备问题,因为智能体无法正确读取文档就无法有效行动,而真实企业表格的解析难度远超表面所见。ParseBench 完全开源,旨在推动文档解析能力的发展。

AI 翻译 · 中文

LlamaIndex 在 CVPR 2026 上发布了 ParseBench,这是首个专为 AI 智能体设计的文档解析基准测试。该基准包含 2000 多页人工验证的页面、167K+ 测试规则,覆盖表格、图表、忠实度、格式和接地性五个维度。团队认为文档理解是 AGI 完备问题,因为智能体无法正确读取文档就无法有效行动,而真实企业表格的解析难度远超表面所见。ParseBench 完全开源,旨在推动文档解析能力的发展。

LlamaIndexWe're presenting ParseBench at CVPR 2026 today. 🦙 Come learn why document understanding is an AGI-complete problem (an agent can't act on a doc it can't correctly read, and reading a real enterprise table is