精选理由
LlamaIndex 出了个新工具 LiteParse v2.1,专门把 PDF 转成 Markdown,速度最快,准确率还吊打同类开源方案,免费直接用。
LlamaIndex 推出 LiteParse v2.1,号称全球最快的 PDF 转 Markdown 解析器。在 olmOCR0-bench、opendataloader-bench 和 ParseBench 三个标准化基准上,其准确率超过 pymupdf4llm、opendataloader、pdf-inspector、markitdown 等所有开源无模型解析器。该工具完全开源(Apache 2.0)且免费,支持 CLI、Rust、Node、Python 和 WASM 调用,也可作为一键 Agent Skill 安装。
AI 翻译 · 中文
LlamaIndex 推出 LiteParse v2.1,号称全球最快的 PDF 转 Markdown 解析器。在 olmOCR0-bench、opendataloader-bench 和 ParseBench 三个标准化基准上,其准确率超过 pymupdf4llm、opendataloader、pdf-inspector、markitdown 等所有开源无模型解析器。该工具完全开源(Apache 2.0)且免费,支持 CLI、Rust、Node、Python 和 WASM 调用,也可作为一键 Agent Skill 安装。
We built the fastest PDF -> markdown parser in the world 🚀⚡️ AND it’s more accurate than any other open-source, model-free parser (pymupdf4llm, opendataloader, pdf-inspector, markitdown) on 3 standardized benchmarks:…
- IT之家06-17 13:52原文