AI模型精选

Mistral OCR 4 为RAG、智能体和企业搜索管道提供可引用结构化输出

Mistral OCR 4 Brings Citation-Ready Structured Output to RAG, Agentic, and Enterprise Search Pipelines

精选理由

Mistral 出了 OCR 4,能提取带边界框和置信度的结构化内容,方便直接用于 RAG 和搜索,支持170种语言还自托管,很实用。

AI 摘要

Mistral AI 于2026年6月23日发布 OCR 4,从纯文本提取升级为结构化文档输出。每个文本块返回边界框、类型分类以及每页和每词的置信度分数。该模型支持170种语言,可在单个自托管容器中运行,通过单一API端点向RAG、智能体和企业搜索管道提供可引用的输入。

图片来源 · marktechpost
AI 翻译 · 中文

Mistral AI 于2026年6月23日发布 OCR 4,从纯文本提取升级为结构化文档输出。每个文本块返回边界框、类型分类以及每页和每词的置信度分数。该模型支持170种语言,可在单个自托管容器中运行,通过单一API端点向RAG、智能体和企业搜索管道提供可引用的输入。

marktechpostMistral AI released OCR 4 on June 23, 2026, moving from clean text extraction to structured document output. Each block returns a bounding box, a typed classification, and per-page and per-word confidence scores. The mod