AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 786 条中筛出 39 条
全部模型产品行业论文技巧
标签:文档处理×
7月1日
02:57
02:57LlamaIndex@llama_index
精选
LlamaIndex发布LlamaParse MCP更新,支持从合同、发票和报告中自动提取结构化数据。代理可直接搜索、阅读并检索PDF、Office文档和图片等知识库内容。工具按分类、提取和搜索等任务重新组织,可并行执行。这提升了大规模文档处理的可靠性和效率。
AI产品LlamaParseMCPLlamaIndex智能体文档处理

推荐理由:LlamaIndex更新了LlamaParse MCP,现在代理能自动从合同发票抽数据,还能直接搜公司文档,处理大批文件快多了。
原文
6月23日
23:10
23:10Mistral AI@MistralAI
精选73°
Mistral AI 今日推出 OCR API 和 Document AI,可在 Mistral AI Studio、Amazon SageMaker、Microsoft Foundry 上直接使用,并即将集成 Snowflake Parse Document。用户也可通过单个容器自托管,确保文档不离开本地环境。该功能旨在提升文档解析和 OCR 处理能力。
AI产品Mistral AIOCR APIDocument AI文档处理自托管

推荐理由:Mistral AI 刚发了 OCR 和文档 AI,支持多平台部署还能自己托管,处理文档很方便。
原文
6月16日
20:25
20:25shao__meng@shao__meng
精选72°
LandingAI 将 Agentic Document Extraction 升级为两个 Agent Skills:document-extraction 提供 Markdown 结构化、JSON Schema 字段抽取、按文档类型拆分、按页分类等原子操作,document-workflows 则支持并行批处理、混合文档流水线、RAG 准备及 Snowflake 导出等功能。这些技能可被 Claude Code、Codex、Cursor 等编程智能体在对话中直接调用,无需手写脚本。其中大文件处理能力达约 1GB / 6000 页,并支持元素级坐标与置信度。
AI产品LandingAIAgent Skills文档处理Claude Code编程智能体

推荐理由:LandingAI 搞了两个 Agent Skills,装上后让 Claude Code 这类编程智能体直接对话里就能搭文档处理流水线,省掉你手写 API 脚本的功夫。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:14
08:14Jerry Liu@jerryjliu0
精选
LlamaIndex 发布了 LiteParse v2,号称是世界上最快的 PDF 解析器,同时保持高精度。团队用 Rust 重写了整个库,并适配为 Python 和 Node 原生包。在 LLM QA 任务基准测试中,LiteParse 与 pdftotext 并列准确率第一,但速度更快;PyMuPDF 延迟接近,但在处理多栏、表格等复杂布局时表现不佳。LiteParse 还支持 50 多种文档格式(包括 .docx、.pptx、.xlsx),并提供 OCR 和截图工具,可直接在 AI Agent 中使用。
AI产品PDF解析Rust开源/仓库LlamaIndex文档处理

推荐理由:做 RAG 或文档处理的团队终于有了一个又快又准的开源选择——LiteParse 在速度和准确率上双杀现有方案,建议做 PDF 解析的开发者直接试。
原文
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
5月19日
10:22
10:22arXiv: DeepSeek@Diego Gosmar, Giovanni Zenezini
精选
MADP 是一个面向企业文档处理的多智能体架构,包含分类、拆分、解析、提取和验证五个专用智能体,并引入人工在环(HITL)机制和提示微调反馈继承(PFTFI)方法。在10万张发票/年的生产场景中,MADP 可减少约70%的全职人力需求;实际部署955份文档后,全管线自动化率达97%,仅3%需非AI回退。在100份文档的消融测试中,完整配置下文档级准确率达98.5%。相比传统人工处理,MADP 还减少69%的二氧化碳排放、69%的能耗和63%的水耗,并对比了 Granite-Docling、Mistral-Small、DeepSeek-OCR 等多个 LLM 后端。
论文多智能体文档处理人工在环企业自动化可持续AI

推荐理由:企业文档处理团队终于有了可落地的多智能体方案——MADP 用 HITL 机制平衡自动化与准确率,做发票、合同等批量文档处理的团队可以直接参考其部署结果和碳排放数据。
原文
5月17日
14:04
14:04Jerry Liu@jerryjliu0
精选
LlamaIndex CEO Jerry Liu指出,金融领域的AI智能体可分为两类:一是重复性操作工作(如发票处理、贷款发起、KYC),二是开放式研究与报告生成(如尽职调查、股票研究)。他在纽约的研讨会上强调,构建高质量文档上下文层需要严格的OCR层、评估检查和良好的人机交互审核UI/UX,因为数字的微小错误可能导致灾难性后果。他分享了演讲幻灯片和Logan的仓库,后者展示了构建带完整人机交互审核的金融文档解析流水线。LlamaIndex的核心使命是为金融等领域的AI智能体提取最高质量的文档上下文。
AI产品金融AI文档处理OCR人机交互审核LlamaIndex

推荐理由:金融从业者做AI智能体时,文档上下文质量直接决定成败——LlamaIndex的实践方案(OCR+评估+人机审核)值得参考,尤其是处理发票、KYC等场景的团队建议点开。
原文
精选全部日报登录