AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:PaddleOCR×
6月26日
21:48
21:48berryxia@berryxia
精选77°
PaddleOCR 发布 PP-OCRv6 系列,提供 Tiny、Small、Medium 三种尺寸,分别适配移动端、CPU 文档系统和高并发 API。在 A100 GPU 上单张推理仅需 0.13 秒,Intel CPU 上相比 v5 提速 3.9 至 5.2 倍,Apple M4 配合 ONNX Runtime 可达到 0.35 秒。官方强调轻量架构与高质量训练数据比单纯扩大参数规模更实用。
AI模型PaddleOCRPP-OCRv6部署优化轻量模型OCR

推荐理由:PaddleOCR 把 v6 的部署数据拉得很细,A100 0.13 秒、M4 0.35 秒,还有三种尺寸选,想在生产环境搭 OCR 的直接抄作业。
原文
6月25日
10:09
10:09berryxia@berryxia
PP-OCRv6已正式上架Hugging Face平台。本次更新新增transformers和ONNX Runtime两个推理后端,用户可以通过统一API在不同框架间无缝切换。相比PP-OCRv5,PP-OCRv6在字符识别精度上有进一步提升。该版本尤其适合希望在transformers生态中直接使用高性能OCR的开发者。
AI模型PaddleOCRPP-OCRv6Hugging FacetransformersOCR

推荐理由:PaddleOCR的PP-OCRv6上HF了,支持transformers和ONNX Runtime双后端,切换框架不用改代码,超实用。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月1日
22:47
22:47Dify@dify_ai
PaddleOCR 和 ERNIE-Image 作为官方插件正式登陆 Dify Marketplace。用户现在可以在 Dify 工作流中直接调用文档解析(支持图片、PDF、多语言文档)和图像生成功能,无需额外部署。PaddleOCR 基于 PP-OCRv5 等模型,输出结构化数据用于 RAG 等下游任务;ERNIE-Image 提供免费图像生成,支持 Turbo 模式和 OpenAI 风格 API。这降低了构建文档智能和 AIGC 类 AI Agent 的门槛。
AI产品DifyPaddleOCRERNIE-Image文档解析图像生成

推荐理由:做 RAG 应用或需要文档解析的团队,现在可以直接在 Dify 工作流里用 PaddleOCR 把扫描件变成结构化数据,再配合 ERNIE-Image 生成配图,一条 workflow 搞定。建议试试这个插件组合。
原文
5月20日
21:51
21:51berryxia@berryxia
精选
PaddleOCR 3.5 正式发布,支持 Transformers 作为推理后端,PP-OCRv5 和 PaddleOCR-VL 1.5 模型可直接在 Hugging Face 生态中运行。此前将 PaddleOCR 集成到 RAG 或 Document AI 项目需要额外搭建服务栈,现在流程大幅简化。Hugging Face 团队参与了合作,使得 OCR 工具与主流 Transformer 生态无缝对接。输出结果更精准可靠,无需依赖 LLM 来补充。
AI产品PaddleOCRHugging FaceOCRTransformers文档智能

推荐理由:做文档智能或 RAG 的团队终于不用在 OCR 和 Transformer 之间搭桥了,PaddleOCR 3.5 直接跑在 Hugging Face 上,省掉一堆服务栈,建议做 Document AI 的开发者点开试试。
原文
5月19日
00:30
00:30Hugging Face: Blog(博客/媒体)
精选
PaddleOCR 3.5 版本正式发布,新增对 Transformers 后端的支持,允许用户使用 Hugging Face 生态中的预训练模型进行 OCR 和文档解析任务。这一更新打破了原有框架对 PaddlePaddle 模型的依赖,提升了模型选择的灵活性和生态兼容性。新版本还优化了文档解析性能,支持更多语言和复杂版面分析。对于需要集成 OCR 能力的开发者来说,这是一个重要的升级,可以直接利用社区丰富的 Transformers 模型资源。
AI产品OCR文档解析PaddleOCRTransformers开源/仓库

推荐理由:PaddleOCR 拥抱 Transformers 生态,做文档解析和 OCR 的团队可以更灵活地选模型,不用被框架绑死,值得升级试试。
原文
精选全部日报登录