百度开源Unlimited OCR:3B参数500M激活,小模型效果出色

大聪明(赛博禅心)一直跟我说,做自媒体要研究新智元。 喷归喷,但人家起标题真的是一绝。 百度在一直OCR方面的技术很强,昨天开源 Unlimited OCR更强,3B参数500M激活,这么小的模型...

精选理由

百度刚开源的Unlimited OCR,3B参数只激活500M,效果居然这么强,做OCR的赶紧看看。

AI 摘要

百度近日开源了Unlimited OCR模型,参数量3B但仅需500M激活参数。该模型参考了滑动注意力窗口技术,在OCR任务上取得了出乎意料的好效果。轻量级设计使其更易于部署。

AI 翻译 · 中文

百度近日开源了Unlimited OCR模型,参数量3B但仅需500M激活参数。该模型参考了滑动注意力窗口技术,在OCR任务上取得了出乎意料的好效果。轻量级设计使其更易于部署。

向阳乔木大聪明(赛博禅心)一直跟我说,做自媒体要研究新智元。 喷归喷,但人家起标题真的是一绝。 百度在一直OCR方面的技术很强,昨天开源 Unlimited OCR更强,3B参数500M激活,这么小的模型竟然有这么好的效果,出乎意料。 先不管作者是不是从DeepSeek出走的,文章提到的参考滑动注意力窗口技术值得关注。 技术解读见第二条,后面有项目开源地址。 💬 26 🔄 4 ❤️ 41 👀 15047 📊 34 ⚡ Powered b