12:39小互@imxiaohu精选百度开源的Unlimited OCR模型采用参考滑动窗口注意力(R-SWA)技术,能在32K上下文内一次前向推理处理数十页文档,无需分页。模型仅3B参数、500M激活,显存和算力不随页数增长。传统逐页OCR需要拼接结果,而R-SWA模拟人类连续抄写,始终记忆固定大小的文本。该模型据称基于DeepSeek OCR核心贡献者开发,已在标准长度文档上测试。AI模型Unlimited OCR百度R-SWAOCR开源模型8 个信源在谈推荐理由:百度开源了一款OCR模型,3B参数就能一次处理几十页PDF,不用切页,比传统逐页OCR强太多。原文
03:28AK@_akhaliq百度发布了名为Unlimited-OCR的OCR服务。该产品提供无限次数的OCR识别功能。用户可通过调用API或直接使用。目前暂无定价信息。AI产品百度Unlimited-OCROCR文字识别8 个信源在谈推荐理由:百度出了个Unlimited-OCR,无限次OCR识别,做文字提取的可以试试。原文
14:46向阳乔木@vista876°百度发布Unlimited OCR,模拟人类抄书注意力模式,每生成一个token时参考完整图像和提示词,但输出侧仅回看前128个token。KV缓存固定为128长度,避免长文档推理时内存爆炸。在超长文档OCR任务上效果显著,已在GitHub和Hugging Face开源。AI模型UnlimitedOCR百度OCR推理模型开源模型6 个信源在谈推荐理由:百度开源了一个超聪明的OCR方案,用固定128 token缓存模拟人眼抄书,长文档不爆内存,快去试试!原文
14:45向阳乔木@vista8百度近日开源了Unlimited OCR模型,参数量3B但仅需500M激活参数。该模型参考了滑动注意力窗口技术,在OCR任务上取得了出乎意料的好效果。轻量级设计使其更易于部署。AI模型百度Unlimited OCROCR开源模型滑动注意力6 个信源在谈推荐理由:百度刚开源的Unlimited OCR,3B参数只激活500M,效果居然这么强,做OCR的赶紧看看。原文
13:55Geek@geekbb精选百度开源了一个基于DeepSeek-OCR升级的视觉语言模型OCR项目,支持一次性解析超长文档。该模型提供两种推理模式:gundam模式用于处理单张图片中的密集文字,base模式适用于多页文档或PDF。项目代码已在GitHub上发布,允许开发者直接使用。AI模型百度DeepSeek-OCR视觉语言模型OCR开源模型推荐理由:百度开源的OCR模型,在DeepSeek-OCR上做了升级,能一次性处理超长文档和密集文字,两种模式很实用。原文
10:33berryxia@berryxia百度开源的 Unlimited OCR 模型采用 R-SWA 注意力机制,支持 32K 上下文窗口,一次前向推理即可完成几十页文档的转录。其核心卖点是 One-Shot Long-Horizon Parsing,无需分页处理,KV Cache 大小恒定。技术报告提到该模型融合了来自 DeepSeek-OCR 的高压缩编码器,且部分核心贡献者与 DeepSeek 有渊源。AI模型Unlimited OCR百度R-SWAOCR开源模型6 个信源在谈推荐理由:百度搞了个挺牛的 OCR 模型,能一口气读几十页,不像以前那样一页一页循环。开源了,谁都能试试。原文
08:05berryxia@berryxia百度开源了Unlimited OCR模型,采用R-SWA(参考滑动窗口注意力)机制,一次前向推理即可处理32K上下文的文档,数十页PDF无需分块。与传统逐页处理的OCR不同,其KV Cache大小恒定,不随长度增长。模型灵感源于人类抄书行为,仅维护近128个状态。技术报告核心贡献者中,技术总监YY疑为DeepSeek前员工。AI模型Unlimited OCR百度DeepSeekR-SWA文档理解6 个信源在谈推荐理由:百度开源的Unlimited OCR能一口气读完几十页PDF,不用切块,快又准。技术总监YY可能是DeepSeek出走的,有意思。原文
00:47berryxia@berryxia精选72°百度在Hugging Face上开源了Unlimited-OCR模型,其核心创新是R-SWA(Reference Sliding Window Attention),让KV Cache保持恒定,避免随页数爆炸。该模型可一次性解析单张图或多页PDF,在OmniDocBench上获得93分,比DeepSeek-OCR高出6个百分点。它取代了传统“分块+拼接”流程,实现端到端长文档理解,输出质量更高。AI模型Unlimited-OCR百度OmniDocBenchDeepSeek-OCROCR5 个信源在谈推荐理由:百度开源了Unlimited-OCR,几百页文档一次搞定,不用分块拼接,速度稳准狠,OmniDocBench上93分压了DeepSeek-OCR一头。原文
01:56百度 AI Baidu@Baidu_Inc随着AI智能体承担更多工作,传统Tokens指标只能衡量花费。百度提出DAA(Daily Active Agents,日活跃智能体)作为衡量回报的新指标。DAA关注智能体实际完成任务的数量和效果,而非算力消耗,有助于更准确评估商业价值。行业百度DAA智能体度量指标推荐理由:百度用DAA来度量AI智能体的实际回报,比只看Tokens更实用,做AI应用的朋友可以看看。原文
23:12百度 AI Baidu@Baidu_Inc百度在社交媒体上提出了一个新指标DAA(Daily Active Agents),作为智能体时代衡量工作量的关键指标。DAA类似于传统互联网的DAU(日活跃用户),但专注于智能体实际完成的工作量,而非用户活跃度。Tokenomics(代币经济学)追踪成本,而DAA追踪产出,即智能体实际完成的工作量。这一概念旨在为智能体经济提供更精准的度量标准,帮助评估智能体系统的效率和价值。行业DAA智能体度量指标DAU百度推荐理由:智能体开发者和管理者需要新的度量标准来评估系统效率,DAA指标提供了比DAU更贴合智能体工作量的视角,值得关注和尝试。原文
23:10百度 AI Baidu@Baidu_Inc百度在2026年第一季度财报中披露,其核心AI业务收入首次超过136亿元人民币,同比增长49%,占百度通用业务收入的一半以上。这一增长延续了多个季度的趋势,并体现在AI云基础设施、AI应用和Apollo Go等多个业务板块。这表明百度在AI商业化方面取得了显著进展,AI已成为其核心增长引擎。行业百度AI业务财报AI云Apollo Go推荐理由:百度AI业务首次贡献过半营收,做AI商业化和云服务的团队值得关注这个里程碑式的信号。原文
22:44百度 AI Baidu@Baidu_Inc在百度Create 2026大会上,Robin Li探讨了智能体时代带来的新问题,包括价值衡量、智能体与人类共同进化,以及支持大规模智能体所需的基础设施。他提出了“每日活跃智能体”(DAA)作为新的定义性指标,并阐述了跨越智能体、个人和组织的“AI进化理论”。同时,百度展示了为智能体时代构建的全栈基础设施。这些观点共同描绘了智能体时代变革的宏观图景。行业智能体百度DAAAI进化理论基础设施推荐理由:百度CEO李彦宏首次提出DAA(每日活跃智能体)作为衡量AI价值的新指标,做AI产品、智能体平台或基础设施的从业者值得关注,这可能是行业重新定义成功标准的关键信号。原文
00:28百度 AI Baidu@Baidu_Inc百度在Baidu Create大会上宣布推出专为大规模智能体应用设计的全栈AI云,升级覆盖智能体基础设施和AI基础设施。该云平台采用百度自研昆仑芯AI芯片的专用集群,已成功支持文心大模型5.1系列中关键模型的训练。这标志着百度在支撑智能体应用规模化部署方面迈出重要一步,解决了云基础设施与智能体应用同步扩展的挑战。AI产品智能体AI云百度昆仑芯文心大模型推荐理由:做智能体应用部署的团队会关心云基础设施如何跟上规模增长——百度这次用自研芯片和全栈升级给出了答案,值得关注其实际效果。原文
01:10百度 AI Baidu@Baidu_Inc百度在Create大会上发布了Famou Agent 2.0,这是一个面向复杂工业场景的自我进化智能体。该智能体允许领域专家通过自然语言交互,无需编程知识即可使用。它专注于生产调度、流程优化和物流规划三个高影响场景。在注塑机任务分配中,它实现了6.31%的生产力提升,在自动化港口终端智能控制系统中实现了10.21%的性能改进。AI产品智能体工业场景百度生产调度流程优化推荐理由:工业领域终于有了一个无需编程就能用的智能体,做生产调度和物流规划的团队可以直接上手试试,已经看到实际效率提升。原文
01:10百度 AI Baidu@Baidu_Inc百度将旗下数字人平台“慧播星”升级为“文心智能体平台”,使其从直播带货扩展到直播、视频、实时交互和长互动内容等多场景。百度CEO李彦宏提出,数字人可能成为智能体的可视化前端,即“可见的智能体”,用于调用智能体、管理任务和访问服务。同时,国际版平台也已上线,帮助全球创作者和企业更高效地制作高质量数字人内容。这一升级标志着数字人技术正从单一商业场景向更广泛的智能体交互界面演进。AI产品数字人智能体百度文心智能体平台多场景交互推荐理由:数字人从直播带货扩展到多场景交互,做智能体应用或数字人内容的团队值得关注——百度把数字人定位为“可见的智能体”,这可能改变人机交互的方式。原文
18:51百度 AI Baidu@Baidu_Inc百度正式推出秒哒App和企业版,让更多开发者和企业能够使用其编程智能体。最引人注目的是,秒哒App自身90%的代码是由秒哒生成的。这标志着编程智能体正使按需定制软件在商业上变得可行。截至目前,秒哒生成的应用程序已服务超过1000万用户,总应用价值达到50亿元人民币。AI产品编程智能体百度秒哒AI编程企业版推荐理由:百度秒哒用自身证明了AI编程的可行性——90%代码自生成,服务千万用户,做应用开发的团队值得关注这个新工具。原文
15:51百度 AI Baidu@Baidu_Inc百度Create 2026大会即将在10分钟后开始直播。这是百度一年一度的AI开发者大会,预计将发布最新AI技术和产品。开发者可通过官方链接观看直播。行业百度Create 2026开发者大会AI推荐理由:百度年度AI大会即将开始,关注百度AI生态的开发者可以直接观看直播,了解最新技术动向。原文
15:51百度 AI Baidu@Baidu_Inc百度CEO李彦宏在百度Create大会上提出AI时代进化新理论,涵盖三个层面:智能体从被动响应转向主动执行、个人成为AI赋能的创造者、企业围绕人机混合团队进行组织。OpenClaw首次让智能体成为舞台中心,标志着继模型崛起后的新阶段。这一理论为AI应用落地提供了清晰的演进路径。行业智能体百度AI进化人机协作OpenClaw推荐理由:李彦宏的三层进化论为AI从业者指明了从模型到智能体的关键跃迁方向,做AI应用和智能体开发的团队值得关注OpenClaw的示范意义。原文
22:26百度 AI Baidu@Baidu_Inc百度公司宣布其年度开发者大会Baidu Create 2026将于24小时内直播。大会将在X和YouTube平台同步播出,预计将发布AI领域新进展或产品。具体内容待直播揭晓,值得关注。行业百度行业大会AI产品推荐理由:百度年度开发者大会是观察国内AI巨头最新战略和技术方向的重要窗口,可能涉及模型、产品等更新,值得从业者关注。原文
17:35百度 AI Baidu@Baidu_Inc百度Create 2026大会将于不到两天后开始,大会将发布百度在AI领域的最新进展和产品。官方提供了X和YouTube的直播链接,方便观众在线参与。此次大会预计将展示文心一言等AI技术的更新及应用,对AI行业从业者和开发者具有参考价值。行业大会百度文心一言产品发布推荐理由:作为百度年度AI大会,Create 2026将展示其最新技术方向,可能涉及模型更新或产品落地,值得关注直播以获取第一手信息。原文