全部 AI 动态 · AI 热点

6月29日

07:15

07:15IT之家（博客/媒体）

据《The Information》援引知情人士消息，百度旗下AI芯片子公司昆仑芯（Kunlunxin）计划在香港上市，目标估值约500亿美元（约合3405.58亿元人民币）。部分投资者被要求认购相当于申购金额3-7倍的芯片产品才能参与IPO。腾讯已成为昆仑芯的客户，字节跳动也被传正考虑采用其AI芯片。昆仑芯最初于2012年作为百度内部AI芯片部门成立，后独立运营，百度仍为控股股东。

行业昆仑芯百度腾讯 AI芯片香港上市

推荐理由：昆仑芯是百度孵化的AI芯片公司，现在计划IPO估值500亿美元，腾讯已经是客户了，想了解芯片行业动态的可以看看。

原文

6月28日

14:34

量子位@林樾

百度在GitHub开源了全新OCR模型，模型名称暂未公开，但根据展示能一次性识别整本图书内容。该模型作者被社区推测为前DeepSeek研究员。项目已在GitHub托管，提供预训练权重和API文档。

AI模型百度 OCR 开源模型 DeepSeek

推荐理由：百度搞了个能扫整本书的OCR，还开源了，做文档处理的可以试试。

原文

6月25日

15:45

15:45IT之家（博客/媒体）

精选71°

百度于6月22日开源Unlimited OCR模型，总参数30亿，推理时仅激活5亿参数。该模型基于DeepSeek OCR架构，采用两级视觉编码和16倍token压缩，将1024×1024的PDF图像压缩为256个视觉token。训练基于DeepSeek OCR检查点继续训练4000步，使用约200万文档样本，在8×16 A800 GPU上运行。在OmniDocBench v1.5上整体得分93.23，高于DeepSeek OCR的87.01和DeepSeek OCR 2的89.17。文本编辑距离0.038，公式CDM 92.61，表格TEDS 90.93，读序编辑距离0.045。

AI模型 Unlimited OCR DeepSeek OCR 百度 OCR 文档解析

推荐理由：百度开源了一个能一次性解析长文档的OCR模型，不再越处理越慢，性能还超过了DeepSeek OCR。

原文

6月24日

12:39

小互@imxiaohu

精选

百度开源的Unlimited OCR模型采用参考滑动窗口注意力（R-SWA）技术，能在32K上下文内一次前向推理处理数十页文档，无需分页。模型仅3B参数、500M激活，显存和算力不随页数增长。传统逐页OCR需要拼接结果，而R-SWA模拟人类连续抄写，始终记忆固定大小的文本。该模型据称基于DeepSeek OCR核心贡献者开发，已在标准长度文档上测试。

AI模型 Unlimited OCR 百度 R-SWA OCR 开源模型

推荐理由：百度开源了一款OCR模型，3B参数就能一次处理几十页PDF，不用切页，比传统逐页OCR强太多。

原文

03:28

AK@_akhaliq

百度发布了名为Unlimited-OCR的OCR服务。该产品提供无限次数的OCR识别功能。用户可通过调用API或直接使用。目前暂无定价信息。

AI产品百度 Unlimited-OCR OCR 文字识别

推荐理由：百度出了个Unlimited-OCR，无限次OCR识别，做文字提取的可以试试。

原文

6月23日

16:21

Pandaily@contact@pandaily.com (Pandaily)

百度推出Unlimited-OCR技术，核心是Constant KV Cache方法，专为超长文档设计。该技术在长文档OCR任务上取得SOTA性能，解决了传统KV缓存随文档长度线性增长的问题。Constant KV Cache将缓存大小保持常数，显著降低内存占用和推理延迟。

AI模型 Unlimited-OCR Constant KV Cache 百度 OCR 长文档

推荐理由：百度搞了个Unlimited-OCR，用Constant KV Cache解决长文档识别，缓存不爆炸，性能还最强，适合处理几百页的合同或文献。

原文

14:46

向阳乔木@vista8

76°

百度发布Unlimited OCR，模拟人类抄书注意力模式，每生成一个token时参考完整图像和提示词，但输出侧仅回看前128个token。KV缓存固定为128长度，避免长文档推理时内存爆炸。在超长文档OCR任务上效果显著，已在GitHub和Hugging Face开源。

AI模型 UnlimitedOCR 百度 OCR 推理模型开源模型

推荐理由：百度开源了一个超聪明的OCR方案，用固定128 token缓存模拟人眼抄书，长文档不爆内存，快去试试！

原文

14:45

向阳乔木@vista8

百度近日开源了Unlimited OCR模型，参数量3B但仅需500M激活参数。该模型参考了滑动注意力窗口技术，在OCR任务上取得了出乎意料的好效果。轻量级设计使其更易于部署。

AI模型百度 Unlimited OCR OCR 开源模型滑动注意力

推荐理由：百度刚开源的Unlimited OCR，3B参数只激活500M，效果居然这么强，做OCR的赶紧看看。

原文

13:55

Geek@geekbb

精选

百度开源了一个基于DeepSeek-OCR升级的视觉语言模型OCR项目，支持一次性解析超长文档。该模型提供两种推理模式：gundam模式用于处理单张图片中的密集文字，base模式适用于多页文档或PDF。项目代码已在GitHub上发布，允许开发者直接使用。

AI模型百度 DeepSeek-OCR 视觉语言模型 OCR 开源模型

推荐理由：百度开源的OCR模型，在DeepSeek-OCR上做了升级，能一次性处理超长文档和密集文字，两种模式很实用。

原文

10:33

berryxia@berryxia

百度开源的 Unlimited OCR 模型采用 R-SWA 注意力机制，支持 32K 上下文窗口，一次前向推理即可完成几十页文档的转录。其核心卖点是 One-Shot Long-Horizon Parsing，无需分页处理，KV Cache 大小恒定。技术报告提到该模型融合了来自 DeepSeek-OCR 的高压缩编码器，且部分核心贡献者与 DeepSeek 有渊源。

AI模型 Unlimited OCR 百度 R-SWA OCR 开源模型

推荐理由：百度搞了个挺牛的 OCR 模型，能一口气读几十页，不像以前那样一页一页循环。开源了，谁都能试试。

原文

08:05

berryxia@berryxia

百度开源了Unlimited OCR模型，采用R-SWA（参考滑动窗口注意力）机制，一次前向推理即可处理32K上下文的文档，数十页PDF无需分块。与传统逐页处理的OCR不同，其KV Cache大小恒定，不随长度增长。模型灵感源于人类抄书行为，仅维护近128个状态。技术报告核心贡献者中，技术总监YY疑为DeepSeek前员工。

AI模型 Unlimited OCR 百度 DeepSeek R-SWA 文档理解

推荐理由：百度开源的Unlimited OCR能一口气读完几十页PDF，不用切块，快又准。技术总监YY可能是DeepSeek出走的，有意思。

原文

00:47

berryxia@berryxia

精选72°

百度在Hugging Face上开源了Unlimited-OCR模型，其核心创新是R-SWA（Reference Sliding Window Attention），让KV Cache保持恒定，避免随页数爆炸。该模型可一次性解析单张图或多页PDF，在OmniDocBench上获得93分，比DeepSeek-OCR高出6个百分点。它取代了传统“分块+拼接”流程，实现端到端长文档理解，输出质量更高。

AI模型 Unlimited-OCR 百度 OmniDocBench DeepSeek-OCR OCR

推荐理由：百度开源了Unlimited-OCR，几百页文档一次搞定，不用分块拼接，速度稳准狠，OmniDocBench上93分压了DeepSeek-OCR一头。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

01:56

百度 AI Baidu@Baidu_Inc

行业百度 DAA 智能体度量指标

推荐理由：百度用DAA来度量AI智能体的实际回报，比只看Tokens更实用，做AI应用的朋友可以看看。

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

10:05

Pandaily@contact@pandaily.com (Pandaily)

2026 年高考季，中国科技巨头如百度、阿里、腾讯等推出 AI 驱动的志愿填报工具，为 1290 万考生提供个性化指导。这些工具利用大数据和机器学习，分析历年录取分数、专业趋势和就业前景，帮助考生做出更明智的选择。此举旨在打破传统志愿填报的信息不对称，让农村和偏远地区学生也能获得优质指导。AI 的介入不仅提升了效率，还降低了咨询成本，但专家提醒需谨慎对待算法建议，避免过度依赖。

AI产品高考志愿 AI 教育百度阿里腾讯

推荐理由：高考志愿填报是千万家庭的头等大事，AI 工具让信息获取更公平，尤其利好农村和资源有限的学生。家有考生的家长或教育从业者值得关注，可以试试这些免费或低成本的智能指导。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

09:53

pandaily@contact@pandaily.com (Pandaily)

DeepSeek 在 5 月录得 5.41 亿月访问量，继续稳居中国 AI 产品榜首。与此同时，百度在搜索、长内容及对话式 AI 领域的多个产品出现明显复苏迹象。这一数据表明中国 AI 市场竞争格局正在变化，DeepSeek 保持领先，而传统巨头百度正通过 AI 整合重新夺回用户。

行业 DeepSeek 百度 AI 产品月访问量中国市场

推荐理由：中国 AI 产品月活排名洗牌，DeepSeek 持续领跑，百度 AI 产品回暖值得关注——做市场分析或关注国内 AI 竞争格局的读者可以点开看看具体数据。

原文

6月8日

09:50

pandaily@contact@pandaily.com (Pandaily)

每年高考不仅是学生的战场，也成为中国科技巨头展示AI实力的舞台。今年，腾讯、阿里、百度、字节跳动等公司纷纷用自家大模型挑战高考题目，比拼解题能力和准确率。这些公司通过公开测试或直播形式展示AI在语文、数学、英语等科目上的表现，旨在证明其模型在复杂推理和知识应用上的进步。此举不仅为品牌营销，也反映了AI在教育领域的应用潜力，引发公众对AI能否超越人类考生的讨论。

行业大模型高考教育AI 腾讯阿里百度字节跳动

推荐理由：高考AI比拼是检验大模型推理能力的绝佳场景，关注AI教育应用的开发者和教育从业者值得一看，看看哪家模型能真正“考”过人类。

原文

6月7日

15:55

pandaily@contact@pandaily.com (Pandaily)

百度移动生态事业群（MEG）进行重大组织调整，将商业和电商业务合并为一个新业务单元。这是百度在AI驱动下加速转型的最新举措，旨在整合资源、提升效率。合并后的部门将聚焦于AI技术赋能商业和电商场景，推动搜索、信息流与电商的深度融合。此次重组反映了百度对AI商业化的重视，以及应对市场竞争的战略调整。

行业百度 MEG 组织重组 AI转型电商

推荐理由：百度MEG的这次重组直接关系到其AI商业化路径，关注百度生态的开发者、广告主和电商从业者可以从中看到AI如何重塑搜索与电商的融合机会，值得跟进。

原文

6月6日

23:43

23:43IT之家（博客/媒体）

百度移动生态事业群组（MEG）进行新一轮组织调整，将商业部与电商事业部合并成立大商业事业部，同时将数字人创新业务部升级为独立部门。此前百度在 Create 2026 大会上将数字人品牌“慧播星”升级为“百度一镜”，并推出海外版，定位为全场景数字人平台。李彦宏称数字人是“看得见的智能体”，是 AI 时代的通用交互界面。此次调整显示百度正加速将数字人业务作为独立战略方向，并整合商业与电商资源以提升协同效率。

行业百度组织调整数字人电商智能体

推荐理由：百度把数字人业务独立成部门，做直播带货或视频创作的团队可以关注——百度一镜已从带货场景扩展到全平台，一个人加一镜就能做视频，值得试试。

原文

5月27日

12:14

arXiv: DeepSeek@Mingyue Wang, Xingyu Xie, Hang Yang, Li Gao, Lixin Su, Ge Chen, Dawei Yin, Daiting Shi

精选

百度搜索团队提出QDET（查询驱动事件时间线摘要）系统，用于在搜索中为热点新闻查询构建聚焦的事件时间线。该系统通过多任务监督微调（时序排序、因果判断、时间线补全）和基于强化学习的简洁摘要生成，使7B参数模型在时间线摘要F1得分（76.2%）上超越DeepSeek-R1-671B（76.1%），参数量仅为后者的1%。在线A/B测试显示，QDET使点击率提升5.5%、停留时间延长4.6%、探索深度增加4.4%。该工作证明领域专用优化能以极低成本达到大模型级别的生产质量。

论文事件时间线摘要搜索多任务微调强化学习百度

推荐理由：搜索和新闻聚合团队终于有了可落地的轻量级时间线方案——7B模型干翻671B，CTR和用户停留时间双双提升，做搜索排序或事件摘要的工程师可以直接参考其多任务微调策略。

原文

5月19日

23:12

百度 AI Baidu@Baidu_Inc

百度在社交媒体上提出了一个新指标DAA（Daily Active Agents），作为智能体时代衡量工作量的关键指标。DAA类似于传统互联网的DAU（日活跃用户），但专注于智能体实际完成的工作量，而非用户活跃度。Tokenomics（代币经济学）追踪成本，而DAA追踪产出，即智能体实际完成的工作量。这一概念旨在为智能体经济提供更精准的度量标准，帮助评估智能体系统的效率和价值。

行业 DAA 智能体度量指标 DAU 百度

推荐理由：智能体开发者和管理者需要新的度量标准来评估系统效率，DAA指标提供了比DAU更贴合智能体工作量的视角，值得关注和尝试。

原文

5月18日

23:10

百度 AI Baidu@Baidu_Inc

百度在2026年第一季度财报中披露，其核心AI业务收入首次超过136亿元人民币，同比增长49%，占百度通用业务收入的一半以上。这一增长延续了多个季度的趋势，并体现在AI云基础设施、AI应用和Apollo Go等多个业务板块。这表明百度在AI商业化方面取得了显著进展，AI已成为其核心增长引擎。

行业百度 AI业务财报 AI云 Apollo Go

推荐理由：百度AI业务首次贡献过半营收，做AI商业化和云服务的团队值得关注这个里程碑式的信号。

原文

19:57

19:57IT之家（博客/媒体）

百度发布 2026 财年第一财季业绩，总营收 320.75 亿元，同比下降 1.16%，归母净利润 34.45 亿元，同比大幅下降 55.36%。但核心 AI 新业务收入首次占一般性业务收入过半，达 52%，收入 136 亿元，同比增长 49%，其中智能云基础设施收入 88 亿元，同比增长 79%，GPU 云收入增长 184%。AI 已成为百度核心增长驱动力，一般性业务总收入同比增长 2%，重回正增长。萝卜快跑全无人订单量达 320 万单，同比增长超 120%，覆盖 27 个城市。

行业百度 AI 业务智能云无人驾驶财报

推荐理由：百度净利润腰斩但 AI 业务收入占比过半，关注 AI 商业化进程的投资者和从业者值得细看——AI 云和无人车增长强劲，但传统业务承压，财报背后是转型期的真实写照。

原文

5月15日

22:44

百度 AI Baidu@Baidu_Inc

在百度Create 2026大会上，Robin Li探讨了智能体时代带来的新问题，包括价值衡量、智能体与人类共同进化，以及支持大规模智能体所需的基础设施。他提出了“每日活跃智能体”（DAA）作为新的定义性指标，并阐述了跨越智能体、个人和组织的“AI进化理论”。同时，百度展示了为智能体时代构建的全栈基础设施。这些观点共同描绘了智能体时代变革的宏观图景。

行业智能体百度 DAA AI进化理论基础设施

推荐理由：百度CEO李彦宏首次提出DAA（每日活跃智能体）作为衡量AI价值的新指标，做AI产品、智能体平台或基础设施的从业者值得关注，这可能是行业重新定义成功标准的关键信号。

原文

00:28

百度 AI Baidu@Baidu_Inc

百度在Baidu Create大会上宣布推出专为大规模智能体应用设计的全栈AI云，升级覆盖智能体基础设施和AI基础设施。该云平台采用百度自研昆仑芯AI芯片的专用集群，已成功支持文心大模型5.1系列中关键模型的训练。这标志着百度在支撑智能体应用规模化部署方面迈出重要一步，解决了云基础设施与智能体应用同步扩展的挑战。

AI产品智能体 AI云百度昆仑芯文心大模型

推荐理由：做智能体应用部署的团队会关心云基础设施如何跟上规模增长——百度这次用自研芯片和全栈升级给出了答案，值得关注其实际效果。

原文

5月14日

01:10

百度 AI Baidu@Baidu_Inc

百度在Create大会上发布了Famou Agent 2.0，这是一个面向复杂工业场景的自我进化智能体。该智能体允许领域专家通过自然语言交互，无需编程知识即可使用。它专注于生产调度、流程优化和物流规划三个高影响场景。在注塑机任务分配中，它实现了6.31%的生产力提升，在自动化港口终端智能控制系统中实现了10.21%的性能改进。

AI产品智能体工业场景百度生产调度流程优化

推荐理由：工业领域终于有了一个无需编程就能用的智能体，做生产调度和物流规划的团队可以直接上手试试，已经看到实际效率提升。

原文

01:10

百度 AI Baidu@Baidu_Inc

百度将旗下数字人平台“慧播星”升级为“文心智能体平台”，使其从直播带货扩展到直播、视频、实时交互和长互动内容等多场景。百度CEO李彦宏提出，数字人可能成为智能体的可视化前端，即“可见的智能体”，用于调用智能体、管理任务和访问服务。同时，国际版平台也已上线，帮助全球创作者和企业更高效地制作高质量数字人内容。这一升级标志着数字人技术正从单一商业场景向更广泛的智能体交互界面演进。

AI产品数字人智能体百度文心智能体平台多场景交互

推荐理由：数字人从直播带货扩展到多场景交互，做智能体应用或数字人内容的团队值得关注——百度把数字人定位为“可见的智能体”，这可能改变人机交互的方式。

原文

5月13日

21:36

21:36IT之家（博客/媒体）

百度创始人李彦宏在Create 2026大会上提出，AI时代的核心度量衡应从Token消耗转向“日活智能体数”（DAA），类比移动互联网的DAU。他认为Token代表成本而非收益，衡量投入而非产出，而DAA更能反映平台生态的繁荣和实际价值。李彦宏强调，智能体时代应关注有多少智能体在为人类干活并交付结果。他还指出，智能体浪潮下，开发者、创业者和创造者实现了三位一体。

行业智能体百度李彦宏 DAA AI生态

推荐理由：李彦宏的这个观点重新定义了AI价值的衡量标准，做AI平台和智能体生态的团队值得思考——别再只盯着Token消耗，DAA可能才是更接近商业本质的指标。

原文

18:51

百度 AI Baidu@Baidu_Inc

AI产品编程智能体百度秒哒 AI编程企业版

推荐理由：百度秒哒用自身证明了AI编程的可行性——90%代码自生成，服务千万用户，做应用开发的团队值得关注这个新工具。

原文

15:51

百度 AI Baidu@Baidu_Inc

百度Create 2026大会即将在10分钟后开始直播。这是百度一年一度的AI开发者大会，预计将发布最新AI技术和产品。开发者可通过官方链接观看直播。

行业百度 Create 2026 开发者大会 AI

推荐理由：百度年度AI大会即将开始，关注百度AI生态的开发者可以直接观看直播，了解最新技术动向。

原文

15:51

百度 AI Baidu@Baidu_Inc

百度CEO李彦宏在百度Create大会上提出AI时代进化新理论，涵盖三个层面：智能体从被动响应转向主动执行、个人成为AI赋能的创造者、企业围绕人机混合团队进行组织。OpenClaw首次让智能体成为舞台中心，标志着继模型崛起后的新阶段。这一理论为AI应用落地提供了清晰的演进路径。

行业智能体百度 AI进化人机协作 OpenClaw

推荐理由：李彦宏的三层进化论为AI从业者指明了从模型到智能体的关键跃迁方向，做AI应用和智能体开发的团队值得关注OpenClaw的示范意义。

原文

5月12日

22:26

百度 AI Baidu@Baidu_Inc

百度公司宣布其年度开发者大会Baidu Create 2026将于24小时内直播。大会将在X和YouTube平台同步播出，预计将发布AI领域新进展或产品。具体内容待直播揭晓，值得关注。

行业百度行业大会 AI产品

推荐理由：百度年度开发者大会是观察国内AI巨头最新战略和技术方向的重要窗口，可能涉及模型、产品等更新，值得从业者关注。

原文

17:35

百度 AI Baidu@Baidu_Inc

百度Create 2026大会将于不到两天后开始，大会将发布百度在AI领域的最新进展和产品。官方提供了X和YouTube的直播链接，方便观众在线参与。此次大会预计将展示文心一言等AI技术的更新及应用，对AI行业从业者和开发者具有参考价值。

行业大会百度文心一言产品发布

推荐理由：作为百度年度AI大会，Create 2026将展示其最新技术方向，可能涉及模型更新或产品落地，值得关注直播以获取第一手信息。

原文

5月11日

22:17

百度 AI Baidu@Baidu_Inc

百度宣布将于下周三举办Create 2026大会，CEO李彦宏将深入解读“Agents at Scale”（智能体规模化）的实际内涵。演讲将聚焦智能体本身、与智能体协作的人员以及随之演进的组织结构，旨在推动智能体从概念走向大规模实际应用。该活动标志着智能体技术进入商业化与产业化加速阶段。

行业智能体百度 AI应用行业大会

推荐理由：百度作为中国AI领域的重要参与者，其CEO在年度技术大会上的主题演讲将揭示智能体规模化落地的战略方向与技术路径，对关注AI应用落地的从业者具有参考价值。

原文

22:17

百度 AI Baidu@Baidu_Inc

70°

AI模型百度 ERNIE 5.1 基础模型低成本训练

推荐理由：ERNIE 5.1以极低的预训练成本实现了能力的全面升级，这展示了高效模型优化的潜力，可能对行业降低成本具有示范意义。

原文

22:17

百度 AI Baidu@Baidu_Inc

百度宣布其旗舰开发者大会Baidu Create 2026将于5月13日（下周三）上午9:30（UTC+8）在北京举行并直播。大会将展示百度在AI领域的最新技术进展和产品更新，对关注百度生态的开发者及行业从业者具有重要意义。具体演讲内容和议程将于直播时公布。

行业百度开发者大会行业活动

推荐理由：作为百度年度最重要的开发者活动，Create大会通常会发布重大AI技术更新或产品迭代，值得开发者关注。

原文

22:17

百度 AI Baidu@Baidu_Inc

百度用其AI图像生成模型ERNIE-Image，将母亲节经典唠叨翻译成“真正含义”，并通过趣味图片展示。例如，“有空打电话”可能意味着“想你了”。该活动利用AI技术进行创意表达，旨在传递情感而非仅仅文字表面意思。百度借此展示其多模态AI能力，同时庆祝母亲节。

AI产品图像生成 ERNIE-Image 百度多模态情感化设计

推荐理由：此为百度营销活动，展示ERNIE-Image的创意应用。对行业而言，表明AI图像生成正从技术展示转向情感化、场景化的用户体验设计。

原文