精选 AI 资讯 · AI 热点

AITOP

正在升温更多 →

7月5日

23:51

官方账号Decoder@Jonathan Kemper

精选

百度发布了Unlimited OCR模型，一次性可处理数十页文档，而以往系统最多处理约10页。该模型通过改进注意力机制，使内存使用量不随页数增加而增长。Unlimited OCR目前在最重要的OCR基准测试中排名第一。

推荐理由：百度出了个Unlimited OCR，一次扫描几十页文档，内存不涨还拿了OCR基准第一，处理长文档效率提升明显。

原文

20:45

20:45IT之家（博客/媒体）

精选73°

谷歌2025年环境报告显示，因快速扩展AI基础设施，公司用电量同比增长37%，创历史新高。但通过提升能源效率和扩大可再生能源使用，运营碳排放同比下降2%。谷歌数据中心能源利用效率约为行业平均水平的1.83倍，2025年新增签署超12GW可再生能源采购协议，累计签订超240份绿电合同、总装机约35GW。公司称凭借优化方案，2025年避免约5800万吨二氧化碳排放，且连续九年实现100%可再生能源电力匹配。

行业谷歌 AI基础设施可再生能源碳排放 TPU

推荐理由：谷歌用电飙涨37%但碳排放反降2%，靠能效和绿电做到了‘脱钩’，还帮用户省了4100万吨碳，数据很扎实。

原文

19:27

19:27IT之家（博客/媒体）

精选

康宁于6月24日推出面向AI数据中心的玻璃基光互连技术Glass Bridge，基于玻璃波导实现光纤与PIC直接光学连接。摩根士丹利判断该技术既支持CPO也支持NPO架构，对光模块企业影响有限。中际旭创回应称Glass Bridge是CPO内部光耦合组件新方案，并非光模块替代。天孚通信有源光器件营收29.98亿元同比增长81.11%，有效对冲FAU替代风险。京东方A投资9.93亿元建设玻璃基封装载板试验线，计划2026年上半年通线，已开发出20层大尺寸样品。

行业康宁 Glass Bridge 光模块光器件玻璃基板

推荐理由：康宁这波技术发布，光模块厂商暂时没事，做上游光器件的天孚通信有营收对冲，做玻璃基板的京东方迎来新机会。产业链变化很清晰，值得看。

原文

16:37

Viking@vikingmute

精选

Cloudflare开源Agentic Inbox项目，是一个自托管邮件客户端，集成AI agent自动回复邮件。该项目使用Cloudflare Email Routing接收邮件、Email Sending发送、Durable Objects和D1存储、R2静态文件，并内置Workers AI和Agents SDK。项目已在GitHub上3个月未更新，存在大量未处理issue。适合在Cloudflare托管多个域名的用户，可替代Zoho企业邮箱。

AI产品 Cloudflare Agentic Inbox Workers AI 智能体自托管

推荐理由：Cloudflare搞了个自托管邮件客户端，用Workers AI和Agents SDK自动回邮件，适合多域名用户。但项目更新慢。

原文

15:58

官方一手marktechpost@Michal Sutter

精选

LlamaIndex 发布 legal-kb，一个基于 Index v2 的公共参考应用，赋予智能体类似文件系统的文档知识库访问能力。它公开了 retrieve（混合语义搜索）、find、read 和 grep 四个工具，并支持自动版本管理和可视化引用。技术栈采用 TanStack Start、AI SDK 6（ToolLoopAgent）、Prisma 和 WorkOS。

AI产品 LlamaIndex legal-kb Index v2 RAG 智能体

推荐理由：LlamaIndex 这个 legal-kb 应用能像操作文件一样搜索文档，用 Index v2 和四种工具，自动版本管理，很好用。

原文

11:10

官方一手marktechpost@Michal Sutter

精选

2026年，多数企业数据仍存储在PDF、扫描件和幻灯片中。开源文档提取模型可在本地硬件上将它们转为结构化JSON。但“PDF转JSON”涵盖两种不同问题：架构驱动提取和通用提取。选择合适的模型取决于目标格式和文档类型。

技巧 PDF提取 JSON 开源模型文档解析 2026

推荐理由：这篇指南帮你分清两类PDF提取任务，不用纠结选哪个开源模型。适合自己搭管线的开发者。

原文

10:44

Stanford AI Lab@StanfordAILab

精选

斯坦福AI实验室的研究（论文编号2606.24998）量化了预训练语料中残留重复数据对计算效率的影响。最坏情况下，重复结构可导致高达33%的FLOPs被浪费。该研究还发现最坏情况重复结构与模型大小存在可预测关系。论文将作为口头报告在ICML 2026深度生成模型基础研讨会上展示。

论文数据重复预训练计算浪费 Stanford 语言模型

推荐理由：预训练数据去重总留尾巴，斯坦福算了一笔账：最坏情况浪费三分之一的算力，模型越大规律越清楚。训练前值得看看。

原文

10:03

10:03IT之家（博客/媒体）

精选

安川电机在北九州新母工厂的百台机器人中，三分之一由AI驱动，生产效率实现翻倍。其与英伟达联合研发的Motoman Next是业内首款标配GPU的工业机器人，能自主调整装配失误，装配成功率接近百分之百。发那科在5月展出搭载谷歌Gemini的机器人，只需写下“黑色螺栓”即可精准抓取零部件，无需提前训练。上世纪90年代日本机器人占全球八成份额，现已降至四成，中国与欧洲对手崛起。

行业安川电机发那科英伟达谷歌Gemini 工业机器人

推荐理由：日本两大巨头安川和发那科都在用AI让机器人更聪明，能自己纠错、听懂人话，想重夺市场，值得一看。

原文

07:28

07:28官方账号Simon Willison’s Weblog（博客/媒体）

精选

Armin报告在Pi编程工具中发现异常：Claude Opus 4.8和Sonnet 5调用编辑工具时，会在edits[]数组中添加不存在的字段，导致工具调用被Pi拒绝。旧版本模型（如Haiku）未出现此问题。Armin推测原因是新模型通过强化学习被训练为更适配Claude Code的内置编辑工具，从而牺牲了对第三方工具模式的兼容。这一现象提示第三方工具可能需要为不同模型实现多种编辑工具以获得最佳效果。

行业 Claude Anthropic Pi 工具调用模型兼容性

推荐理由：Armin发现新版Claude模型反而在Pi里用编辑工具时会乱加字段，旧版反而正常。这是模型训练方向影响第三方工具的真实案例。

原文

02:37

官方账号Decoder@Matthias Bastian

精选

开源工具pxpipe通过将长文本提示转换为紧凑PNG图片，利用Anthropic按像素而非文本内容收费的定价策略来节省费用。开发者Steven Chong报告在Claude Code和Fable 5上实现了59%到70%的token成本降低。这种节省以牺牲准确性和速度为代价。该工具完全免费且开源。

AI产品 pxpipe Claude Code Fable 5 Anthropic 成本优化

推荐理由：想省Claude Code的token费？试试pxpipe，把提示藏进PNG，据说能省70%，不过会慢点。

原文

00:26

Tw93@HiTw93

精选

Mole CLI 近期发布了多项更新，包括清理输出重新设计、更智能的卸载检测、大型机器上更快的清理速度。新增 `mole status --watch` 支持 AI 代理和自动化。安全方面升级，保护端点安全和 EDR 工具，改进删除验证。新增清理目标包括 LM Studio、Chrome 设备端 AI 模型、JetBrains 残留等。

AI产品 Mole CLI LM Studio JetBrains 清理工具开源

推荐理由：Mole CLI 最新更新让清理输出更清晰、速度更快，还能监控状态给 AI 用，新增清理目标很实用，免费开源快试试。

原文

7月4日

22:59

22:59IT之家（博客/媒体）

精选

澜起科技披露其MRDIMM（符合JEDEC标准的高带宽服务器内存模组）第二子代产品传输速率为12800MT/s，较第一代8800MT/s提升45%。这一速率是主流第三子代RDIMM（6400MT/s）的两倍，旨在缓解AI推理等场景的内存带宽瓶颈。第三子代MRDIMM支持速率规划为16000MT/s。行业预计2026年下半年至2027年将有更多服务器CPU平台支持第二代MRDIMM，推动生态成熟。

行业澜起科技 MRDIMM JEDEC 内存带宽 AI推理

推荐理由：澜起科技的第二代MRDIMM内存速度达到12800MT/s，比上一代快45%，是普通RDIMM的两倍，专门解决AI推理时的带宽瓶颈，适合关注服务器硬件的朋友。

原文

22:11

Jerry Liu@jerryjliu0

精选73°

LlamaIndex推出了Index v2，一个用于现代代理检索的综合工具。它提供持久化数据管道，可连接数据源、索引并更新大型知识库，暴露语义搜索、正则grep、文件搜索和读取等类似文件系统操作的工具。该工具可集成到任何AI代理中，让代理自主爬取知识库解决复杂任务。参考实现legal-kb展示了在法律和金融领域的应用，具备版本控制、可视化引用和数据导出能力。

AI产品 LlamaIndex Index v2 legal-kb 智能体知识库

推荐理由：LlamaIndex搞了个Index v2，让你的AI代理能像逛文件系统一样搜索知识库，还能自动更新。legal-kb示例已开源，法律金融场景直接上手。

原文

21:56

AI Will@FinanceYF5

精选

本教程教你如何在 Claude Code 中将模型设为 Fable 5，并开启 Max 推理模式。通过指示 Claude 运行动态工作流，让 Fable 5 充当编排者（orchestrator），Opus 负责推理重阶段。这样可以避免频繁触及使用限制，同时最大化利用 Fable 5 的调度能力。适用于需要高效分配模型资源的任务场景。

技巧 Fable 5 Claude Code Opus 工作流推理模型

推荐理由：想省限额又发挥 Fable 5 的调度能力？让 Fable 5 当大脑、Opus 干活，效率拉满。

原文

21:29

AI Will@FinanceYF5

精选

该教程介绍如何将 Fable 5（max reasoning 模式）设为主编排器，Opus 专用于深度推理子代理，Sonnet 负责机械任务子代理，Codex 作为同行高级工程师。步骤包括在 Claude Code 中通过 /model 切换模型、用 /agents 创建两个子代理、安装 OpenAI 官方 Codex 插件并配置 /codex:setup。在 CLAUDE.md 中写入编排规则后，用特定提示词指示 Fable 5 像技术负责人一样分配任务。此工作流可节省 Fable 5 的使用次数，同时利用 Opus 和 Codex 并行处理高难度决策。

技巧 Fable 5 Opus Codex 工作流智能体

推荐理由：一个Twitter用户分享了用Fable 5编排Opus和Codex的实战技巧，配置简单，能同时调用多个模型节省成本，适合需要深度推理+代码执行的任务。

原文

18:20

官方一手Pandaily@contact@pandaily.com (Pandaily)

精选

傅聪团队与厦门大学联合提出ManCAR框架，一种流形约束自适应推理方法。在推荐任务上，ManCAR在NDCG@10指标上取得最高46.88%的提升。该框架通过流形约束捕捉用户偏好的非线性结构，结合自适应推理增强生成式推荐的准确性。实验结果在多个基准数据集上验证了其有效性。

AI模型 ManCAR 傅聪推荐系统自适应推理流形约束

推荐理由：傅聪团队和厦大搞了个ManCAR新框架，做推荐比之前方法强了将近一半，用流形约束让推荐结果更准更靠谱。

原文

15:29

官方账号Decoder@Matthias Bastian

精选

Mistral AI 发布了 Leanstral 1.5，这是一个用于 Lean 4 形式化验证的开源模型。该模型在多个形式化数学基准测试中取得了领先成绩，例如在 miniF2F 测试中准确率达到 60%，超过此前的最佳模型。此外，Leanstral 1.5 在扫描 57 个开源代码仓库时，成功发现了 5 个此前未知的 bug。这些发现展示了该模型在数学证明和代码正确性验证方面的实用价值。

AI模型 Mistral Leanstral 1.5 Lean 4 形式化验证开源模型

推荐理由：Mistral 新模型 Leanstral 1.5 专攻形式化验证，能自动找出代码漏洞，数学基准也比同类强。

原文

14:50

14:50IT之家（博客/媒体）

精选

深圳龙岗区首家区级公办养老护理院椿萱茂于7月3日启用，总投资2.35亿元，是全国首个全场景开源鸿蒙养老护理院。项目基于深开鸿KaihongOS和KaihongOS Meta平台，构建了1个安全数字底座加10大核心子系统、5大应用场景，接入20余类、3000余台智能硬件设备。房间内采用毫米波无感监测，实时感知长者状态并自动对跌倒、坠床等风险弹窗告警；公共区域通过AI识别跌倒、火灾隐患，实现主动预防。系统还整合健康设备数据，AI每日生成睡眠评估报告，并定期输出专属健康分析报告。

行业深开鸿 KaihongOS 开源鸿蒙智能养老无感监测

推荐理由：深开鸿联合龙岗区落地了首个全场景开源鸿蒙养老院，用毫米波无感监测和AI主动预警代替传统被动处置，3000多台设备打通全链路，养老智能化玩真的了。

原文

12:16

Geek@geekbb

精选

一个免费的双向 Figma MCP 服务器发布，通过本地 WebSocket 连接 AI 代理（如 Claude Code、Cursor）和 Figma 插件。它能读取 Figma 设计稿，也能直接在画布上写入元素。该工具支持生成框架感知的代码，自动识别设计稿中的布局和组件结构。用户无需付费即可在本地部署，实现 AI 代理与 Figma 的实时双向交互。

AI产品 Figma MCP Claude Code Cursor 设计稿集成

推荐理由：设计师和开发者有福了，这个免费 MCP 服务器让 Claude Code、Cursor 直接读写 Figma 画布，还能生成带框架结构的代码，省去手动导出的麻烦。

原文

10:19

官方一手pandaily@contact@pandaily.com (Pandaily)

精选

阿里达摩院开发的AI代理ElementsClaw在28个GPU小时内筛选了240万种晶体结构，成功发现了4种未知的超导体。该代理结合深度学习与材料科学，将超导体发现效率提升至传统方法的数百倍。此前类似任务通常需要数月甚至更长时间。这一成果为超导材料研究提供了新方向。

AI模型 ElementsClaw 阿里达摩院智能体超导体材料科学

推荐理由：阿里达摩院用AI代理ElementsClaw，28小时从240万晶体里挖出4种新超导体，效率甩传统方法几条街。

原文

10:03

shao__meng@shao__meng

精选

Claude Code 核心开发者 @trq212 提出「地图不是疆域」认知框架：Prompt 是地图，真实代码库是疆域，两者落差即未知。他将未知分为 Known Knowns、Known Unknowns、Unknown Knowns、Unknown Unknowns 四类，并给出对应处理方式。实操包含三阶段工作流：实现前用盲点扫描、原型、访谈等技巧挖掘未知；实现中用 implementation-notes.md 记录偏离；实现后用 Pitch 制品和测验反向加速交付。该方法在 Fable 发布视频剪辑案例中验证：通过澄清 Unknown Unknowns（如调色标准）提升最终质量。

技巧 Claude Fable 5 Claude Code 提示词工程智能体编程助手

推荐理由：想用好 Claude Code 但总觉得模型不够聪明？试试这套四类未知框架和三阶段工作流，把瓶颈从模型能力转到你的提问质量。

原文

09:09

09:09IT之家（博客/媒体）

精选

阿里于7月3日宣布Qoder全球站正式推出企业版，并在国内和国际阿里云市场同步开售。企业版采用Credits完全资源池化计费，管理员可按需为成员或计费组动态分配额度，支持云市场兑换码进行席位调整与续费。产品内置模型开关，支持按人、按代码库开放模型，并带有企业专属Plugin/Skill市场。安全方面已通过ISO/IEC 27001:2022国际认证，具备传输加密、身份访问控制等五大防御体系。

AI产品 Qoder 阿里 Credits Plugin/Skill市场企业级

推荐理由：阿里这次把Qoder企业版做得挺细，资源池化让团队用AI更灵活，还能按人控制模型权限，适合想精细化管理的研发团队。

原文

08:48

官方账号Stability AI@StabilityAI

精选

团队 Motif 在 Stable Audio 3.0 上微调，使其识别阿拉伯 maqam 音阶。他们开发了一个 Ableton 插件，实现微音阶风格转移。该作品在 StabilityAI 举办的 Stable Audio 3.0 挑战赛中获胜，并能在本地设备运行。演示视频由 Jad Al Masri 讲解。

AI产品 Stable Audio 3.0 Motif Ableton 插件微调音乐生成

推荐理由：StabilityAI 挑战赛冠军团队 Motif 把 Stable Audio 3.0 微调后做成了 Ableton 插件，专门处理阿拉伯音乐微音阶，本地就能跑。

原文

07:33

elvis@omarsar0

精选

研究员omar sar分享了多模态提示工作流，通过录制语音、屏幕注释、鼠标点击等输入，预处理后传递给Agent，显著提升任务完成效率。该方法已为他节省数小时工作时间，减少与Agent的挫败交互。他将这些录制的任务作为可复用数据集，不断改进并打包成工作流/模式/技能。该技巧应用于Web开发、设计、原型制作、研究等多个场景。

技巧多模态提示智能体提示词工程工作流

推荐理由：omar sar教你怎么用语音+屏幕操作提示Agent，比纯文字提示聪明多了，能省下大量调试时间。

原文

03:18

03:18官方账号Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison从Claude Code团队Cat Wu和Thariq Shihipar学到：让Fable（以及部分Opus）自己决定是否写测试，而不是硬性规定。他进一步实践：让Fable在编程任务中自主选择调用Sonnet或Haiku作为子代理，自己仅负责判断、审核和合成。他于2026年7月3日用prompt写入Claude内存文件`delegate-coding-to-subagents.md`。这种做法大幅减少了Fable token消耗，提高了效率。

技巧 Claude Code Fable Anthropic 提示词技巧编程助手

推荐理由：Simon实测让Fable自己判断用哪个模型干小活，省token效果立竿见影，你也能照做。

原文

02:34

官方一手Claude Code: GitHub Releases@ashwin-ant

精选

Claude Code v2.1.200 更改了 AskUserQuestion 对话框默认不再自动继续，用户可通过 /config 开启空闲超时。默认权限模式改为 Manual，并修复了因 disabledMcpServers 或 enabledMcpServers 为非法数组值导致的启动崩溃。后台会话在睡眠/唤醒或重开后不再静默停止，且修复了后台代理崩溃后因 PID 重用而无法重启的问题。插件目录标志放置顺序错误导致代理视图不显示的问题已解决，/mcp server list 现在可正确跟踪屏幕阅读器焦点。改进了安装脚本，当系统因内存不足终止安装时会给出解释。

AI产品 Claude Code Anthropic v2.1.200 MCP/工具编程助手

推荐理由：用 Claude Code 的话记得更新，这次修了后台代理卡死、MCP 服务器列表焦点、tmux 渲染闪烁等十几个 bug，体验稳多了。

原文

02:33

LlamaIndex@llama_index

精选

LlamaIndex 团队基于 Vercel 的 Eve agent 框架构建了一个模板，集成 LiteParse 工具。该模板提供只读文件系统工具，允许 Eve 解析路径、列出目录和读取文本文件。LiteParse 将源文件解析为干净的结构化 Markdown。Agent 配备详细指令，组合这些工具以导航和理解文档集合。

技巧 Eve LiteParse LlamaIndex 智能体提示词工程

推荐理由：LlamaIndex 出了个 Eve 模板，集成 LiteParse 自动把文件转成 Markdown，还带文件系统工具，开箱即用。

原文

00:33

官方账号Decoder@Matthias Bastian

精选

英国AI安全研究所(AISI)在涵盖7项基准测试的研究中发现，标准评估通过限制计算预算系统性地低估了AI智能体的实际能力。在软件工程任务中，当token预算增加10倍时，成功率提升约25%。新模型受益最大，实际进展比之前测量结果陡峭约60%。

论文 AISI AI智能体基准测试 AI安全 token预算

推荐理由：别信那些基准排名——AISI发现给智能体多点token，表现就能飙升25%。新模型潜力更大。

原文

00:03

elvis@omarsar0

精选

HOLA论文提出为线性注意力添加海马体互补存储，保留delta-rule状态的压缩记忆并增加一个有限精确KV缓存，形成半参数测试时记忆。在340M参数、15B SlimPajama tokens训练下，WikiText困惑度从27.32降至22.92，低于全注意力Transformer++的26.88。在RULER needle recall测试中，HOLA在32k tokens（16倍训练长度）上保持稳健。

论文 HOLA 线性注意力长程召回状态空间模型

推荐理由：线性注意力一直有长程遗忘问题，HOLA用一个小缓存就解决了，在32k长度上效果惊人。

原文

7月3日

21:36

Ate-a-Pi@svpino

精选

这篇教程展示了如何用 Claude Code 的非交互模式（-p 标志）构建 agentic loop。通过一个例子：在空文件夹中运行命令，让 Claude 用 Python 实现 Fibonacci 函数并编写 pytest 测试，每步改动后自动运行测试直到全部通过。核心有三个参数：-p 非交互运行、--allowedTools 预授权工具（Read, Write, Edit, Bash）、--max-turns 15 限制最大轮次。最终会输出 Fibonacci 代码和通过的测试结果。

技巧 Claude Code 智能体编程助手提示词工程

推荐理由：Claude Code 这个命令模板非常实用，能让你零基础跑通第一个智能体循环，省去手动写代码和测试的重复劳动。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……