全部 AI 动态 · AI 热点

6月25日

02:42

Notion@NotionHQ

Notion团队将客户bug或功能请求分配给Cursor agent。agent读取任务简报，在代码库中工作并自动打开PR。该流程让非工程成员也能交接实际工程工作。Cursor作为AI编程助手，可理解上下文并生成代码变更。这展示了AI agent在协作中的实际应用。

技巧 Cursor Notion 编程助手工作流智能体

推荐理由：Notion团队用Cursor自动处理bug和功能请求，连PR都自动开，省掉了手动交接的功夫，值得试试。

原文

02:41

DeepLearning.AI@DeepLearningAI

DeepLearning.AI 发起7天语音AI构建挑战，教你用编码代理自动提醒而不必盯着终端。活动截止日期为6月30日。参与者将学习如何让AI主动呼叫你，解放监控终端的负担。

技巧 DeepLearning.AI 语音AI 编码代理挑战赛

推荐理由：DeepLearning.AI 搞了个7天挑战，教你用语音AI让编码代理自动呼叫你，不用死守终端。活动到6月30日截止，想学赶紧上车。

原文

02:37

AK@_akhaliq

阿里发布Qwen-AgentWorld，一个基于Qwen的语言世界模型，专为通用智能体设计。该模型旨在帮助智能体理解环境动态并做出决策。目前尚未公开具体的基准测试结果或性能数据。

AI模型 Qwen-AgentWorld Qwen 阿里智能体世界模型

推荐理由：阿里出了AgentWorld世界模型，让智能体能更好地理解环境，做Agent开发的朋友可以关注一下。

原文

02:35

Notion@NotionHQ

Notion 宣布与 Claude 集成，用户可在文档中直接调用 Claude。Claude 能读取用户代码库，根据粗略的 PRD 自动补全技术细节，并原地更新文档。该功能支持团队成员在文档内编辑和评论，提升技术文档编写效率。

AI产品 Notion Claude PRD 代码库文档协作

推荐理由：Notion 这次把 Claude 直接嵌入文档，你给个毛坯 PRD，它读你代码库帮你填成精装版，团队还能直接改，写技术文档省事了。

原文

02:34

Notion@NotionHQ

Notion 宣布在其平台中集成 Claude 智能体，允许用户创建定制化的 AI 助手。这些智能体可专门用于数据分析、编程、制作电子表格和幻灯片等任务。用户可以将智能体放置在共享任务板上，与团队成员一起协作。智能体之间能够链式工作、互相传递任务，实现24小时不间断自动运行。

AI产品 Notion Claude 智能体团队协作

推荐理由：Notion 现在能创建 Claude 智能体了，你可以定义专门干数据分析、写代码的助手，还能把它们和团队放在一起自动跑流程，24小时不停工。

原文

02:34

Notion@NotionHQ

Notion 发布新功能，允许用户为每个 agent 独立设置上下文与权限，控制 agent 可访问的数据和操作能力。团队管理者可查看每次 agent 运行的完整日志，确保透明度和安全性。该功能旨在简化真实工作委托，让用户放心将任务交给 agent 执行。

AI产品 Notion Agent 权限上下文

推荐理由：Notion 现在能精细控制每个 agent 能看什么、做什么，团队还能追踪每次运行记录，用起来更放心。

原文

02:32

Notion@NotionHQ

Notion发布External Agents功能，首批集成Claude（Anthropic）和Cursor（编程助手）两个AI智能体。用户可以在团队共享看板上为智能体分配任务，通过@提及就像调用同事一样。智能体独立运行并完成任务，视频展示了Claude与Cursor在Notion中的实际协作过程。该功能将AI代理直接融入Notion协作工作流，无需切换应用。

AI产品 Notion Claude Cursor 智能体集成

推荐理由：Notion现在能让Claude和Cursor像队友一样被@去干活，团队看板上直接指派任务，超方便。

原文

02:27

Greg Brockman@gdb

72°

OpenAI推出新版GPT-5.5 Instant，对话体验更风趣。模型能更好理解用户问题意图并动态调整回应。它处理复杂约束更可靠，购物和本地推荐也更实用。今天向付费用户开放，明天免费用户可用。

AI产品 GPT-5.5 Instant OpenAI 对话模型推荐系统

推荐理由：OpenAI把GPT-5.5 Instant升级了，聊天更带劲，能猜准你心里想啥，推荐东西也更靠谱，免费党明天就能体验。

原文

02:24

Clement Delangue@ClementDelangue

精选

Kog在HuggingFace上开源了其2B参数模型，该模型此前被用于演示，运行速度达到3000+ tokens每秒。开源模型可供开发者下载和部署，适用于快速推理场景。

AI模型 Kog HuggingFace 2B模型开源模型推理速度

推荐理由：Kog开源了一个2B模型，每秒能处理3000多个token，适合需要高速推理的任务。

原文

02:12

OpenAI@OpenAI

73°

OpenAI发布新版GPT-5.5 Instant，提升了理解问题意图和自适应回答的能力。新模型能更可靠地处理复杂约束，并让购物与本地推荐更实用连贯。该版本今天向付费用户推送，明天向免费用户开放。

AI模型 GPT-5.5 OpenAI 推理模型对话体验

推荐理由：聊天更懂你，推荐更靠谱，免费用户明天就能用上，赶紧试试。

原文

01:39

Philipp Schmid@_philschmid

83°

Google 在 Gemini 3.5 Flash 模型中内置了计算机使用功能，代理可接收屏幕和目标后自主执行操作。支持浏览器、手机（安卓/iOS）和桌面环境三种模式。内置安全防护、用户确认机制和自动停止功能，并针对提示注入进行了额外训练。开发者演示了让代理自动审计网页、运行代码片段并返回报告。

AI模型 Gemini 3.5 Flash Google 计算机使用智能体

推荐理由：Gemini 3.5 Flash 现在能直接操控你的屏幕，自动干测试网页、点按钮这些活，比普通 AI 助手更像真工具。

原文

01:34

@koltregaskes@koltregaskes

AI产品 Claude Code Claude Fable Anthropic 编程助手

推荐理由：Claude Code更新里挖出了Fable的字符串，Anthropic可能复活这个项目了，开发者可以留意后续动作。

原文

01:31

LangChain@LangChainAI

精选

Jake Broekhuizen在12分钟视频中演示如何让智能体通过记忆更新来改进表现。他介绍使用LangSmith Engine发现运行问题，并将记忆写入Context Hub。这种方法能让智能体在多次运行之间持续优化，而非仅留下痕迹。适合需要在大规模部署中管理智能体记忆的开发者。

技巧 LangChain LangSmith 智能体记忆

推荐理由：想知道怎么让智能体不反复犯同样的错？看LangChain这12分钟视频，教你用LangSmith Engine和Context Hub实现跨运行学习。

原文

01:30

Figma@figma

Figma 在 Config 2026 大会上发布了生成式插件功能。用户只需描述所需的行为、控件和参数，Figma agent 即可自动生成匹配工作流的插件。该功能降低了插件开发门槛，让设计师无需编码也能定制工具。这是 Figma 首次将 AI agent 直接集成到插件创建流程中。

AI产品 Figma Generative plugins Config 2026 AI agent 设计工具

推荐理由：Figma 让你用自然语言描述需求，AI 自动生成插件，省去写代码的麻烦。设计流程定制化从此更简单。

原文

01:28

Guillermo Rauch@rauchg

Vercel AI Gateway 的仪表盘自动显示了 tokens 和 uptime 的恢复数据，效果惊人。用户从 Anthropic API 切换到 Vercel AI Gateway 后，获得了更好的可靠性。这些数据无需手动分析，直接展示在界面上。

技巧 Vercel AI Gateway Anthropic API API网关可靠性

推荐理由：Vercel AI Gateway 自动显示 tokens 和 uptime 数据，切换后可靠性更高，比你手动算省事多了。

原文

01:25

elvis@omarsar0

精选

作者完全改用语音而非文字输入与AI代理交互，发现音频描述越详细、越长，代理结果越好。他还开发了屏幕录制、截图、追踪鼠标动作和语音注释功能，帮助代理处理设计和精确开发任务。多模态提示（语音+屏幕+动作）显著提升了代理的可靠性，尽管消耗更多token。作者将这些经验制作为可复用的命令集，插入循环后效果显著改善。

技巧智能体多模态提示词工程语音交互

推荐理由：有人分享用语音+屏幕录制和多模态提示跟AI代理唠嗑，提示越啰嗦结果越靠谱，还教你怎么录屏加注释，值得试试

原文

01:21

Google DeepMind@GoogleDeepMind

Google DeepMind在播客中讨论AI Agent经济，涉及数百万AI Agent之间的协商、交易和委托。嘉宾weballergy和fryrsquared参与，探讨通过多样化代理决策避免AI群体思维（cognitive monoculture）。重点包括代理安全陷阱和分布式智能概念。

行业 Google DeepMind AI Agent 智能体经济分布式智能

推荐理由：Google DeepMind的播客聊AI agent经济，讲了几百万agent怎么协商交易，还能避免群体思维，想了解智能体协作可以听听。

原文

01:18

Jerry Liu@jerryjliu0

精选

Mistral OCR 在 ParseBench 上与多个前沿和开源权重模型进行对比测试。它在语义格式化方面表现突出，能准确处理删除线、上下标、标题层级和链接。在内容忠实度（阅读顺序、幻觉、遗漏）和视觉定位（边界框）上也具有竞争力。表格处理能力一般，几乎没有图表能力。其价格明显低于 Azure Doc Intelligence 和 AWS Textract 等 OCR 服务商。

AI模型 Mistral OCR ParseBench OCR 语义格式化基准测试

推荐理由：Mistral OCR 在 ParseBench 上语义格式化很强，价格还比 Azure/AWS 便宜，适合做高质量 OCR 又不愿花大价钱的场景。

原文

01:12

NVIDIA AI@NVIDIAAI

76°

NVIDIA 发布了 NeMo AutoModel，基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核，仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分，专为大规模模型构建设计。

AI产品 NeMo AutoModel MoE Hugging Face Transformers v5 训练加速 NVIDIA

推荐理由：NVIDIA 出了个 NeMo AutoModel，基于 Hugging Face Transformers v5，几行代码就能给 MoE 模型训练加速 3 倍以上，搞大模型训练的值得看看。

原文

00:52

berryxia@berryxia

Emil Kowalski的/emil-design-eng技能安装量已突破10万次。他正在开发更细分的设计工程skills，目标是让AI agent在设计任务上输出更精准、可控的结果。他投入大量时间进行测试，确保agent输出的一致性和正确性。这标志着高质量agent skills从实验走向规模化。

AI产品智能体设计工程 /emil-design-eng Agent skills 测试验证

推荐理由：想用AI做设计的兄弟，Emil的agent技能已经被10万人验证了，现在他又在搞更细分的，让设计输出更靠谱，值得试试。

原文

00:50

berryxia@berryxia

83°

OpenAI推出自研AI芯片Jalapeño，专用于推理（Inference）场景，设计制造仅用9个月，并由AI辅助完成。该芯片由Broadcom负责生产，目标是将推理成本降低约50%（Broadcom CEO原话）。早期性能数据显示，其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。

AI产品 OpenAI Jalapeño Broadcom 推理芯片芯片设计

推荐理由：OpenAI被推理成本逼急了，自研芯片Jalapeño，9个月流片，性能超Blackwell和TPU还省一半钱，值得看看细节。

原文

00:49

berryxia@berryxia

77°

Qwen团队直接训练了一个语言世界模型Qwen-AgentWorld，核心目标是从头建模环境而非仅训练Agent行为。模型需预测终端输出、网页变化及代码执行后状态，而非单纯学习操作。利用该模型作为模拟器进行可控Sim RL，在某些任务上模拟训练的Agent性能甚至超过真实环境训练的Agent。此外，仅做环境预测的预训练能力可直接迁移到多轮Agent任务，在多个benchmark上取得显著提升，包括未见领域。Qwen开源了35B MoE版本及对应基准。

AI模型 Qwen Qwen-AgentWorld 世界模型 Agent 强化学习

推荐理由：通义千问出了个新模型，不是教Agent怎么动，而是先让模型懂环境变化。用模拟环境练出的Agent反而比真实环境练的还强，还开源了35B版，值得看看。

原文

00:48

LangChain@LangChainAI

精选

LangChain 创始人 Harrison Chase 将于6月24日举办网络研讨会“The Agent Development Lifecycle 101”，阐述构建可靠智能体的五步循环：构建、测试、部署、监控、改进。他强调了首次发布仅是开始，需要可重复的迭代流程来提升智能体性能。该研讨会面向所有构建智能体的团队，提供从工具、上下文、提示到评估的全流程指导。

技巧 LangChain Harrison Chase 智能体开发工作流

推荐理由：Harrison Chase 亲自讲怎么从零搭出靠谱的AI智能体，5步循环+真实案例，做Agent的别错过。

原文

00:47

berryxia@berryxia

精选

Matt Pocock发布/loop-me技能，要求用户先彻底审视日常工作，找出值得委托给AI的重复循环。它采用“grilling”面试法，一次只问一个问题并附带推荐答案，直到模糊点消除。最终产出清晰的workflows/.md规范文件，使实施者无需额外提问即可执行。目的是降低认知负荷，聚焦高价值决策。

技巧 Matt Pocock /loop-me 工作流自动化开发者工具提示词工程

推荐理由：Matt Pocock做了个/loop-me，不是直接替干活，而是帮你把流程理得清清楚楚，AI照着做就行，省心省力。

原文

00:34

AI Breakfast@AiBreakfast

SuperNori 推出首个 Proactive Family AI Agent，专为家庭照料者打造。不同于传统 AI 助手或副驾驶，该 AI 能主动与用户对话，帮助处理家庭事务。产品已开放候补名单，用户可通过 YouTube 视频了解其工作方式。

AI产品 SuperNori 智能体家庭AI 主动式AI

推荐理由：SuperNori 不是普通的助手，是第一个专门为家庭照料者做的主动式 AI，帮你操心家里的大小事。

原文

00:29

向阳乔木@vista8

精选

洪定坤提出用AI生成可交互原型替代PRD，提前暴露分歧。AI开发系统化流程包括AI写Spec、功能实现、Browser Use验证、自动提交上线。Harness基建通过上下文工程、架构约束、团队知识Memory和技术债梳理，将可交付性从40~60分提升至80分。

技巧字节火山引擎洪定坤原型驱动开发 AI开发工作流 Harness基建

推荐理由：字节火山引擎洪定坤分享了三个提升AI开发效率的方法，尤其Harness基建能帮你把交付质量从及格提到优秀。

原文

00:24

OpenRouter@OpenRouterAI

SakanaAI 推出 Fugu Ultra，这是一个多模型协作系统，已在 OpenRouter 平台上线。该系统让多个模型协同工作，旨在超越单一模型性能。它体现了“集体智能”理念，目前可在 OpenRouter 上试用。

AI模型 SakanaAI Fugu Ultra OpenRouter 多模型集体智能

推荐理由：想试试多个模型一起干活的效果？Fugu Ultra 在 OpenRouter 上就能玩，感受集体智能。

原文

00:15

Milvus@milvusio

精选

Milvus团队指出LLM在RAG中频繁引用了不支持的来源。引文失败分为两类：忠实性错误（生成内容与检索文档不符，如模型声称150W功耗但文档只说低功耗）和引文准确性错误（元数据映射错误、缺失引用、幽灵引用、弱支持引用、过度引用）。其中幽灵引用常因索引重建后ID过期导致。修复方案因错误类型而异：忠实性问题调整生成层约束或基座模型，引文准确性问题需工程层修复元数据管理。

技巧 RAG 引文忠实性检索增强生成 Milvus

推荐理由：别总怪模型了，很多引文错误出在工程层。这篇文章帮你分清五种引文故障，对症下药。

原文

00:10

berryxia@berryxia

EverOS 是一个为 AI Agent 设计的开源记忆操作系统，在 ACL 2026 发表。其核心 HyperMem 采用超图结构组织记忆，在长期对话任务中召回率超过 93%，而传统 RAG 约 45%。加上 Skills 自进化策略后，27B 参数模型任务成功率提升 234.8%，性能追平 397B 模型。该项目在 GitHub 获得 7200 星，支持 Claude Code、Codex 等主流框架，安装只需三行命令。

AI模型 EverOS HyperMem ACL 2026 智能体记忆系统

推荐理由：EverOS 开源了，安装三行命令就能让 AI 记住所有对话，27B 小模型靠记忆打败 397B 大模型，试试看。

原文

6月24日

23:40

Geek@geekbb

精选

Pi Coding Agent 的 Web UI 采用双进程架构，会话守护进程与 Web 服务分离，确保 Agent 会话在服务器端持久运行。即使关闭浏览器或重启前端服务，会话也不会中断。该方案支持跨设备监督桌面和服务器上的 AI 编码 Agent，适合需要长期稳定运行编码任务的场景。

技巧 Pi Coding Agent Web UI 双进程架构持久化运行编程助手

推荐理由：Pi Coding Agent 的 Web UI 让你关掉浏览器后编码任务还在服务器跑，跨设备也能接着监督，很实用。

原文

23:29

elvis@omarsar0

Perplexity 发布了新功能 /learn 技能，通过智能体自动生成学习计划。该计划包含一个动态学习中心（artifact），可根据学习者的需求和进度实时调整。目前该功能已在 Perplexity 平台上线，用户可体验个性化学习路径。

AI产品 Perplexity /learn 智能体学习计划个性化

推荐理由：Perplexity 新出的 /learn 技能，能自动帮你制定学习计划，还会根据你学的情况动态调整，比自己瞎找资料高效多了。

原文

23:24

The Rundown AI@therundownai

74°

OpenAI 发布第一代自研芯片 Jalapeño，专为运行 LLM 设计，声称能效比“大幅超越当前最先进水平”。该芯片与 Broadcom 合作，仅用 9 个月完成开发。OpenAI 还利用自身 AI 模型辅助芯片设计与优化。

AI产品 OpenAI Jalapeño Broadcom AI芯片

推荐理由：OpenAI 自己造芯片了，叫 Jalapeño，专门跑大模型，能效比吊打目前最好的，9 个月就和 Broadcom 搞出来了。

原文

23:23

OpenRouter@OpenRouterAI

OpenRouter 发布全新专用 Image API，支持类型化动态能力。该 API 统一接入来自 Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft 和 xAI 共8家提供商的30多个图像生成模型。开发者可通过单一接口调用多种模型，简化多模型集成流程。

AI产品 OpenRouter Image API 图像生成多模型接入模型聚合

推荐理由：OpenRouter 把30多个图像生成模型集中到一个API里，开发者不用挨个对接不同的服务商，省事多了。

原文

22:58

eric zakariasson@ericzakariasson

Gergely Orosz指出Anthropic正从追求最佳模型转向构建工具生态，推出了Slack集成。该集成允许用户在Slack中随时切换不同模型（如GPT-4、Claude等），从而避免对单一模型供应商的依赖。这一策略帮助Anthropic在开发者及非开发者工作流中建立更广泛的集成。推文讨论的Agent目前虽未正式发布，但反映了Anthropic的生态方向。

行业 Anthropic Slack 模型无关智能体

推荐理由：想摆脱模型锁定？看看Anthropic在Slack里的这个集成，能随时切换模型，不用吊死在一棵树上。

原文

22:54

Geek@geekbb

OpenAI宣布推出其首款自研AI芯片Jalapeño，专为LLM工作负载设计，用于支持ChatGPT、Codex、API及未来智能体产品。该芯片由OpenAI从零设计，并与Broadcom合作生产。Jalapeño是OpenAI全栈平台从产品到模型再到基础设施的扩展，旨在扩大AI服务的规模和访问。

AI产品 OpenAI Jalapeño Broadcom AI芯片

推荐理由：OpenAI自己造芯片了，叫Jalapeño，专门跑ChatGPT之类的大模型，和Broadcom合作，以后能更快更便宜地提供服务。

原文

22:46

LangChain@LangChainAI

精选

Jeff Barg在Interrupt会议上透露，Clay每月运行3.5亿个GTM智能体。他指出，缓存可将LLM调用成本降低高达70%。限制工具调用范围不仅能节省成本，还能提升输出质量。在多租户负载下，引入公平队列机制至关重要。

技巧 Clay GTM agents LLM成本缓存工具调用

推荐理由：做AI智能体上线的小伙伴必看，Clay的AI负责人亲自讲了怎么降本70%和优化队列，干货12分钟。

原文

22:40

阿里通义 Qwen@Alibaba_Qwen

精选

Qwen发布Paradigm II，一种基于世界建模的Agent基础模型。它通过单轮环境预测直接测试于多轮工具调用任务，无需Agent强化学习或任务特定调优。在7项基准上均取得提升，域内Terminal-Bench 2.0提升6.3%、SWE-Bench提升3.4%、WideSearch提升12.8%。域外基准Claw-Eval提升11.3%、QwenClawBench提升9.7%、BFCL v4提升9.0%。世界建模将'先预测后行动'内化为可迁移的推理模式。

AI模型 Qwen Paradigm II 推理模型智能体世界模型

推荐理由：Qwen做了个新Agent模型Paradigm II，不用额外训练就在终端、编码、搜索和工具调用任务上全涨分，尤其没见过的任务也管用。

原文

22:39

阿里通义 Qwen@Alibaba_Qwen

精选73°

阿里Qwen团队开源了Qwen-AgentWorld-35B-A3B模型，采用MoE架构，总参数量35B，每次推理激活3B参数，支持256K上下文长度。同时发布了AgentWorldBench基准，用于评估智能体的世界建模能力。该模型在多个现实环境模拟任务上表现优于同等规模模型。相关论文已发布于arXiv，代码和模型权重在GitHub和Hugging Face上开放。

AI模型 Qwen AgentWorld MoE 智能体世界建模

推荐理由：阿里新开源了35B参数的MoE模型，只激活3B，256K超长上下文，配合AgentWorldBench，研究智能体世界建模的赶紧试试。

原文

22:39

阿里通义 Qwen@Alibaba_Qwen

精选71°

Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型，在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标，而非后处理适配。在AgentWorldBench基准上，该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习，效果超过在真实环境中训练。仅通过预测环境的预热训练，无需智能体特定微调，预测知识即可零微调迁移至智能体任务。

AI模型 Qwen-AgentWorld 智能体世界模型模拟环境强化学习

推荐理由：阿里Qwen造了个能模拟7种环境的AgentWorld，在AgentWorldBench上干掉了Claude和GPT最新版，训练智能体不用真实环境也能更强，零微调迁移呢。

原文

22:36

小互@imxiaohu

字节跳动推出新 AI 音乐模型 SeedMusic 1.0 Preview，用户输入一句话提示词即可在 2-3 分钟内生成一首完整歌曲。该模型支持古风、流行等风格混合，效果流畅且节奏感强。测试提示词为“来一首古风歌曲，但有现代流行节奏感”，输出结果朗朗上口。

AI模型 SeedMusic 字节跳动音乐生成 AI创作

推荐理由：字节跳动新出的 SeedMusic 1.0 Preview 能一句话生成完整歌曲，2-3分钟出活，古风混流行节奏的效果挺不错。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。