全部 AI 动态 · AI 热点

AITOP

6月26日

00:24

Firecrawl@firecrawl_dev

Firecrawl MCP 发布新功能，文档解析速度提升5倍。支持PDF、电子表格和文档，可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器，无需API密钥即可在免费层试用。

AI产品 Firecrawl MCP 文档解析智能体 PDF

推荐理由：Firecrawl MCP 现在解析文档快了5倍，免费就能用，让你的智能体直接读PDF和表格。

原文

6月25日

23:55

elvis@omarsar0

Hyperagent是一款为本地agent提供专属云端机器的服务，解决了本地agent运行时的崩溃、泄密和频繁监控问题。Andrew Busse指出OpenClaw像保姆一样麻烦。新用户注册可获得100美元推理积分，迁移首个agent再获500美元。该服务在hyperagent.com提供有限期优惠。

AI产品 Hyperagent 智能体云端推理 Andrew Busse

推荐理由：如果你受够了本地agent崩溃和泄露，Hyperagent给每个agent配云端专机，新用户还能拿600美元积分，赶紧试试。

原文

23:46

OpenRouter@OpenRouterAI

OpenRouter 发布新功能，允许用户通过两条命令（claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter）在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP（Model Context Protocol），支持所有主流代理（如 Claude）。用户可在 openrouter.ai/mcp 立即使用。

技巧 OpenRouter Claude MCP 智能体工具

推荐理由：OpenRouter 搞了个骚操作，两行命令就能把模型接到 Claude 等代理里，一分钟搞定测试和定价，省去一堆配置。

原文

23:45

OpenRouter@OpenRouterAI

精选

OpenRouter推出MCP（模型上下文协议），使AI智能体能够直接获取实时模型信息。该工具可动态评估模型价格、性能并测试，替代依赖6个月前训练数据的猜测。集成后智能体可为任务精准选型，提升效率。

AI产品 OpenRouter MCP 智能体模型选择实时模型

推荐理由：OpenRouter新出的MCP能让你的AI智能体实时选模型，不用瞎猜了，还能比价测试，直接集成。

原文

23:37

berryxia@berryxia

Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源，并提供了 GGUF 版本，可在 Ollama、Unsloth 等工具中直接运行。

AI模型 Ornith-1.0 Terminal-Bench SWE-Bench Ollama 智能体

推荐理由：Ornith-1.0 用 RL 教模型搭执行框架，在 SWE-Bench 上表现顶尖，本地党还有 GGUF 版本可玩。

原文

23:24

Guillermo Rauch@rauchg

精选

AI SDK 7正式发布，新增推理控制（reasoning control）和代理级工具审批（agent-level tool approval）功能。支持MCP应用、持久化工作流（durable workflows）和终端UI。还包含文件和技能上传、沙箱支持、测试框架集成及遥测等特性。

AI产品 AI SDK aisdk MCP/工具推理控制智能体

推荐理由：AI SDK 7来了，新增推理控制和代理工具审批，还支持MCP应用和持久化工作流。做AI应用开发的一定要看看。

原文

22:00

LangChain@LangChainAI

精选

LangChain 推文指出通用聊天适合一次性问答，答案出现即结束。专门智能体适合重复性、有固定形状的工作，使用相同工具和格式。智能体能记住线程可能遗忘的上下文，适合多次运行相同流程。

技巧 LangChain 智能体提示词工程

推荐理由：LangChain用一句话说清楚了选择原则：如果下次解释方式一样，就该用智能体，别放聊天里。

原文

17:28

berryxia@berryxia

这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出，作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制（HITL）在关键操作前插入人工检查点。

技巧 MCP Anthropic 智能体智能体循环 RAG

推荐理由：想搭AI智能体但怕底层理论？这篇用7个点讲透架构，从MCP到记忆系统，普通开发者也能快速落地。

原文

17:27

Stanford AI Lab@StanfordAILab

精选

Stanford AI Lab发布OpenThoughts-Agent-v2和OpenThinkerAgent-32B，两者均基于Qwen-3开源数据。在计算控制比较中，该模型在全部训练规模下领先，并在7个agent基准测试上平均得分44.8%。模型在终端使用和编码任务上表现突出，且泛化能力强。

AI模型 OpenThoughts-Agent-v2 Qwen-3 Stanford AI Lab 开源模型智能体

推荐理由：斯坦福开源了新agent模型，基于Qwen-3在7个基准上平均44.8%，小模型也能打，值得一试。

原文

17:08

腾讯混元 Tencent Hunyuan@TencentCloud

腾讯云与明报在2026年学习与教学博览会上联合发布WorkBuddy学习解决方案。该方案基于AI智能体能力，覆盖备课、评分、行政自动化和课堂体验等环节。旨在通过自动化提升学校效率，让教师腾出时间专注于教学核心。

AI产品 TencentCloud Ming Pao WorkBuddy 智能体教育科技

推荐理由：腾讯云和明报联手，WorkBuddy用AI智能体帮老师搞定备课、批改和行政，省时间专心教学。

原文

10:48

AI Will@FinanceYF5

精选

LatentMAS提出让多智能体在隐空间直接传递推理状态，跳过文字编解码。该方法在多个基准上准确率提升13.3%，推理速度提高4.3倍，token用量减少83.7%。LatentMAS无需额外训练，可直接插入现有LLM使用，入选ICML 2026 Spotlight论文。

AI模型 LatentMAS 智能体 ICML 推理模型多智能体

推荐理由：这个新方法让多智能体能悄悄交换推理状态，不用写文字，又快又省token，直接插进现有LLM就能用。

原文

10:25

shao__meng@shao__meng

精选

Matt Pocock 在开源 Skills 系列中增加了新技能「loop-me」，目前处于 in-progress 阶段。该技能在多轮会话中利用当前目录作为有状态工作区，通过「拷问」方式将想法转化为可落地的 workflows/*.md 规格文件。loop-me 与已有的 grill-me 共享拷问纪律，但产出不同：grill-me 对齐任意计划，loop-me 只产出 workflows/*.md。其核心是识别用户生活中可预测的重复模式（职业节奏、早晨例行等），并主动发现用户未意识到的任务，从而委托给 AI agent。项目在 GitHub 上已有 165K star。

技巧 loop-me Skills 智能体工作流提示词工程

推荐理由：如果你总在做重复的杂事，这个新技能 loop-me 能帮你把流程写成规格，然后让 AI 接手，省下大把时间。

原文

09:27

AI Will@FinanceYF5

Google Flow 新功能接入 Google Street View，AI Agent 能直接调用 Google Maps 的实景数据。用户输入具体地点后，Flow 可将虚拟物体（如水母）或角色锚定到真实街景中生成图片或视频。目前该功能仅限美国地区的 Street View 数据。演示表明画面与现实场景融合度高。

AI产品 Google Flow Street View Google Maps 视频生成智能体

推荐理由：Google Flow 现在能让你把水母或角色直接放到家门口街道上，调用真实街景生成画面，玩法很新鲜。

原文

09:25

向阳乔木@vista8

推文将Agent定义为数字化、可随时调用、趋近免费的劳动力。作者提醒不要把人力和Agent的价差当成商业模式。上下文、注意力、信任和品牌不会因模型变便宜而贬值。AI时代人的技能不重要，积极好奇、灵活性和自驱力才是核心。

行业智能体 AI时代劳动力生产要素

推荐理由：Vista8说Agent是新劳动力，别只盯着人机价差，上下文和信任才是真资产。

原文

07:27

Weaviate@weaviate_io

精选

Engram 是 Weaviate 的记忆系统，能主动协调冲突信息。当用户从机器学习工程师晋升为 CEO，Engram 不会简单叠加两条记忆，而是先用 LLM 工具调用判断行动：重写旧记忆为“用户曾是工程师，现升为 CEO”，并删除新重复记忆。这样避免了记忆冗余，保持历史连贯，防止智能体上下文被矛盾事实污染。

AI产品 Engram Weaviate 记忆协调智能体上下文管理

推荐理由：Weaviate 的 Engram 解决了 AI 记忆的一大致命伤——信息冲突。不是简单存两笔，而是主动合成新版本，对做多角色 Agent 的朋友很实用。

原文

07:24

elvis@omarsar0

精选

Eric Xing 等人在 arXiv（编号 2606.23991）发表论文，尝试界定 agent 与 agency 的边界。论文基于笛卡尔哲学和科幻作品，提出分析 agent 架构的五个维度：目标、身份、决策、自我调节和学习。作者认为真正的自主性要求这些结构以特定方式整合。该研究为区分简单的工具调用循环与真正的智能体提供了概念框架。

论文 Eric Xing arXiv 2606.23991 智能体 Agent定义论文

推荐理由：想搞清楚什么才算智能体？这篇论文给出了五个硬指标，比瞎猜管用多了。

原文

06:29

Ate-a-Pi@svpino

作者指出大多数AI智能体在持久记忆方面表现不佳，包括ChatGPT和Claude，它们容易忘记重要细节或抓住无关信息。这种不可靠的持久记忆是这些智能体未能达到承诺效果的关键原因之一。如果Vida能解决记忆持久性问题，作者表示愿意关注。

行业 ChatGPT Claude Vida 智能体持久记忆

推荐理由：有人吐槽现在智能体记忆太拉胯，连ChatGPT和Claude都记不住重点，看看Vida能不能搞定。

原文

04:58

Y Combinator@ycombinator

Taktile 完成 1.1 亿美元 C 轮融资，由 Y Combinator 等支持。该公司为银行和保险公司提供 AI 代理，自动化交易风控、理赔处理和客户入职等决策流程。Taktile 表示，其方案能将原本耗时数周的任务缩短至几分钟。

行业 Taktile 融资智能体金融风控

推荐理由：Taktile 刚拿到 1.1 亿美元 C 轮，用 AI 代理把银行审批从几周缩到几分钟，做金融风控的老铁可以关注。

原文

04:24

elvis@omarsar0

谷歌推出了Gemini 3.5 Flash模型，专注于计算机使用场景的智能体循环和长任务。该模型旨在满足对更强大计算机使用模型的需求，同时保持低成本。用户表示对Gemini 3.5 Flash的效率尚不确定，但赞赏其作为替代选项的出现。

AI模型 Gemini 3.5 Flash Google 智能体工具使用

推荐理由：谷歌新出了一个Gemini 3.5 Flash，专门优化了计算机使用场景，做长任务和智能体循环可能更划算，值得试试。

原文

03:54

Harrison Chase@hwchase17

LangSmith Engine 支持将智能体轨迹追踪到 LangSmith，通过后台分析轨迹自动生成记忆更新建议。更新后的记忆存储在 Context Hub 中，实现类似睡眠时间计算（sleep time compute）的离线记忆优化。该方法由 Harrison Chase 在教程中演示，视频地址附于推文。

技巧 LangSmith 智能体记忆工作流

推荐理由：Harrison Chase 教你用 LangSmith Engine 让智能体在后台自动更新记忆，看完就能上手操作。

原文

03:42

Harrison Chase@hwchase17

文章介绍了智能体记忆管理的三步流程：首先运行智能体，然后分析其运行轨迹，最后基于分析结果更新记忆。该方法由Jake Broekhuizen分享，适用于提升智能体在多次交互中的表现。流程强调了对历史行为的自动化反思和记忆调整，是构建持久性智能体的实用技巧。

技巧智能体 Agent 记忆管理工作流

推荐理由：Jake Broekhuizen分享了一个超实用的Agent记忆循环：跑Agent → 分析记录 → 更新记忆。简单三步，自己也能复现。

原文

03:27

NVIDIA AI@NVIDIAAI

精选

NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3，允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能，如搜索、摘要、警报、报告和片段审查。提供统一开源仓库，附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告，集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别，并取得 SOTA 性能。

AI模型 NVIDIA Metropolis VSS 3 视频搜索智能体

推荐理由：NVIDIA 刚发了 VSS 3，你的编程代理现在能用一句话搜索、总结视频了，新增16种技能和3D追踪，比以前好用得多。

原文

03:01

Nous Research@NousResearch

NousResearch推出名为“creative-ideation”的技能，能分析用户提示词并通过22种来自艺术家和思想家的创意方法论进行路由。该技能旨在平衡可行性与创造力，为AI agent提供新鲜灵感。它解决了现有agent难以理解创意情境的问题，灵感来源涵盖毕加索、达芬奇等大师。

AI产品 NousResearch creative-ideation 提示词工程智能体

推荐理由：你的AI agent总get不到创意？试试NousResearch这个新技能，用22种艺术家方法论帮你调提示词，让输出更有灵感。

原文

02:43

Notion@NotionHQ

Notion 宣布与 Cursor 集成，用户可在任务板上创建专用 Cursor 智能体，覆盖产品开发全生命周期。这些智能体可用于修复 bug、构建功能、审查代码。每次 Cursor 运行结果都会在 Notion 中保持可见、可审查，并与具体任务关联。这一功能将 AI 编程助手直接嵌入项目管理流程。

AI产品 Notion Cursor 编程助手智能体

推荐理由：Notion 把 Cursor 集成进来了，你能在任务板上直接创建 AI 编程助手，修 bug、写功能、审代码一条龙，还很透明。

原文

02:42

Notion@NotionHQ

Notion团队将客户bug或功能请求分配给Cursor agent。agent读取任务简报，在代码库中工作并自动打开PR。该流程让非工程成员也能交接实际工程工作。Cursor作为AI编程助手，可理解上下文并生成代码变更。这展示了AI agent在协作中的实际应用。

技巧 Cursor Notion 编程助手工作流智能体

推荐理由：Notion团队用Cursor自动处理bug和功能请求，连PR都自动开，省掉了手动交接的功夫，值得试试。

原文

02:37

AK@_akhaliq

阿里发布Qwen-AgentWorld，一个基于Qwen的语言世界模型，专为通用智能体设计。该模型旨在帮助智能体理解环境动态并做出决策。目前尚未公开具体的基准测试结果或性能数据。

AI模型 Qwen-AgentWorld Qwen 阿里智能体世界模型

推荐理由：阿里出了AgentWorld世界模型，让智能体能更好地理解环境，做Agent开发的朋友可以关注一下。

原文

02:34

Notion@NotionHQ

Notion 宣布在其平台中集成 Claude 智能体，允许用户创建定制化的 AI 助手。这些智能体可专门用于数据分析、编程、制作电子表格和幻灯片等任务。用户可以将智能体放置在共享任务板上，与团队成员一起协作。智能体之间能够链式工作、互相传递任务，实现24小时不间断自动运行。

AI产品 Notion Claude 智能体团队协作

推荐理由：Notion 现在能创建 Claude 智能体了，你可以定义专门干数据分析、写代码的助手，还能把它们和团队放在一起自动跑流程，24小时不停工。

原文

02:32

Notion@NotionHQ

Notion发布External Agents功能，首批集成Claude（Anthropic）和Cursor（编程助手）两个AI智能体。用户可以在团队共享看板上为智能体分配任务，通过@提及就像调用同事一样。智能体独立运行并完成任务，视频展示了Claude与Cursor在Notion中的实际协作过程。该功能将AI代理直接融入Notion协作工作流，无需切换应用。

AI产品 Notion Claude Cursor 智能体集成

推荐理由：Notion现在能让Claude和Cursor像队友一样被@去干活，团队看板上直接指派任务，超方便。

原文

01:39

Philipp Schmid@_philschmid

83°

Google 在 Gemini 3.5 Flash 模型中内置了计算机使用功能，代理可接收屏幕和目标后自主执行操作。支持浏览器、手机（安卓/iOS）和桌面环境三种模式。内置安全防护、用户确认机制和自动停止功能，并针对提示注入进行了额外训练。开发者演示了让代理自动审计网页、运行代码片段并返回报告。

AI模型 Gemini 3.5 Flash Google 计算机使用智能体

推荐理由：Gemini 3.5 Flash 现在能直接操控你的屏幕，自动干测试网页、点按钮这些活，比普通 AI 助手更像真工具。

原文

01:31

LangChain@LangChainAI

精选

Jake Broekhuizen在12分钟视频中演示如何让智能体通过记忆更新来改进表现。他介绍使用LangSmith Engine发现运行问题，并将记忆写入Context Hub。这种方法能让智能体在多次运行之间持续优化，而非仅留下痕迹。适合需要在大规模部署中管理智能体记忆的开发者。

技巧 LangChain LangSmith 智能体记忆

推荐理由：想知道怎么让智能体不反复犯同样的错？看LangChain这12分钟视频，教你用LangSmith Engine和Context Hub实现跨运行学习。

原文

01:25

elvis@omarsar0

精选

作者完全改用语音而非文字输入与AI代理交互，发现音频描述越详细、越长，代理结果越好。他还开发了屏幕录制、截图、追踪鼠标动作和语音注释功能，帮助代理处理设计和精确开发任务。多模态提示（语音+屏幕+动作）显著提升了代理的可靠性，尽管消耗更多token。作者将这些经验制作为可复用的命令集，插入循环后效果显著改善。

技巧智能体多模态提示词工程语音交互

推荐理由：有人分享用语音+屏幕录制和多模态提示跟AI代理唠嗑，提示越啰嗦结果越靠谱，还教你怎么录屏加注释，值得试试

原文

00:52

berryxia@berryxia

Emil Kowalski的/emil-design-eng技能安装量已突破10万次。他正在开发更细分的设计工程skills，目标是让AI agent在设计任务上输出更精准、可控的结果。他投入大量时间进行测试，确保agent输出的一致性和正确性。这标志着高质量agent skills从实验走向规模化。

AI产品智能体设计工程 /emil-design-eng Agent skills 测试验证

推荐理由：想用AI做设计的兄弟，Emil的agent技能已经被10万人验证了，现在他又在搞更细分的，让设计输出更靠谱，值得试试。

原文

00:48

LangChain@LangChainAI

精选

LangChain 创始人 Harrison Chase 将于6月24日举办网络研讨会“The Agent Development Lifecycle 101”，阐述构建可靠智能体的五步循环：构建、测试、部署、监控、改进。他强调了首次发布仅是开始，需要可重复的迭代流程来提升智能体性能。该研讨会面向所有构建智能体的团队，提供从工具、上下文、提示到评估的全流程指导。

技巧 LangChain Harrison Chase 智能体开发工作流

推荐理由：Harrison Chase 亲自讲怎么从零搭出靠谱的AI智能体，5步循环+真实案例，做Agent的别错过。

原文

00:34

AI Breakfast@AiBreakfast

SuperNori 推出首个 Proactive Family AI Agent，专为家庭照料者打造。不同于传统 AI 助手或副驾驶，该 AI 能主动与用户对话，帮助处理家庭事务。产品已开放候补名单，用户可通过 YouTube 视频了解其工作方式。

AI产品 SuperNori 智能体家庭AI 主动式AI

推荐理由：SuperNori 不是普通的助手，是第一个专门为家庭照料者做的主动式 AI，帮你操心家里的大小事。

原文

00:10

berryxia@berryxia

EverOS 是一个为 AI Agent 设计的开源记忆操作系统，在 ACL 2026 发表。其核心 HyperMem 采用超图结构组织记忆，在长期对话任务中召回率超过 93%，而传统 RAG 约 45%。加上 Skills 自进化策略后，27B 参数模型任务成功率提升 234.8%，性能追平 397B 模型。该项目在 GitHub 获得 7200 星，支持 Claude Code、Codex 等主流框架，安装只需三行命令。

AI模型 EverOS HyperMem ACL 2026 智能体记忆系统

推荐理由：EverOS 开源了，安装三行命令就能让 AI 记住所有对话，27B 小模型靠记忆打败 397B 大模型，试试看。

原文

6月24日

23:29

elvis@omarsar0

Perplexity 发布了新功能 /learn 技能，通过智能体自动生成学习计划。该计划包含一个动态学习中心（artifact），可根据学习者的需求和进度实时调整。目前该功能已在 Perplexity 平台上线，用户可体验个性化学习路径。

AI产品 Perplexity /learn 智能体学习计划个性化

推荐理由：Perplexity 新出的 /learn 技能，能自动帮你制定学习计划，还会根据你学的情况动态调整，比自己瞎找资料高效多了。

原文

22:58

eric zakariasson@ericzakariasson

Gergely Orosz指出Anthropic正从追求最佳模型转向构建工具生态，推出了Slack集成。该集成允许用户在Slack中随时切换不同模型（如GPT-4、Claude等），从而避免对单一模型供应商的依赖。这一策略帮助Anthropic在开发者及非开发者工作流中建立更广泛的集成。推文讨论的Agent目前虽未正式发布，但反映了Anthropic的生态方向。

行业 Anthropic Slack 模型无关智能体

推荐理由：想摆脱模型锁定？看看Anthropic在Slack里的这个集成，能随时切换模型，不用吊死在一棵树上。

原文

22:40

阿里通义 Qwen@Alibaba_Qwen

精选

Qwen发布Paradigm II，一种基于世界建模的Agent基础模型。它通过单轮环境预测直接测试于多轮工具调用任务，无需Agent强化学习或任务特定调优。在7项基准上均取得提升，域内Terminal-Bench 2.0提升6.3%、SWE-Bench提升3.4%、WideSearch提升12.8%。域外基准Claw-Eval提升11.3%、QwenClawBench提升9.7%、BFCL v4提升9.0%。世界建模将'先预测后行动'内化为可迁移的推理模式。

AI模型 Qwen Paradigm II 推理模型智能体世界模型

推荐理由：Qwen做了个新Agent模型Paradigm II，不用额外训练就在终端、编码、搜索和工具调用任务上全涨分，尤其没见过的任务也管用。

原文

22:39

阿里通义 Qwen@Alibaba_Qwen

精选73°

阿里Qwen团队开源了Qwen-AgentWorld-35B-A3B模型，采用MoE架构，总参数量35B，每次推理激活3B参数，支持256K上下文长度。同时发布了AgentWorldBench基准，用于评估智能体的世界建模能力。该模型在多个现实环境模拟任务上表现优于同等规模模型。相关论文已发布于arXiv，代码和模型权重在GitHub和Hugging Face上开放。

AI模型 Qwen AgentWorld MoE 智能体世界建模

推荐理由：阿里新开源了35B参数的MoE模型，只激活3B，256K超长上下文，配合AgentWorldBench，研究智能体世界建模的赶紧试试。

原文

22:39

阿里通义 Qwen@Alibaba_Qwen

精选71°

Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型，在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标，而非后处理适配。在AgentWorldBench基准上，该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习，效果超过在真实环境中训练。仅通过预测环境的预热训练，无需智能体特定微调，预测知识即可零微调迁移至智能体任务。

AI模型 Qwen-AgentWorld 智能体世界模型模拟环境强化学习

推荐理由：阿里Qwen造了个能模拟7种环境的AgentWorld，在AgentWorldBench上干掉了Claude和GPT最新版，训练智能体不用真实环境也能更强，零微调迁移呢。

原文