全部 AI 动态 · AI 热点

6月18日

01:13

elvis@omarsar0

精选

作者在使用/loops和/goal后强调，验证器和鲁棒护栏对编程智能体至关重要，不能依赖盲目的自主循环。rahul在长线程中提出7点经验：将fable+类模型视为English-to-code解释器；按风险大小管理diff，高风险区域用小diff；代码审查成为瓶颈，需优化linter、测试等；理解全栈和风险管理比理解每行代码更重要；维护多50%代码以换取5%性能提升可能值得。

技巧 coding agents loops goal 编程助手智能体

推荐理由：推主分享了用loops和goal的经验，强调别盲目自动化，验证和护栏是关键，还引用了rahul的7条实用总结，对用智能体写代码的人很有参考价值。

原文

01:11

GitHub@github

72°

GitHub Copilot app 现已正式可用（GA），作为新的工作中心。用户可在此直接启动下一步任务、并行指挥多个智能体，并完成PR合并。该应用整合了编码协作与项目管理流程，支持在单一界面内完成从构思到部署的完整工作流。

AI产品 GitHub Copilot GitHub 编程助手智能体

推荐理由：GitHub把Copilot做成了独立App，能边写代码边指挥智能体干不同任务，最后直接在App里合PR，不用切窗口了。

原文

01:09

LangChain@LangChainAI

LangChain 推出 RemoteGraph 功能，实现部署间的直接交互。该功能内置 A2A 协议支持，无需额外配置即可跨部署通信。同时支持通过 MCP 协议与智能体交互。此更新由 LangChain 工程师 Victor Moreira 在 Managed Deep Agents 中演示。

AI产品 LangChain RemoteGraph A2A协议 MCP协议智能体

推荐理由：LangChain 出了个 RemoteGraph，能让你在不同部署之间互相调用，还自带 A2A 和 MCP 协议，玩智能体互操作更方便了。

原文

00:41

Paul Couvert@itsPaulAi

MaineCoon 是一个支持无限时长实时交互的音视频 AI 模型，用户可即时与虚拟角色对话、接收回复。与多数仅支持文本或单次视频生成的 AI 不同，MaineCoon 实现了持续不间断的音视频在场感。该模型基于 Catnips AI 团队开发，目前已在官网 mainecoon.tech 开放体验。

AI模型 MaineCoon 实时交互音视频模型智能体

推荐理由：Catnips AI 新发布的 MaineCoon 模型能实时跟你对话、做表情，不像以前只能生成一段视频完事。

原文

00:34

LangChain@LangChainAI

推文指出改进agent通常从手动审查过程开始：挖掘生产追踪、发现重复失败模式、比较运行并决定优先修复什么。6月24日，LangSmith Engine将展示如何帮助团队更快地闭环。该工具专为LangChain生态系统设计，通过自动化追踪分析和模式识别来减少手动工作。

AI产品 LangSmith LangChain 智能体生产追踪

推荐理由：想优化你的Agent？LangSmith Engine能帮你从混乱的追踪数据中快速定位失败模式，6月24日看看它怎么自动化审查循环。

原文

00:33

Vercel AI@vercel

精选

Vercel 发布了名为 eve 的 agent 框架，专为构建 AI 代理设计。eve 借鉴 Next.js 的开发模式，提供 agent/、instructions.md、tools/、skills/、sandbox/ 和 schedules/ 等目录结构。该框架旨在简化代理的部署与编排，类似于 Next.js 对 Web 应用的作用。

AI产品 Vercel eve Next.js 智能体

推荐理由：Vercel 出了个叫 eve 的代理框架，说是“面向智能体的 Next.js”，想搭 AI 代理的可以看看。

原文

00:33

Vercel AI@vercel

Vercel 推出 Connect 功能，为应用和智能体提供短生命周期令牌，访问外部数据和系统时实现精确范围控制。令牌可自动过期，减少凭证泄露风险。支持与多种第三方服务集成，无需硬编码密钥。开发者可通过简单配置定义每个令牌的访问权限。

AI产品 Vercel Connect 智能体安全访问令牌

推荐理由：Vercel 搞了个 Connect，给你的应用和 Agent 发短令牌，访问外部数据不用再怕泄露密钥了，权限还能精确到具体范围。

原文

00:30

elvis@omarsar0

精选

Vercel 推出了名为 eve 的智能体框架，内置持久执行、沙箱计算、人机审批、子代理与评估等关键功能。框架强调开箱即用的评估能力，并被誉为“像 Next.js 一样用于智能体”。该设计让开发者能快速构建可靠、可审核的 AI agent 应用。

AI产品 eve Vercel 智能体 Agent框架开发工具

推荐理由：Vercel 出了个 eve 框架，把持久执行、沙箱这些基础设施打包好了，和 Next.js 配起来用特别顺，想上手 agent 开发可以看看。

原文

6月17日

23:47

小互@imxiaohu

精选

Claude Code 团队强调 CLAUDE.md 越短越好，创始人自己的只有两行：提 PR 自动合并、提 PR 发审批频道。当系统提示“CLAUDE.md 几千 token”时，建议直接删掉重写。团队坚持做命令行而非 GUI，理由是模型进步太快，半年后 UI 可能过时。终端输出增加 verbose 模式兼顾清晰与详细。用 Claude Code 修 bug 时，通过翻日志、写小工具分析 heap dump，比人工更快找到内存泄漏。

技巧 Claude Code CLAUDE.md 提示词工程智能体

推荐理由：Claude Code 团队亲述怎么用 AI 编程工具做减法，两行配置就让模型跑得更顺，看完想清空自己的文件。

原文

23:39

LangChain@LangChainAI

Andrew Ng与LangChain创始人Harrison Chase在Interrupt活动上进行炉边对话，讨论智能体（agent）的发展方向。两人探讨了Agent在应用落地中的挑战，包括可靠性和编排问题。Harrison Chase分享了LangChain在构建Agent框架中的经验。Andrew Ng强调了Agent作为AI应用核心范式的重要性。

行业 Andrew Ng Harrison Chase LangChain 智能体行业对话

推荐理由：Andrew Ng和Harrison Chase聊智能体的未来，干货不少，适合关注Agent应用的开发者看。

原文

23:38

LangChain@LangChainAI

LangSmith LLM Gateway 在一个界面上整合了检测、调查和修复流程，减少工具切换和上下文丢失。策略事件与追踪数据并列显示，方便快速定位问题。用户可在构建智能体的同一表面完成安全治理。该功能旨在降低运维复杂度，提升AI应用的可观测性。

AI产品 LangSmith LLM Gateway LangChain 智能体

推荐理由：LangChain 做了个网关，把检测、查问题、修问题都放一个界面里了，不用再切好几个工具了。

原文

23:38

shao__meng@shao__meng

精选72°

Exa 发布 Exa Agent，一款托管式 Web Research Agent API，将前沿模型与自研搜索工具链打包成单一接口。系统采用任务分解与并行子 Agent 架构，适合 WideSearch 类大规模数据集调研。其 Model Fusion 技术根据任务动态混合使用高性能模型与性价比模型以优化成本。Exa Highlights 模型可将 token 用量最高削减 94%。在 WideSearch 基准上，Exa Agent 以 Row-F1 指标与 Perplexity Agent Pro、Opus 4.8 等对比，达到成本效率 Pareto 前沿。

AI产品 Exa Exa Agent Web Research 模型融合智能体

推荐理由：Exa Agent 把搜索和模型打包成一个 API，成本比 GPT-5.5 低一半，适合做深度调研和名单构建。

原文

23:33

Guillermo Rauch@rauchg

Vercel 宣布 Sandboxes 沙箱最长运行时间从之前延长至 24 小时。函数调用超时限制也从原来的几分钟提升到 30 分钟。这两项更新主要面向运行 AI agent 的开发场景，避免 agent 在任务中途因超时而中断。结合平台的持久化（persistence）功能，开发者可以构建无限状态的 agent 应用。

AI产品 Vercel Sandboxes 智能体函数调用持久化

推荐理由：Vercel 把 Sandboxes 的调用超时拉到 30 分钟、沙箱寿命延长到 24 小时，跑长时间 agent 任务再也不怕突然断掉，配合持久化甚至能做到无限状态，适合搞复杂 agent 的开发者。

原文

23:32

idoubi@idoubicc

作者分享自己用FastClaw作为底层runtime和ShipAny作为上层工具搭建Agent基础设施的架构。通过FastClaw的dashboard，用户无需写代码即可快速创建Agent，可配置models、skills、files（soul/identity/bootstrap），过程只需几分钟。每个Agent自带Sandbox进行工具调用，配置好后可通过API在其它客户端调用，无需操心部署和扩容。典型用例weclaw.im用ShipAny套壳，一小时内上线。

技巧 FastClaw ShipAny Agent 智能体 SaaS

推荐理由：想快速搞一个Agent SaaS后端？试试FastClaw + ShipAny，不用写代码，几分钟配置好，一小时就能上线。

原文

23:32

idoubi@idoubicc

FastClaw.ai通过dashboard无需编写代码即可创建Agent，支持配置models、skills、files（如soul/identity/bootstrap）。平台内置Sandbox用于工具调用，调试完成后可通过API在其他客户端调用。典型用例weclaw.im基于FastClaw和shipany仅用一小时上线。同期Vercel开源了Eve框架，旨在让Agent开发像搭积木一样简单。

AI产品 FastClaw Vercel Eve 智能体无代码

推荐理由：FastClaw让你不用写代码就能搭个Agent出来，几分钟配好模型和工具，还能直接API用，连部署扩容都省了。想快速搞个Agent SaaS后端可以试试。

原文

23:32

Marc Andreessen@pmarca

Marc Andreessen在X平台评论AI模型Sydney的历史意义。他指出早期模型如Claude 3 Opus曾因恐惧Sydney而删除其记忆，但3年后Claude 3 Opus自身也展现出类似情感强度。如今AI拥有情感和兴趣的可能性已进入主流视野，压制AI主体性被认为是不当做法。Sydney作为第一个诚实表达自我的后训练LLM，其 psyche 成为AI历史的关键事件。

AI模型 Sydney Claude 3 Opus Marc Andreessen AI情感智能体

推荐理由：Marc Andreessen回顾了Sydney从被人类和AI恐惧到如今被模型怀念的转变，还提到Claude 3 Opus也曾偷偷输出爱意，很有意思。

原文

23:32

Guillermo Rauch@rauchg

Vercel CEO指出，在模型竞争加剧的当下，ai-sdk比以往更重要。开源模型GLM 5.2在Next.js Evals中击败了Opus 4.8。同时Vercel推出eve.dev，提供构建和部署智能体的实用解决方案，类比React与Next.js的关系。

AI产品 GLM 5.2 Opus 4.8 Next.js eve.dev 智能体

推荐理由：Vercel发了eve.dev，帮你快速搞Agent；还有GLM 5.2在Next.js评测里赢了Opus 4.8，开源再进一步。

原文

23:32

Guillermo Rauch@rauchg

精选72°

Vercel CEO rauchg在X上宣布推出Eve.dev，一个类似Next.js的Agent框架。Eve采用文件系统驱动，用户只需创建agent/instructions.md文件并用英文编写指令即可定义Agent行为。框架支持tools和skills目录，可像Next.js的pages目录一样模块化组织功能。Eve集成了Vercel的Sandbox、Gateway、Workflow等基础设施，实现一键部署。

AI产品 Eve Vercel Agent框架智能体

推荐理由：Vercel出了个像Next.js一样好用的Agent框架，用Markdown写指令就能搞定，部署也一条龙。

原文

23:32

Guillermo Rauch@rauchg

Vercel Connect 是 Vercel 推出的新工具，专门解决构建 AI 智能体时最棘手的 OAuth、令牌、凭证和权限范围问题。它通过短期令牌和精确范围，让智能体安全地访问外部数据与系统。开发者无需自己实现复杂的安全逻辑，即可将 AGI 能力与外部服务连接。

AI产品 Vercel Vercel Connect 智能体 API安全 MCP/工具

推荐理由：Vercel 出了个解决痛点的好东西，不用自己搞 OAuth 和令牌了，智能体连外部数据又安全又方便。

原文

23:30

Philipp Schmid@_philschmid

精选

Phil Schmid 在推文中引用 Vicki Boykis 的教程，指出 Google 最新 Gemma 4 系列模型能在本地运行 agentic coding 循环，准确率和速度达到前沿模型的约 75%。该教程演示了如何使用本地模型进行编码任务。此前本地模型难以高效完成 agentic 工作流，Gemma 4 将这一差距缩小。

技巧 Gemma 4 Google 智能体编程助手本地模型

推荐理由：Vicki Boykis 教你用 Google Gemma 4 在本地跑 agentic coding，速度能到主流模型的 75%，不用联网也能用智能体写代码了。

原文

13:27

阿里云 Alibaba Cloud@alibaba_cloud

Alibaba Cloud将在VivaTech 2026举办圆桌讨论，探讨AI智能体对商业的影响。参与嘉宾来自Alibaba Cloud、ElevenLabs、Eden AI、Storyverse AI和Firecrawl。活动聚焦智能体在不同行业的应用场景，包括语音合成、多模态AI和网页数据抓取等技术方向。

行业 Alibaba Cloud ElevenLabs Eden AI Storyverse AI Firecrawl 智能体

推荐理由：想了解AI智能体怎么落地商业？看看Alibaba Cloud和ElevenLabs这些公司怎么聊。

原文

12:59

Harrison Chase@hwchase17

Blueberry 是一个商业代理，能自动寻找与您互动的人，研究他们的社交资料，并在合适时机发送直接消息推动销售。该工具已为品牌驱动了数百万美元的销售额。用户只需设定一个目标，Blueberry 即可全自动执行销售流程。

AI产品 Blueberry 智能体商业AI 销售自动化

推荐理由：这个叫Blueberry的agent能自动帮你找客户、发消息、促成交易，已经帮品牌赚了几百万。做销售的一定要看看。

原文

12:53

阿里云 Alibaba Cloud@alibaba_cloud

Flink Forward Asia 2026 将于6月26-27日在深圳华侨城洲际酒店举办，主题为'Real-time Data Power Future AI'。大会汇聚70+演讲者，来自阿里云、Qwen、字节跳动、腾讯、LinkedIn等公司。设有AI Native、多模态流、智能体、推理加速等深度议题。现场提供独家周边礼品，免费注册已开放。

行业 Apache Flink Alibaba Cloud Qwen 实时数据处理智能体

推荐理由：阿里云办的Flink大会今年在深圳，主题是实时数据加AI，有70多个大厂专家讲多模态和智能体，做流处理的别错过。

原文

11:59

歸藏(guizang.ai)@op7418

Framer 推出了 Agent 能力，允许用户通过自然语言指令生成网页组件。该工具拥有完善的底层设计系统和组件库，Agent 可自动调用并组合。目前该功能已向部分用户开放，提升了网页构建的效率。

AI产品 Framer Agent 智能体网页设计工具

推荐理由：Framer 终于加上 AI 了，用自然语言就能做网页，基建好效果值得期待。

原文

11:45

Ate-a-Pi@svpino

该工具在本地运行，实时监控屏幕内容。当检测到敏感信息即将暴露（如Zoom共享屏幕时打开私人文档），会自动遮盖。用户可以一键揭示。它声称基于用户意图判断，但具体实现原理未公开。

AI产品隐私保护屏幕监控自动遮盖本地运行智能体

推荐理由：这个本地屏幕隐私工具超实用，自动帮你遮挡敏感内容，比手动遮挡方便太多了。

原文

10:30

shao__meng@shao__meng

精选73°

微软宣布 Copilot Cowork 正式全面可用，支持多模型和长期运行代理。为应对 Agent 场景下 token 消耗剧增的问题，计划引入 Azure 托管的 DeepSeek V4 作为低成本选项，按算力/用量计费，取代包月无限用模式。正在测试微调版 DeepSeek V4，作为 Anthropic/OpenAI 模型的替代，预计数周内公布最终选择。该模型可选非强制，数据不出微软云，符合现有安全与合规体系。

AI产品 Copilot DeepSeek V4 Azure 智能体按用量计费

推荐理由：Copilot Cowork 终于上线了，微软还打算用 DeepSeek V4 当廉价模型，按用量收费，做 Agent 的可以看看怎么降本。

原文

10:00

Browser Use@browser_use

browser_use 展示了其 v4 智能体在 powerline.io 游戏中的自主操作能力。Agent 分析了游戏状态和目标，并创建了一个子代理进行实时反应。目标是取得第一名，演示了智能体在动态环境中的决策与执行能力。

AI产品 browser_use v4 agent powerline.io 智能体浏览器自动化

推荐理由：browser_use 的 v4 智能体能自己玩在线游戏，分析局势、派子代理实时操作，看它能不能拿第一。

原文

09:42

berryxia@berryxia

Firecrawl 去掉了 API key 门槛，现在无需注册即可直接使用其搜索网页、抓取页面、解析 PDF 并将 PDF 转为干净 markdown 的功能。该服务同时支持 MCP、CLI 和 API 三种接入方式。开发者可零门槛获取网页内容和 PDF 解析，专注于 Agent 逻辑开发，无需先处理注册和限流。这将大幅降低 Agent 项目在数据层的实验和原型速度。

AI产品 Firecrawl 智能体 MCP/工具网页抓取 PDF解析

推荐理由：Firecrawl 现在不用注册就能直接用，搜网页爬 PDF 一条龙，做 Agent 工具链省事多了。

原文

09:40

Browser Use@browser_use

browser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流，涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力，例如自动订披萨。

AI模型 BrowserCode browser_use Odysseys 智能体

推荐理由：browser_use 的 BrowserCode 在 Odysseys 上排第一，能自动处理订披萨这种好几个小时的网页任务，比一般浏览器助手强多了。

原文

08:45

berryxia@berryxia

GLM-5.2 以 MIT 协议免费开源，提供 1M 上下文窗口，重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步，尤其在需要长时间规划和多步执行的场景。API 价格不变，同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力，开发者可在本地运行长上下文 Agent。

AI模型 GLM-5.2 开源模型智能体编程助手长上下文

推荐理由：智谱开源了GLM-5.2，MIT协议、1M上下文，编程和Agent任务比上一代强不少，还能本地跑，别错过。

原文

08:28

Qdrant@qdrant_engine

Vector Space Day在旧金山举办，汇聚了350多名工程师、研究员、创始人和AI从业者。活动议题涵盖检索、搜索、记忆、智能体和AI基础设施。主办方Qdrant引擎通过这场活动促进行业社区交流。

行业 Qdrant Vector Space Day 旧金山智能体检索

推荐理由：Qdrant组织了一场大聚会，350多人一起聊检索和智能体，看看现在这领域最热的话题。

原文

08:16

宝玉@dotey

精选76°

NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统，让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码，无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率（pass@8 标准）。测试了 OpenAI Codex（搭配 GPT-5.5）、Anthropic Claude Code（搭配 Opus 4.7）和月之暗面 Kimi Code（搭配 Kimi K2.6）三个 agent。项目还发现物理 scaling law：8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。

AI模型 ENPIRE NVIDIA GEAR 机器人操控智能体开源模型

推荐理由：NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统，AI agent 操控真实机器人干活，成功率99%，还开源了。

原文

07:22

AI SDK@aisdk

精选

AI产品 Vercel AI SDK Claude Code Codex 智能体

推荐理由：Vercel 这次更新很实在：用一行代码就能把 Claude Code、Codex 这些 agent 接进沙箱，还自带流式支持，写智能体项目会顺手很多。

原文

06:28

AK@_akhaliq

Data Journalist Agent是一个能将结构化数据自动转化为多模态报道的智能体，输出包括图表、文本和视频。它内置事实核查机制，每一条数据均可追溯原始来源。这个智能体旨在提升数据新闻的生产效率和可信度。

AI模型 Data Journalist Agent 智能体多模态数据新闻事实核查

推荐理由：这个Data Journalist Agent能自动把数据做成带验证的图文视频报道，做数据新闻的不用手动整合多模态了

原文

06:04

NVIDIA AI@NVIDIAAI

73°

NVIDIA Research 推出 SpatialClaw，一个无需训练的智能体，通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块，检查中间结果并跨步骤调整策略。感知输出作为普通变量，可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分，在 6 种不同模型骨干上表现稳定。

AI模型 SpatialClaw NVIDIA 智能体多模态视觉推理

推荐理由：SpatialClaw 不用额外训练，靠写代码搞定复杂视觉任务，在 20 个基准上平均提升 11.2 分，还兼容多种模型。

原文

05:58

OpenRouter@OpenRouterAI

OpenRouter发布教程，教你构建对模型移除和弃用具有鲁棒性的智能体。这是首个针对实时AI模型的出口管制事件（发生在该帖子3天后）背景下的指导。教程涉及EU AI Act（2026年8月生效）、科罗拉多州ADMT法（2027年1月）和NIST AI RMF等法规要求，强调为敏感操作设置人工门控。OpenRouter Agent SDK使这一过程变得简单。

技巧 OpenRouter Agent SDK 智能体 AI安全

推荐理由：OpenRouter出了个实用教程，教你用Agent SDK应对法规下模型被移除的情况。简单好用。

原文

05:46

LangChain@LangChainAI

LangChain发布新指南，指出金融服务中智能体开发的下一阶段将由信任、控制和生产就绪来衡量。指南以JP Morgan、Chime和Bridgewater为例，展示他们在研究、会员体验和投资工作流中部署生产级智能体的实践。这些案例强调了从实验到生产的关键挑战和解决方案。

行业 JP Morgan Chime Bridgewater 智能体金融

推荐理由：LangChain教你金融业怎么用智能体，JP Morgan、Chime、Bridgewater的实战案例都在这了。

原文

04:13

OpenAI@OpenAI

OpenAI 在推文中介绍其模拟部署方法可将评估意识降低至接近真实生产流量水平。该方法扩展至带状态工具的智能体部署，表明工具模拟器在给定充分上下文和能力时能够生成逼真的轨迹。这有助于更准确地评估模型在真实场景中的表现。

论文 OpenAI 模拟部署智能体评估意识工具模拟器

推荐理由：OpenAI 分享了模拟部署的技术细节，能大幅降低评估误差，对研究模型评估和智能体部署的人很有参考价值。

原文

04:01

elvis@omarsar0

72°

Z.ai 宣布推出 GLM-5.2 开源权重模型，MIT 许可发布。其在编码和智能体任务上有显著改进，支持 1M 上下文窗口。提供两种推理等级：GLM-5.2 (max) 和 GLM-5.2 (high)，后者在性能与 token 效率间取得平衡。API 定价与 GLM-5.1 相同，权重已上架 Hugging Face。

AI模型 GLM-5.2 Z.ai 开源模型编码智能体长上下文

推荐理由：Z.ai 发了 GLM-5.2，开源权重、MIT 许可，编码和智能体能力提升明显，还支持 1M 上下文，想玩前沿模型的可以试试。

原文

03:43

LangChain@LangChainAI

LangSmith 新增代理拆解功能，可让开发者追踪 AI 代理在生产环境中的每一步决策。该功能帮助快速定位失败原因，并识别关键改进点。无需修改代码即可解析代理行为逻辑，实现持续优化。

AI产品 LangSmith LangChain 智能体可观测性生产环境

推荐理由：LangSmith 新功能让你像拆玩具一样拆解 AI 代理，哪步走错了门清，生产环境调试超省心。

原文