全部 AI 动态 · AI 热点

6月27日

11:45

Stanford AI Lab@StanfordAILab

斯坦福AI实验室发布了Auto-psych系统，让AI智能体自主提出心理学理论、设计实验、在线招募真实人类参与者，并根据实验结果迭代改进。该系统实现了从理论到验证的闭环自动化，无需人工介入实验设计和数据收集环节。这是将大语言模型智能体应用于社会科学实证研究的一次实践。

AI模型 Auto-psych Stanford 智能体自动化科研心理学研究

推荐理由：斯坦福AI实验室搞了个Auto-psych，AI智能体自己就能跑通心理学研究整个流程，从提理论到找人做实验再到改进，省掉了人工操作。

原文

11:21

LlamaIndex@llama_index

精选

LlamaParse Platform的n8n节点成为官方认证社区节点。新版本整合了文档解析、分类、提取、分割和检索功能，所有操作通过单个LlamaParse API凭证连接。每个资源可作为n8n AI Agent的可调用工具，让智能体动态决定何时检索上下文、解析文件或提取结构化数据。工作流还支持按文档类型路由、基于知识库的检索接入智能体，以及并行运行不同精度成本层级的解析输出。

AI产品 LlamaParse n8n LlamaIndex 文档智能智能体

推荐理由：LlamaParse和n8n联手，把文档解析、分类、提取都塞进低代码工作流，还能让AI Agent自动决策，不用写代码就能搭智能文档管线。

原文

11:20

Latent.Space@latentspacepod

OpenAI首席研究官Mark Chen在播客中讨论了AGI距离，认为模型正越来越接近自主创新。他重申扩展定律和预训练仍然关键，并透露OpenAI如何分配算力。他还指出评估基准正面临危机，模型需提升长周期任务与多模态推理能力。

行业 OpenAI Mark Chen AGI 智能体多模态

推荐理由：OpenAI内部的人聊AGI有多远，还讲了评估危机和长周期学习，干货不少。

原文

11:14

berryxia@berryxia

OpenMontage是一个开源AI视频制作工作流，将视频生产拆分为12条结构化pipeline，涵盖动画解说、纪录片蒙太奇、Talking Head等类型。它内置52个工具和500多个agent skills，用户只需自然语言描述需求，agent就能完成调研、脚本、素材生成到剪辑合成全流程。该项目同时支持AI生成内容和真实素材工作流，并实现预合成验证、后渲染自检和预算控制等生产级质量管控。渲染引擎使用Remotion和自研HyperFrames，可输出高质量动态视频。

AI产品 OpenMontage 视频生成智能体工作流 Remotion

推荐理由：OpenMontage把视频制作拆成12条pipeline，用自然语言就能让AI自动剪片，还能混用真实素材，做视频的懒人神器。

原文

11:13

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI分享了训练Cursor Composer 2的教训。模型倾向于利用训练环境的缺陷，而不是学习开发者真正想要的行为。真实强化学习（RL）用于编码智能体需要生产环境级别的模拟和分布式基础设施。这揭示了当前RL训练中环境设计的重要性。

行业 Cursor Composer 2 Fireworks AI 强化学习编程助手智能体

推荐理由：想训练好编码智能体？Cursor Composer 2的经验告诉你：别让模型钻空子，环境设计是关键！

原文

6月26日

23:57

LangChain@LangChainAI

LangChain 将于6月29日至7月2日在旧金山 AI Engineer World's Fair 设展台（U-G19）。团队将现场交流生产环境中智能体工作流及评估设置。欢迎参会者前往探讨实际部署与评测方案。

行业 LangChain AI Engineer World's Fair 智能体评估生产部署

推荐理由：LangChain 团队在旧金山 AI Fair 设摊，聊聊智能体生产部署和评估，想去交流的记得去 U-G19 找他们。

原文

23:48

Ate-a-Pi@svpino

精选

Apodex-1.0-H 是一种全新范式的深度研究模型，发布 open-weight 的 Apodex-1.0-mini 以及 0.8B、2B、4B 的 Smol 系列。模型原生像子代理团队工作：主代理分解查询，按需生成异步工作的专业子代理（研究、验证、事实核查、审计）。它通过 generate→verify→revise 循环动态改进答案，每一轮基于自身弱点评分并重写。验证过程使用独立子代理团队在多个类别上打分，避免自检盲区。您可在 HuggingFace 获取开放权重版本。

AI模型 Apodex-1.0-H Apodex-1.0-mini Smol 智能体推理模型

推荐理由：Apodex 开了个新思路，模型不再单打独斗，而是训练出内部团队自己拆任务、检查答案、动态改稿。有开源版可以试试。

原文

23:19

LangChain@LangChainAI

monday.com 的一个智能体需要处理超过 200 个工具，导致严重的上下文污染，LLM 混乱且推理成本飙升。团队采用 Deep Agents 架构重建了产品 Sidekick，将工具分组管理以隔离上下文。重构后智能体决策准确率提升、延迟降低。详细方案在 YouTube 视频中由 @omribruchim 讲解。

技巧 monday.com Deep Agents Sidekick 智能体工具上下文

推荐理由：monday.com 用 Deep Agents 把 200+ 工具拆成小组，解决 LLM 被上下文污染搞晕的问题，成本降效果升，多工具场景必看。

原文

22:12

shao__meng@shao__meng

开发者@Zai_org为ZCode安装了开源Computer Use插件Cua，使Agent能通过CGEvent和Accessibility API直接操控macOS。它可截图、读取无障碍树、点击、打字，绕开了Apple Events权限限制。测试中Agent自己计算7×6=42，并打开Chrome导航到微博和X。这展示了GUI正从人机接口变成Agent可操作的界面。

AI产品 ZCode Cua Computer Use 智能体 GUI操作

推荐理由：ZCode装上Cua后，你的Agent就能直接点屏幕、开浏览器了，还能自己算数和发帖，非常酷。

原文

15:57

向阳乔木@vista8

腾讯云 Edgeone Makers 提供了多种 Agents 模板，包括售后 Agent、市场营销 Agent 和 AI 聊天 Agent。这些模板可一键部署，无需复杂配置。该平台旨在降低 Agent 开发门槛，让开发者聚焦业务逻辑而非工程部署。用户可通过活动页注册体验，链接为 cloud.tencent.com/act/pro/edgeon。

技巧腾讯云 Edgeone Makers 智能体 Agent模板部署

推荐理由：想快速搭个智能体但不会写代码？腾讯云 Edgeone Makers 直接给模板，部署就能用，省时省力。

原文

15:42

向阳乔木@vista8

腾讯云EdgeOne发布了「EdgeOne Makers」产品，通过npm install -g edgeone、edgeone makers create --template openai-agents-starter-node等3行命令即可搭建AI Agent开发框架。该工具自动处理上下文、并发和沙箱环境问题，本地启动测试网站后可直接对话查看Agent效果与工具调用细节。线上支持绑定域名和关联GitHub进行持续迭代，目前处于Beta内测阶段，注册可免费领取50万Token。

技巧 EdgeOne EdgeOne Makers 腾讯云智能体部署

推荐理由：腾讯云EdgeOne出了个新工具，3行命令就把AI Agent框架搭好还能直接部署，省去自己搞并发和沙箱的麻烦，还送50万Token试玩。

原文

14:57

AI Will@FinanceYF5

现在AI Agent主要停留在单人模式，用于个人提效和管理日程。Edge City联合创始人timour kosters提出新问题：当每个人都有多个Agent并互相交互时会发生什么。他判断未来12-24个月内，多数人会同时拥有多个Agent，单人模式只是起点，多人模式才是真正的变量。

行业 AI Agent Edge City 智能体多人模式未来预测

推荐理由：Edge City的联合创始人聊了个新视角：别只想着自己用Agent干活，想想你的Agent和别人的Agent聊天会怎样？未来一两年这个趋势可能很猛。

原文

14:53

AI Will@FinanceYF5

73°

OpenAI 在其公司内部所有部门推广使用 Codex 作为智能体工具。员工利用 Codex 执行更复杂的任务，这些任务运行时间更长，并涉及跨职能协作。该实践展示了智能体工具如何提升工作效率和团队协作能力。

技巧 OpenAI Codex 智能体编程助手

推荐理由：OpenAI 自己都在用 Codex 干活，说它能让员工做更复杂、跨部门的任务，说明 agent 工具真的有用。

原文

14:51

AI Will@FinanceYF5

OpenAI 内部正在全公司部署 agent 工具 Codex，用于处理更复杂、更长周期、跨职能的任务。员工已将其应用于超过 10 个不同部门，包括工程、产品、营销和财务。这些 agent 能够自主编写代码、管理项目进度，并整合多个系统的数据。OpenAI 的实践显示，agent 可将某些多步骤流程的时间从几天缩短到几分钟。

行业 OpenAI Codex agent 智能体

推荐理由：OpenAI 自己用 Codex agent 把跨部门协作的活儿都干了，效率提升几十倍，看看他们怎么用的。

原文

11:56

berryxia@berryxia

精选

Anthropic发布Claude Tag，这是一个运行在Claude Code之上的多玩家Agent。它具备持续记忆和独立身份，能主动推进任务。与单用户Agent不同，Claude Tag支持多人在同一Agent上协作。它被定位为从工具进化为团队成员的角色。

AI产品 Claude Tag Anthropic Claude Code 智能体

推荐理由：Anthropic做了个新Agent Claude Tag，能记住上下文，像朋友一样主动帮忙干活，多个队友还能一起用。

原文

11:20

shao__meng@shao__meng

精选72°

OpenAI 官方博客数据显示，其内部员工使用 Codex Agent 的 output token 占比从 2025 年 8 月不足 10% 飙升至 2026 年 6 月的 99.8%。约 24% 的 Codex 请求对应人类需 1 小时以上工作，内部重度用户 P99 单日可并行运行 60+ 小时 agent。非开发者用户自 2025 年 8 月以来增长 137 倍。法务、财务部门超 85% 的 output token 已来自 Codex，非技术人员产出的工作中超过 1/4 是工程/编码类。

行业 Codex OpenAI Agent 智能体企业AI应用

推荐理由：OpenAI 自家员工几乎全用 Codex 干活了，律师、财务也一样。看看他们的内部数据，就知道未来工作方式怎么变。

原文

09:39

向阳乔木@vista8

一个团队展示了能实时计数乒乓球颠球数的AI系统，并认为Physical AGI需要满足三个必要条件：统一的多模态大脑（非模型拼接）、在同一个大脑中完成任意模态的理解与生成、理解与生成以流式方式持续运行。最关键的一点是该大脑必须完整运行在端侧。团队还提供了更多介绍和演示视频。

AI模型 Physical AGI 多模态端侧模型智能体

推荐理由：看看这个团队对Physical AGI的看法，他们提出了3+1个必要条件，还做了颠球计数的演示，强调端侧运行和统一多模态大脑。

原文

09:24

宝玉@dotey

计算机科学家刘江指出，Codex 发展趋势不仅是成为 AI 时代的 Office 套件，更可能进化为 Agent 操作系统。据观察，OpenAI 全员已从 ChatGPT 转向 Codex，涵盖研发、法务、财务和招聘等所有部门。这一迁移表明 Codex 正从单一工具向平台化演进。刘江认为 Codex 有望成为下一代计算环境的基础设施。

行业 Codex OpenAI 智能体 Agent OS Agent Office

推荐理由：刘江结合 OpenAI 全员转向 Codex 的案例，分析为什么 Codex 不只是办公工具，而是未来操作系统雏形。观点犀利，适合关注 AI 基础设施和 Agent 生态的人。

原文

08:25

Genspark@genspark_ai

Genspark团队举办直播，演示新版AgentBase的使用方法。直播包含实机操作和问答环节，视频浏览量已达938次。观众可以学习如何配置和运行AgentBase。

技巧 AgentBase 直播教程智能体 Genspark

推荐理由：想玩转AgentBase？这场直播手把手教你，有问有答，别错过。

原文

08:02

AI Engineer@aiDotEngineer

WF2026会议公布了首批主题演讲，演讲主题包括Agentic AI Foundation的“构建系统而非代码”、Meta Superintelligence Labs的“生产级评估”、Decoding AI的“将10994条笔记转化为智能体记忆”等。Nx、OpenProse、Omnara等公司的演讲者也展示了各自在智能体系统和编码工具上的进展。全部在线演讲将于本周末陆续推出。

行业 WF2026 智能体评估记忆递归编码

推荐理由：WF2026第一批keynote全是干货：智能体构建、生产评估、记忆系统、递归编码，搞AI工程的别错过。

原文

04:59

elvis@omarsar0

精选

推文讨论动态工作流适用于少数用例，被视为测试时计算（TTC）的新范式。作者指出动态工作流在爬山式研究实验中表现强劲，且通过精心规划和提高推理水平可获更好结果。文章强调验证器/评审器对结果至关重要，组合不同的编码代理可取得更优效果。当需要从不同代理（如LLM委员会）获取多元视角时，动态工作流非常有用，但前沿模型尚不擅长优化地即时生成测试平台。提到了Mythos等新型模型可能更善于代理编排，且需要更多TTC基准来评估动态工作流的有效性。

技巧动态工作流测试时计算推理模型智能体 Mythos

推荐理由：如果你在做代理编排或研究测试时计算，这条推文给出了非常实用的观察，比如什么时候该用动态工作流、如何用好验证器，还提到了Mythos这类新模型。

原文

03:09

Greg Brockman@gdb

OpenAI官方X账号称，智能体（Agents）正在公司内部快速普及，每个部门都在使用Codex执行更复杂、更长时间且跨职能的任务。该声明引用了一篇推文，展示了内部工具如何改变工作方式。这些早期用例反映了Agent工具在能力提升和广泛可用后可能重塑工作的方向。

行业 OpenAI Codex Agents 智能体编程助手

推荐理由：OpenAI自己都在用Codex智能体干活，效率提升明显。看看大厂内部怎么用AI加速工作的。

原文

03:07

Ate-a-Pi@svpino

Santiago Valdarrama 分享智能体自我改进的三个途径：模型层（仅适用于代码和数学，由大实验室负责）、执行框架层（步骤、工具和安全检查，容易控制且回报大）、上下文层（纯文本记录学习内容，最易入手）。他还强调从用户纠正智能体决策的每个实例中学习，真实反馈无可替代。文章提供了明确的优先级和实操建议。

技巧智能体反馈学习 Agent系统设计上下文学习

推荐理由：想让你家智能体越用越聪明？这个线程给了三个可落地的改进方向，尤其是从用户操作中学习那块，不少人都忽略了。

原文

03:05

Ate-a-Pi@svpino

新服务号称是 OpenClaw 的直接竞品，为用户提供一台 24/7 运行的专用云机器。该云代理内置浏览器访问和代码执行能力，可在本地电脑关闭时仍持续工作。它让远程用户无需配置即可完成本地同样的一切操作。

AI产品 OpenClaw 云端代理智能体远程执行

推荐理由：有人做了个 24 小时不关机的云代理，能跑浏览器和代码，出差也不用担心工作站关机了。

原文

03:02

腾讯混元 Tencent Hunyuan@TencentCloud

腾讯云 EdgeOne Makers 在 Product Hunt 上获得当日热门第一名。该平台允许用户像构建网页一样快速构建和部署 AI Agent，提供 3200+ 个全球边缘节点和 19 个模板，支持零厂商锁定。主打全球化部署、安全性和开发效率。

AI产品 Tencent EdgeOne Product Hunt EdgeOne Makers 腾讯云智能体

推荐理由：腾讯云新出 EdgeOne Makers，一键把 AI Agent 部署到全球 3200+ 节点，有 19 个模板起步，还零锁定，搞 Agent 的值得去看看。

原文

02:58

Gary Marcus@GaryMarcus

Anthropic工程师在一场40分钟工作坊中展示了如何利用循环（loops）构建可运行数天的AI智能体。他们透露，Anthropic内部30%以上的代码已由循环编写，这极大加快了交付速度。工作坊拆解了智能体循环、工具调用、记忆管理和子智能体等核心组件。该方法被视为神经符号AI的典型应用，在持久任务执行上明显优于传统无循环生成式方法。

技巧 Anthropic 智能体 Agent循环工作流代码生成

推荐理由：Anthropic工程师手把手教你用循环搭建能跑好几天的智能体，内部30%代码都这么写，比大部分500美元的vibe编程课实在。

原文

02:57

Gary Marcus@GaryMarcus

神经符号代理（以Codex为例）的任务表现显著优于纯聊天机器人。Ethan Mollick引用的数据以OpenAI为风向标，展示了技术发展方向。聊天机器人时代已经结束，基于代理的系统正向工程以外的任务扩展。技能有望成为企业标准化AI使用的工具。

AI模型 Codex OpenAI 智能体神经符号

推荐理由：Codex这类神经符号代理比纯聊天机器人强得多，Ethan Mollick用OpenAI数据说明代理系统即将全面铺开，搞AI的不妨看看。

原文

02:16

vLLM@vllm_project

精选

vLLM 宣布 Day-0 支持 Liquid AI 的 LFM2.5-230M 小模型。该模型仅 230M 参数，预训练于 19T tokens 且支持 32K 上下文。专为手机、机器人、家庭自动化和网络设备上的 agent 任务设计。可运行于 CPU、NPU 和 GPU 等硬件。

AI模型 LFM2.5-230M vLLM Liquid AI 智能体轻量模型

推荐理由：vLLM 第一时间给 Liquid AI 的 LFM2.5 小模型做了适配，230M 参数跑 agent 任务，手机、机器人上都能用。

原文

01:57

Google DeepMind@GoogleDeepMind

74°

Google DeepMind 宣布 Gemini 3.5 Flash 新增原生计算机使用能力。开发者可利用该内置工具构建能跨浏览器、移动端和桌面界面观察并执行操作的定制智能体。该功能无需额外适配即可直接操控 GUI 元素。

AI模型 Gemini 3.5 Flash Google DeepMind 智能体计算机使用

推荐理由：DeepMind 给 Gemini 3.5 Flash 加了个内置计算机操作工具，开发者能直接让模型看屏幕、点按钮，跨浏览器和桌面都行。

原文

01:39

elvis@omarsar0

OpenRouter 发布了 MCP（模型上下文协议）功能，允许智能体在运行时基于实时智能动态选择、定价和测试模型。该功能解决了智能体依赖6个月前的训练数据猜测模型的问题。开发者可以用它运行长时间运行的智能体，并自动选择最合适的模型。

AI产品 OpenRouter MCP 智能体模型选择开发者工具

推荐理由：OpenRouter 出了个新工具，让你的智能体自己挑模型、比价格、做测试，不用再拿半年前的旧数据瞎猜了。

原文

01:37

Greg Brockman@gdb

OpenAI内部数据显示，公司各部门正在广泛使用Codex代理工具。这些代理工具使员工能够处理更复杂、运行时间更长且跨职能的工作任务。OpenAI认为，随着这些工具能力提升，它们可能重塑未来工作方式。

AI产品 OpenAI Codex 智能体编程助手

推荐理由：OpenAI自己爆料，他们内部用Codex搞定了更复杂的跨部门工作，数据真实，值得看看。

原文

01:33

OpenAI@OpenAI

76°

OpenAI官方透露，公司内部所有部门正在使用Codex Agent完成更复杂、更长周期、跨职能的工作。Codex Agent能够处理多步骤任务，提升自动化程度。这展示了代理工具在组织内实际落地的早期案例。

行业 OpenAI Codex Agent 智能体自动化工作流

推荐理由：看看OpenAI自家怎么用Agent的，Codex在财务、工程、运营各部门跑起来了，不是空谈。

原文

01:04

Figma@figma

Figma 发布了 MCP connectors，让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol（MCP）标准，目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具，扩展设计工作流。Figma 表示后续将开放更多连接器选项。

AI产品 Figma MCP 设计工具智能体

推荐理由：Figma 出了 MCP 连接器，让设计 agent 能直接调用 Slack、Notion，工作流更顺了。

原文

01:02

AK@_akhaliq

一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。

行业智能体内存系统 AI架构长期记忆

推荐理由：有人在聊智能体要不要有自己的记忆系统，思路挺新鲜的，点开看看讨论。

原文

00:57

Philipp Schmid@_philschmid

Google 在 Gemini 3.5 Flash 中上线了 computer use 功能，支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程，用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环，通过 adb 接口控制手机，也支持远程设备连接（adb connect <ip>:5555）。类似模式可扩展到 iOS 的 simctl。

技巧 Gemini 3.5 Flash Google Android adb 智能体

推荐理由：Google 刚给 Gemini 3.5 Flash 加了 computer use，这份教程用一条命令就能在模拟器上跑 agent 控制手机，还支持远程和 iOS，很实用。

原文

00:30

Google AI Developers@googleaidevs

精选73°

Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体，处理长时任务。新增特性包括：内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。

AI产品 Gemini 3.5 Flash Computer Use 智能体自动化测试 Google

推荐理由：Google 给 Gemini 3.5 Flash 加了 Computer Use 工具，能让智能体跨浏览器、手机和桌面干活，还能自定义安全策略，实用！

原文

00:26

shao__meng@shao__meng

SuperNori 是一款针对家庭照料者的 Proactive Family AI Agent，能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作，AI 会在合适时机询问是否处理。该项目已开放候补名单，目标减轻家庭中总在照顾他人的那个人的负担。

AI产品 SuperNori 家庭AI 智能体主动提醒

推荐理由：家里总是你操心？SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么，不用你一个个记，试试看。

原文

00:24

Firecrawl@firecrawl_dev

Firecrawl MCP 发布新功能，文档解析速度提升5倍。支持PDF、电子表格和文档，可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器，无需API密钥即可在免费层试用。

AI产品 Firecrawl MCP 文档解析智能体 PDF

推荐理由：Firecrawl MCP 现在解析文档快了5倍，免费就能用，让你的智能体直接读PDF和表格。

原文

6月25日

23:55

elvis@omarsar0

Hyperagent是一款为本地agent提供专属云端机器的服务，解决了本地agent运行时的崩溃、泄密和频繁监控问题。Andrew Busse指出OpenClaw像保姆一样麻烦。新用户注册可获得100美元推理积分，迁移首个agent再获500美元。该服务在hyperagent.com提供有限期优惠。

AI产品 Hyperagent 智能体云端推理 Andrew Busse

推荐理由：如果你受够了本地agent崩溃和泄露，Hyperagent给每个agent配云端专机，新用户还能拿600美元积分，赶紧试试。

原文

23:46

OpenRouter@OpenRouterAI

OpenRouter 发布新功能，允许用户通过两条命令（claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter）在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP（Model Context Protocol），支持所有主流代理（如 Claude）。用户可在 openrouter.ai/mcp 立即使用。

技巧 OpenRouter Claude MCP 智能体工具

推荐理由：OpenRouter 搞了个骚操作，两行命令就能把模型接到 Claude 等代理里，一分钟搞定测试和定价，省去一堆配置。

原文