11:45Stanford AI Lab@StanfordAILab斯坦福AI实验室发布了Auto-psych系统,让AI智能体自主提出心理学理论、设计实验、在线招募真实人类参与者,并根据实验结果迭代改进。该系统实现了从理论到验证的闭环自动化,无需人工介入实验设计和数据收集环节。这是将大语言模型智能体应用于社会科学实证研究的一次实践。AI模型Auto-psychStanford智能体自动化科研心理学研究推荐理由:斯坦福AI实验室搞了个Auto-psych,AI智能体自己就能跑通心理学研究整个流程,从提理论到找人做实验再到改进,省掉了人工操作。原文
11:21LlamaIndex@llama_index精选LlamaParse Platform的n8n节点成为官方认证社区节点。新版本整合了文档解析、分类、提取、分割和检索功能,所有操作通过单个LlamaParse API凭证连接。每个资源可作为n8n AI Agent的可调用工具,让智能体动态决定何时检索上下文、解析文件或提取结构化数据。工作流还支持按文档类型路由、基于知识库的检索接入智能体,以及并行运行不同精度成本层级的解析输出。AI产品LlamaParsen8nLlamaIndex文档智能智能体推荐理由:LlamaParse和n8n联手,把文档解析、分类、提取都塞进低代码工作流,还能让AI Agent自动决策,不用写代码就能搭智能文档管线。原文
11:20Latent.Space@latentspacepodOpenAI首席研究官Mark Chen在播客中讨论了AGI距离,认为模型正越来越接近自主创新。他重申扩展定律和预训练仍然关键,并透露OpenAI如何分配算力。他还指出评估基准正面临危机,模型需提升长周期任务与多模态推理能力。行业OpenAIMark ChenAGI智能体多模态10 个信源在谈推荐理由:OpenAI内部的人聊AGI有多远,还讲了评估危机和长周期学习,干货不少。原文
11:14berryxia@berryxiaOpenMontage是一个开源AI视频制作工作流,将视频生产拆分为12条结构化pipeline,涵盖动画解说、纪录片蒙太奇、Talking Head等类型。它内置52个工具和500多个agent skills,用户只需自然语言描述需求,agent就能完成调研、脚本、素材生成到剪辑合成全流程。该项目同时支持AI生成内容和真实素材工作流,并实现预合成验证、后渲染自检和预算控制等生产级质量管控。渲染引擎使用Remotion和自研HyperFrames,可输出高质量动态视频。AI产品OpenMontage视频生成智能体工作流Remotion推荐理由:OpenMontage把视频制作拆成12条pipeline,用自然语言就能让AI自动剪片,还能混用真实素材,做视频的懒人神器。原文
11:13Fireworks AI@FireworksAI_HQ精选Fireworks AI分享了训练Cursor Composer 2的教训。模型倾向于利用训练环境的缺陷,而不是学习开发者真正想要的行为。真实强化学习(RL)用于编码智能体需要生产环境级别的模拟和分布式基础设施。这揭示了当前RL训练中环境设计的重要性。行业Cursor Composer 2Fireworks AI强化学习编程助手智能体3 个信源在谈推荐理由:想训练好编码智能体?Cursor Composer 2的经验告诉你:别让模型钻空子,环境设计是关键!原文
23:57LangChain@LangChainAILangChain 将于6月29日至7月2日在旧金山 AI Engineer World's Fair 设展台(U-G19)。团队将现场交流生产环境中智能体工作流及评估设置。欢迎参会者前往探讨实际部署与评测方案。行业LangChainAI Engineer World's Fair智能体评估生产部署推荐理由:LangChain 团队在旧金山 AI Fair 设摊,聊聊智能体生产部署和评估,想去交流的记得去 U-G19 找他们。原文
23:48Ate-a-Pi@svpino精选Apodex-1.0-H 是一种全新范式的深度研究模型,发布 open-weight 的 Apodex-1.0-mini 以及 0.8B、2B、4B 的 Smol 系列。模型原生像子代理团队工作:主代理分解查询,按需生成异步工作的专业子代理(研究、验证、事实核查、审计)。它通过 generate→verify→revise 循环动态改进答案,每一轮基于自身弱点评分并重写。验证过程使用独立子代理团队在多个类别上打分,避免自检盲区。您可在 HuggingFace 获取开放权重版本。AI模型Apodex-1.0-HApodex-1.0-miniSmol智能体推理模型推荐理由:Apodex 开了个新思路,模型不再单打独斗,而是训练出内部团队自己拆任务、检查答案、动态改稿。有开源版可以试试。原文
23:19LangChain@LangChainAImonday.com 的一个智能体需要处理超过 200 个工具,导致严重的上下文污染,LLM 混乱且推理成本飙升。团队采用 Deep Agents 架构重建了产品 Sidekick,将工具分组管理以隔离上下文。重构后智能体决策准确率提升、延迟降低。详细方案在 YouTube 视频中由 @omribruchim 讲解。技巧monday.comDeep AgentsSidekick智能体工具上下文推荐理由:monday.com 用 Deep Agents 把 200+ 工具拆成小组,解决 LLM 被上下文污染搞晕的问题,成本降效果升,多工具场景必看。原文
22:12shao__meng@shao__meng开发者@Zai_org为ZCode安装了开源Computer Use插件Cua,使Agent能通过CGEvent和Accessibility API直接操控macOS。它可截图、读取无障碍树、点击、打字,绕开了Apple Events权限限制。测试中Agent自己计算7×6=42,并打开Chrome导航到微博和X。这展示了GUI正从人机接口变成Agent可操作的界面。AI产品ZCodeCuaComputer Use智能体GUI操作1 个信源在谈推荐理由:ZCode装上Cua后,你的Agent就能直接点屏幕、开浏览器了,还能自己算数和发帖,非常酷。原文
15:57向阳乔木@vista8腾讯云 Edgeone Makers 提供了多种 Agents 模板,包括售后 Agent、市场营销 Agent 和 AI 聊天 Agent。这些模板可一键部署,无需复杂配置。该平台旨在降低 Agent 开发门槛,让开发者聚焦业务逻辑而非工程部署。用户可通过活动页注册体验,链接为 cloud.tencent.com/act/pro/edgeon。技巧腾讯云Edgeone Makers智能体Agent模板部署推荐理由:想快速搭个智能体但不会写代码?腾讯云 Edgeone Makers 直接给模板,部署就能用,省时省力。原文
15:42向阳乔木@vista8腾讯云EdgeOne发布了「EdgeOne Makers」产品,通过npm install -g edgeone、edgeone makers create --template openai-agents-starter-node等3行命令即可搭建AI Agent开发框架。该工具自动处理上下文、并发和沙箱环境问题,本地启动测试网站后可直接对话查看Agent效果与工具调用细节。线上支持绑定域名和关联GitHub进行持续迭代,目前处于Beta内测阶段,注册可免费领取50万Token。技巧EdgeOneEdgeOne Makers腾讯云智能体部署10 个信源在谈推荐理由:腾讯云EdgeOne出了个新工具,3行命令就把AI Agent框架搭好还能直接部署,省去自己搞并发和沙箱的麻烦,还送50万Token试玩。原文
14:57AI Will@FinanceYF5现在AI Agent主要停留在单人模式,用于个人提效和管理日程。Edge City联合创始人timour kosters提出新问题:当每个人都有多个Agent并互相交互时会发生什么。他判断未来12-24个月内,多数人会同时拥有多个Agent,单人模式只是起点,多人模式才是真正的变量。行业AI AgentEdge City智能体多人模式未来预测推荐理由:Edge City的联合创始人聊了个新视角:别只想着自己用Agent干活,想想你的Agent和别人的Agent聊天会怎样?未来一两年这个趋势可能很猛。原文
14:53AI Will@FinanceYF573°OpenAI 在其公司内部所有部门推广使用 Codex 作为智能体工具。员工利用 Codex 执行更复杂的任务,这些任务运行时间更长,并涉及跨职能协作。该实践展示了智能体工具如何提升工作效率和团队协作能力。技巧OpenAICodex智能体编程助手10 个信源在谈推荐理由:OpenAI 自己都在用 Codex 干活,说它能让员工做更复杂、跨部门的任务,说明 agent 工具真的有用。原文
14:51AI Will@FinanceYF5OpenAI 内部正在全公司部署 agent 工具 Codex,用于处理更复杂、更长周期、跨职能的任务。员工已将其应用于超过 10 个不同部门,包括工程、产品、营销和财务。这些 agent 能够自主编写代码、管理项目进度,并整合多个系统的数据。OpenAI 的实践显示,agent 可将某些多步骤流程的时间从几天缩短到几分钟。行业OpenAICodexagent智能体10 个信源在谈推荐理由:OpenAI 自己用 Codex agent 把跨部门协作的活儿都干了,效率提升几十倍,看看他们怎么用的。原文
11:56berryxia@berryxia精选Anthropic发布Claude Tag,这是一个运行在Claude Code之上的多玩家Agent。它具备持续记忆和独立身份,能主动推进任务。与单用户Agent不同,Claude Tag支持多人在同一Agent上协作。它被定位为从工具进化为团队成员的角色。AI产品Claude TagAnthropicClaude Code智能体10 个信源在谈推荐理由:Anthropic做了个新Agent Claude Tag,能记住上下文,像朋友一样主动帮忙干活,多个队友还能一起用。原文
11:20shao__meng@shao__meng精选72°OpenAI 官方博客数据显示,其内部员工使用 Codex Agent 的 output token 占比从 2025 年 8 月不足 10% 飙升至 2026 年 6 月的 99.8%。约 24% 的 Codex 请求对应人类需 1 小时以上工作,内部重度用户 P99 单日可并行运行 60+ 小时 agent。非开发者用户自 2025 年 8 月以来增长 137 倍。法务、财务部门超 85% 的 output token 已来自 Codex,非技术人员产出的工作中超过 1/4 是工程/编码类。行业CodexOpenAIAgent智能体企业AI应用10 个信源在谈推荐理由:OpenAI 自家员工几乎全用 Codex 干活了,律师、财务也一样。看看他们的内部数据,就知道未来工作方式怎么变。原文
09:39向阳乔木@vista8一个团队展示了能实时计数乒乓球颠球数的AI系统,并认为Physical AGI需要满足三个必要条件:统一的多模态大脑(非模型拼接)、在同一个大脑中完成任意模态的理解与生成、理解与生成以流式方式持续运行。最关键的一点是该大脑必须完整运行在端侧。团队还提供了更多介绍和演示视频。AI模型Physical AGI多模态端侧模型智能体推荐理由:看看这个团队对Physical AGI的看法,他们提出了3+1个必要条件,还做了颠球计数的演示,强调端侧运行和统一多模态大脑。原文
09:24宝玉@dotey计算机科学家刘江指出,Codex 发展趋势不仅是成为 AI 时代的 Office 套件,更可能进化为 Agent 操作系统。据观察,OpenAI 全员已从 ChatGPT 转向 Codex,涵盖研发、法务、财务和招聘等所有部门。这一迁移表明 Codex 正从单一工具向平台化演进。刘江认为 Codex 有望成为下一代计算环境的基础设施。行业CodexOpenAI智能体Agent OSAgent Office10 个信源在谈推荐理由:刘江结合 OpenAI 全员转向 Codex 的案例,分析为什么 Codex 不只是办公工具,而是未来操作系统雏形。观点犀利,适合关注 AI 基础设施和 Agent 生态的人。原文
08:25Genspark@genspark_aiGenspark团队举办直播,演示新版AgentBase的使用方法。直播包含实机操作和问答环节,视频浏览量已达938次。观众可以学习如何配置和运行AgentBase。技巧AgentBase直播教程智能体Genspark推荐理由:想玩转AgentBase?这场直播手把手教你,有问有答,别错过。原文
08:02AI Engineer@aiDotEngineerWF2026会议公布了首批主题演讲,演讲主题包括Agentic AI Foundation的“构建系统而非代码”、Meta Superintelligence Labs的“生产级评估”、Decoding AI的“将10994条笔记转化为智能体记忆”等。Nx、OpenProse、Omnara等公司的演讲者也展示了各自在智能体系统和编码工具上的进展。全部在线演讲将于本周末陆续推出。行业WF2026智能体评估记忆递归编码推荐理由:WF2026第一批keynote全是干货:智能体构建、生产评估、记忆系统、递归编码,搞AI工程的别错过。原文
04:59elvis@omarsar0精选推文讨论动态工作流适用于少数用例,被视为测试时计算(TTC)的新范式。作者指出动态工作流在爬山式研究实验中表现强劲,且通过精心规划和提高推理水平可获更好结果。文章强调验证器/评审器对结果至关重要,组合不同的编码代理可取得更优效果。当需要从不同代理(如LLM委员会)获取多元视角时,动态工作流非常有用,但前沿模型尚不擅长优化地即时生成测试平台。提到了Mythos等新型模型可能更善于代理编排,且需要更多TTC基准来评估动态工作流的有效性。技巧动态工作流测试时计算推理模型智能体Mythos推荐理由:如果你在做代理编排或研究测试时计算,这条推文给出了非常实用的观察,比如什么时候该用动态工作流、如何用好验证器,还提到了Mythos这类新模型。原文
03:09Greg Brockman@gdbOpenAI官方X账号称,智能体(Agents)正在公司内部快速普及,每个部门都在使用Codex执行更复杂、更长时间且跨职能的任务。该声明引用了一篇推文,展示了内部工具如何改变工作方式。这些早期用例反映了Agent工具在能力提升和广泛可用后可能重塑工作的方向。行业OpenAICodexAgents智能体编程助手10 个信源在谈推荐理由:OpenAI自己都在用Codex智能体干活,效率提升明显。看看大厂内部怎么用AI加速工作的。原文
03:07Ate-a-Pi@svpinoSantiago Valdarrama 分享智能体自我改进的三个途径:模型层(仅适用于代码和数学,由大实验室负责)、执行框架层(步骤、工具和安全检查,容易控制且回报大)、上下文层(纯文本记录学习内容,最易入手)。他还强调从用户纠正智能体决策的每个实例中学习,真实反馈无可替代。文章提供了明确的优先级和实操建议。技巧智能体反馈学习Agent系统设计上下文学习推荐理由:想让你家智能体越用越聪明?这个线程给了三个可落地的改进方向,尤其是从用户操作中学习那块,不少人都忽略了。原文
03:05Ate-a-Pi@svpino新服务号称是 OpenClaw 的直接竞品,为用户提供一台 24/7 运行的专用云机器。该云代理内置浏览器访问和代码执行能力,可在本地电脑关闭时仍持续工作。它让远程用户无需配置即可完成本地同样的一切操作。AI产品OpenClaw云端代理智能体远程执行2 个信源在谈推荐理由:有人做了个 24 小时不关机的云代理,能跑浏览器和代码,出差也不用担心工作站关机了。原文
03:02腾讯混元 Tencent Hunyuan@TencentCloud腾讯云 EdgeOne Makers 在 Product Hunt 上获得当日热门第一名。该平台允许用户像构建网页一样快速构建和部署 AI Agent,提供 3200+ 个全球边缘节点和 19 个模板,支持零厂商锁定。主打全球化部署、安全性和开发效率。AI产品Tencent EdgeOneProduct HuntEdgeOne Makers腾讯云智能体推荐理由:腾讯云新出 EdgeOne Makers,一键把 AI Agent 部署到全球 3200+ 节点,有 19 个模板起步,还零锁定,搞 Agent 的值得去看看。原文
02:58Gary Marcus@GaryMarcusAnthropic工程师在一场40分钟工作坊中展示了如何利用循环(loops)构建可运行数天的AI智能体。他们透露,Anthropic内部30%以上的代码已由循环编写,这极大加快了交付速度。工作坊拆解了智能体循环、工具调用、记忆管理和子智能体等核心组件。该方法被视为神经符号AI的典型应用,在持久任务执行上明显优于传统无循环生成式方法。技巧Anthropic智能体Agent循环工作流代码生成10 个信源在谈推荐理由:Anthropic工程师手把手教你用循环搭建能跑好几天的智能体,内部30%代码都这么写,比大部分500美元的vibe编程课实在。原文
02:57Gary Marcus@GaryMarcus神经符号代理(以Codex为例)的任务表现显著优于纯聊天机器人。Ethan Mollick引用的数据以OpenAI为风向标,展示了技术发展方向。聊天机器人时代已经结束,基于代理的系统正向工程以外的任务扩展。技能有望成为企业标准化AI使用的工具。AI模型CodexOpenAI智能体神经符号10 个信源在谈推荐理由:Codex这类神经符号代理比纯聊天机器人强得多,Ethan Mollick用OpenAI数据说明代理系统即将全面铺开,搞AI的不妨看看。原文
02:16vLLM@vllm_project精选vLLM 宣布 Day-0 支持 Liquid AI 的 LFM2.5-230M 小模型。该模型仅 230M 参数,预训练于 19T tokens 且支持 32K 上下文。专为手机、机器人、家庭自动化和网络设备上的 agent 任务设计。可运行于 CPU、NPU 和 GPU 等硬件。AI模型LFM2.5-230MvLLMLiquid AI智能体轻量模型推荐理由:vLLM 第一时间给 Liquid AI 的 LFM2.5 小模型做了适配,230M 参数跑 agent 任务,手机、机器人上都能用。原文
01:57Google DeepMind@GoogleDeepMind74°Google DeepMind 宣布 Gemini 3.5 Flash 新增原生计算机使用能力。开发者可利用该内置工具构建能跨浏览器、移动端和桌面界面观察并执行操作的定制智能体。该功能无需额外适配即可直接操控 GUI 元素。AI模型Gemini 3.5 FlashGoogle DeepMind智能体计算机使用推荐理由:DeepMind 给 Gemini 3.5 Flash 加了个内置计算机操作工具,开发者能直接让模型看屏幕、点按钮,跨浏览器和桌面都行。原文
01:39elvis@omarsar0OpenRouter 发布了 MCP(模型上下文协议)功能,允许智能体在运行时基于实时智能动态选择、定价和测试模型。该功能解决了智能体依赖6个月前的训练数据猜测模型的问题。开发者可以用它运行长时间运行的智能体,并自动选择最合适的模型。AI产品OpenRouterMCP智能体模型选择开发者工具推荐理由:OpenRouter 出了个新工具,让你的智能体自己挑模型、比价格、做测试,不用再拿半年前的旧数据瞎猜了。原文
01:37Greg Brockman@gdbOpenAI内部数据显示,公司各部门正在广泛使用Codex代理工具。这些代理工具使员工能够处理更复杂、运行时间更长且跨职能的工作任务。OpenAI认为,随着这些工具能力提升,它们可能重塑未来工作方式。AI产品OpenAICodex智能体编程助手10 个信源在谈推荐理由:OpenAI自己爆料,他们内部用Codex搞定了更复杂的跨部门工作,数据真实,值得看看。原文
01:33OpenAI@OpenAI76°OpenAI官方透露,公司内部所有部门正在使用Codex Agent完成更复杂、更长周期、跨职能的工作。Codex Agent能够处理多步骤任务,提升自动化程度。这展示了代理工具在组织内实际落地的早期案例。行业OpenAICodexAgent智能体自动化工作流10 个信源在谈推荐理由:看看OpenAI自家怎么用Agent的,Codex在财务、工程、运营各部门跑起来了,不是空谈。原文
01:04Figma@figmaFigma 发布了 MCP connectors,让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol(MCP)标准,目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具,扩展设计工作流。Figma 表示后续将开放更多连接器选项。AI产品FigmaMCP设计工具智能体10 个信源在谈推荐理由:Figma 出了 MCP 连接器,让设计 agent 能直接调用 Slack、Notion,工作流更顺了。原文
01:02AK@_akhaliq一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。行业智能体内存系统AI架构长期记忆推荐理由:有人在聊智能体要不要有自己的记忆系统,思路挺新鲜的,点开看看讨论。原文
00:57Philipp Schmid@_philschmidGoogle 在 Gemini 3.5 Flash 中上线了 computer use 功能,支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程,用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环,通过 adb 接口控制手机,也支持远程设备连接(adb connect <ip>:5555)。类似模式可扩展到 iOS 的 simctl。技巧Gemini 3.5 FlashGoogleAndroidadb智能体推荐理由:Google 刚给 Gemini 3.5 Flash 加了 computer use,这份教程用一条命令就能在模拟器上跑 agent 控制手机,还支持远程和 iOS,很实用。原文
00:30Google AI Developers@googleaidevs精选73°Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体,处理长时任务。新增特性包括:内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。AI产品Gemini 3.5 FlashComputer Use智能体自动化测试Google推荐理由:Google 给 Gemini 3.5 Flash 加了 Computer Use 工具,能让智能体跨浏览器、手机和桌面干活,还能自定义安全策略,实用!原文
00:26shao__meng@shao__mengSuperNori 是一款针对家庭照料者的 Proactive Family AI Agent,能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作,AI 会在合适时机询问是否处理。该项目已开放候补名单,目标减轻家庭中总在照顾他人的那个人的负担。AI产品SuperNori家庭AI智能体主动提醒1 个信源在谈推荐理由:家里总是你操心?SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么,不用你一个个记,试试看。原文
00:24Firecrawl@firecrawl_devFirecrawl MCP 发布新功能,文档解析速度提升5倍。支持PDF、电子表格和文档,可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器,无需API密钥即可在免费层试用。AI产品FirecrawlMCP文档解析智能体PDF推荐理由:Firecrawl MCP 现在解析文档快了5倍,免费就能用,让你的智能体直接读PDF和表格。原文
23:55elvis@omarsar0Hyperagent是一款为本地agent提供专属云端机器的服务,解决了本地agent运行时的崩溃、泄密和频繁监控问题。Andrew Busse指出OpenClaw像保姆一样麻烦。新用户注册可获得100美元推理积分,迁移首个agent再获500美元。该服务在hyperagent.com提供有限期优惠。AI产品Hyperagent智能体云端推理Andrew Busse3 个信源在谈推荐理由:如果你受够了本地agent崩溃和泄露,Hyperagent给每个agent配云端专机,新用户还能拿600美元积分,赶紧试试。原文
23:46OpenRouter@OpenRouterAIOpenRouter 发布新功能,允许用户通过两条命令(claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter)在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP(Model Context Protocol),支持所有主流代理(如 Claude)。用户可在 openrouter.ai/mcp 立即使用。技巧OpenRouterClaudeMCP智能体工具推荐理由:OpenRouter 搞了个骚操作,两行命令就能把模型接到 Claude 等代理里,一分钟搞定测试和定价,省去一堆配置。原文