06:36宝玉@dotey精选Anthropic 上周推出 Claude Tag 的 beta 版,面向 Claude Team 和 Enterprise 用户。它允许用户在 Slack 频道中 @ Claude,后台自动拆解任务并回复结果。Andrej Karpathy 将其视为 LLM 交互的第三次重大重新设计(从网页到桌面 App 再到异步持久实体)。Gergely Orosz 指出核心不是 Slack,而是云端 AI 连接内部系统后开箱即用。他认为真正受益的是新员工、非工程师和不熟悉代码库的开发者,而集成难度是最大挑战。AI产品ClaudeAnthropicSlack智能体编程助手10 个信源在谈推荐理由:Anthropic 搞了个新玩法,在 Slack 里 @ Claude 就能让 AI 干活,Karpathy 说这是第三代 LLM 交互。你可以看看它是怎么改变团队协作的。原文
03:54Harrison Chase@hwchase17Fleet 发布新功能,允许用户将 AI agent 分享到 Slack、Microsoft Teams 和电子邮件等渠道。通过 Fleet 的 Slack 集成,非技术人员可以轻松构建 agent 并部署到团队日常工作的地方。这样 agent 就能在公司内部自然传播,无需离开已有工作平台。AI产品FleetSlackTeams智能体企业协作3 个信源在谈推荐理由:Fleet 这次更新让 agent 能直接嵌入 Slack/Teams,同事不用切换界面就能用上,部署超简单。原文
02:45Harrison Chase@hwchase17LangChain宣布推出DeepAgents Harness,作为测试智能体行为的框架(harness)。同时提供LangSmith Sandboxes用于安全隔离的执行环境,以及面向LLM输出的评估(Eval)功能。这些组件集成主流模型提供商,并通过LangSmith Engine驱动“模型-测试-沙箱-评估”闭环。该方案旨在帮助企业基于自身领域知识和客户工作流,自主构建和优化智能体系统。AI产品LangChainDeepAgentsLangSmith智能体评估推荐理由:LangChain把智能体测试、沙箱和评估整合到一起了,企业可以自己掌控从模型选择到部署的全流程,不用再拼凑各种工具。原文
01:45AI产品黄叔@PMbackttfuture用户使用Hermes生成手机壁纸,并将微信Agent入口交回Hermes,同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时,内容会同步到flomo,并立即触发即时增强功能,从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。技巧HermesflomoMCP/工具工作流智能体推荐理由:教你给AI设个微信入口,用Hermes做壁纸,还能自动同步到flomo,随时调取记忆,挺实用的。原文
00:36Yangyi@YangyixxxxNous Research 的 Hermes Agent 发布 MoA(Mixture-of-Agents)预置虚拟模型,允许在不同时刻为同一 Agent 路由不同模型,类似快慢脑逻辑。在新基准测试中,该方案比 Opus 4.8 高出 8%,比 GPT 5.5 高出 11%。多 Agent 场景下效果更显著,延续了 Hermes 的工程化优势。AI模型HermesNous Research智能体推理模型MoA推荐理由:Nous Research 让 Agent 在不同时刻自动切换不同模型,比单一模型更强,新基准上比 Opus 4.8 高8%、比 GPT 5.5 高11%。原文
22:27NVIDIA AI@NVIDIAAINVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon,要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理,以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits,第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits,第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日(周二)前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。行业NVIDIAStripeNous ResearchHermes AgentDGX Spark智能体黑客松6 个信源在谈推荐理由:想赢一台 DGX Spark 吗?用 Hermes Agent 造个自动赚钱的 AI 公司,前三名都有现金加硬件,截止 6 月 30 日,快上车。原文
20:39berryxia@berryxiaAgent-Reach是一个开源CLI工具,允许AI Agent零API费用、本地运行地获取Twitter、Reddit、YouTube、GitHub、B站、小红书等平台内容。它通过智能选择稳定开源后端并自动健康检查和故障切换,避免手动编写爬虫。安装后Agent可执行“查看YouTube视频字幕”“搜索Twitter评价”等任务,将碎片化能力封装成skill并支持多后端路由与自动降级。该项目在GitHub上已收获3.5K Star,专注于补齐Agent低成本、可靠的内容获取短板。AI产品Agent-Reach开源项目多平台内容获取智能体CLI工具推荐理由:这个Agent-Reach项目开源免费,让AI Agent能直接搜Twitter、YouTube、B站等平台内容,不用写爬虫,自动切换稳定后端,适合做自媒体搜集信息的兄弟们。原文
16:18Geek@geekbb精选网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体,使用低成本 Flash 模型处理大部分上下文,仅在设计(Qwen)和编码(Kimi Code)等关键环节调用高性能模型。每日成本控制在 4~7 美元,并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。技巧Gentle-AIQwenKimi Code智能体模型路由推荐理由:挺实用的配置:11个智能体分工,Flash模型省成本,Qwen和Kimi Code干重活,每天才4-7美元,还降幻觉。原文
15:45Jerry Liu@jerryjliu0Jerry Liu(LlamaIndex创始人)在推特上讨论AI Agent与SaaS的关系。他认为Agent像人类一样有核心通信接口,如chat、voice、slack。SaaS软件则需要根据具体用途定制接口,例如ticket tracking、CRM。目前SaaS公司都在构建Agent以捕捉工作自动化价值,但两者接口会随时间解绑。行业Jerry LiuLlamaIndexAI AgentSaaS智能体3 个信源在谈推荐理由:Jerry Liu说Agent和SaaS会分家,不是SaaS死了而是接口不同。看看他的观点。原文
11:19AI产品黄叔@PMbackttfuture黄叔总结了自己重度使用flomo Agent的10点理解,核心是降低记录前0.5秒的摩擦。他认为flomo Agent对手不是Notion或Obsidian,而是微信文件传输助手。该工具通过接入flomo MCP与Hermes,将对话长期记忆同步保存到flomo,并即时触发增强功能,从记忆中提取相关笔记辅助思考。黄叔还指出,DeepSeek V4和王登科推动了flomo发展,Agent功能少反而更可信,付费理由是“一个可信的记忆容器”。技巧flomo智能体HermesMCP知识管理推荐理由:黄叔分享了10条实际使用flomo Agent的心得,比如对手是微信文件传输助手、AI洞察是卡片结构的迟到红利,挺有启发。原文
10:58AI Will@FinanceYF583°微软CEO Satya Nadella讨论了如何构建支持2000万个AI Agent与人类员工协同工作的基础设施。该基础设施旨在使Agent能自动执行任务、访问企业数据并参与工作流。这一规模部署标志着微软在企业级Agent应用上的重大推进。Nadella强调了底层架构需具备弹性、安全性和可管理性。行业MicrosoftAgent智能体基础设施推荐理由:微软要为2000万个Agent搭基础设施,听听CEO怎么说,这是企业AI落地的实打实案例。原文
07:07Suhail@Suhail精选Hamish Ivison等人发布了Tmax,一个基于强化学习的开源终端智能体模型。在默认设置和65k token预算下,Tmax优于之前的开源终端使用工作。团队公开了所有训练数据、模型权重和rollouts,方便复现和进一步研究。AI模型TmaxRLterminal agent开源模型智能体推荐理由:Tmax把终端智能体的RL训练配方全开源了,65k token里就跑赢之前的工作,想自己训智能体的可以抄作业。原文
04:49OpenRouter@OpenRouterAIOpenRouter 最新洞察文章指出,四个开源权重模型(未公开具体名称)已达到能驱动真实智能体管道的水平。文章分析了为何公司在6月选择这些模型,强调它们在自主任务执行中的表现。该观察基于 OpenRouter 平台的实际使用数据。行业OpenRouter智能体开源模型推荐理由:OpenRouter 发博说四个开源模型已经能跑真实 agent 流程了,搞智能体的朋友可以看看为什么公司选它们。原文
04:31Harrison Chase@hwchase17社区成员推出3小时深度课程,系统讲解Deep Agents构建。课程覆盖任务规划模块、文件系统用于上下文管理、子代理生成机制以及长期记忆实现。适合想深入掌握Agent开发流程的学习者。技巧Deep Agents智能体任务规划上下文管理子代理推荐理由:想学Deep Agents实战吗?3小时从任务规划讲到长期记忆,社区大神亲自带,比硬啃文档快多了。原文
01:49Jerry Liu@jerryjliu0Jerry Liu(LlamaIndex创始人)在推文中指出,手动构建工作流(代码、拖拽或提示)的需求正在减少,更优方式是指定目标让模型智能规划步骤。对于重复性任务,可收集带真实标签的数据集进行爬山优化,以平衡成本与准确率。他认为行业正从提示工程迈向目标和评估工程。拥有642次浏览、5个点赞。技巧Jerry LiuLlamaIndex工作流智能体提示词工程推荐理由:Jerry Liu说的这个趋势很实在:别再手动搭工作流了,直接给目标让模型自己想办法。重复任务还能录数据集优化,省心省钱。原文
00:56berryxia@berryxia76°Anthropic的Lamis在2026年AI DevCon上分享了上下文工程实践,从Claude MD文件起步,发现其效果出奇地好(unreasonably effective)。第二步引入记忆工具,让Agent自主读写,效果优于人类。第三步Skills采用渐进式披露,类似书架取书。第四步文件系统用bash和grep搜索,不需要向量数据库。生产环境面临多Agent并发写入等问题,Anthropic提出版本控制、并发控制等四个原则。最后介绍“做梦”机制:异步批量分析会话记录,识别模式并调整上下文,已在生产中运行,降低token成本。技巧AnthropicClaude上下文工程智能体记忆管理10 个信源在谈推荐理由:Anthropic工程师手把手教你上下文管理套路,从最基础的文件到高级的“做梦”架构,半小时就能上手实操。原文
00:56berryxia@berryxia精选Anthropic应用AI负责人Lamis在2026年AI DevCon上分享了Agent记忆系统的四层架构。起点是CLAUDE.md文件,效果超过复杂Prompt工程。第二层是记忆工具,让Agent自主读写更新,判断力比人强。第三层Skills实现渐进式披露,类似从书架抽词典。第四层把记忆建模为文件系统,用bash/grep,无需向量数据库。还引入"做梦"(带外异步处理)分析跨会话模式,已在生产中提升任务效率并降低成本。技巧Claude Code记忆管理智能体Anthropic提示词工程10 个信源在谈推荐理由:Anthropic官方分享了他们怎么让Agent记住东西:从Markdown文件到做梦机制,很实用的四层方法论,看完可以少走弯路。原文
00:19elvis@omarsar0Eve 是一款专注于快速构建智能体的工具,主打直观和可定制。用户反馈其界面简单易用,无需复杂编程即可上手。经过一周实际使用,早期体验者认为它确实能稳定运行。AI产品Eve智能体工具No-Code推荐理由:想玩智能体又怕麻烦?试试Eve,特直观,随便拖拽就能搭起来,真心好用。原文
21:24AI产品黄叔@PMbackttfutureflomo Agent通过减少记录前0.5秒的摩擦,让普通人更容易坚持记录。它并非简单AI化,而是回归笔记核心。作者认为其真正对手不是Notion或Obsidian,而是微信文件传输助手。DeepSeek V4和王登科推动了产品进展,Agent功能虽少但更可信。flomo Agent结合Codex/Hermes可形成“记忆-行动”双系统。AI产品flomoAgent微信文件传输助手DeepSeek V4智能体3 个信源在谈推荐理由:flomo产品经理分享Agent真实使用体验,讲清它为什么不是跟Notion打架,而是跟微信文件传输助手抢用户。原文
17:24idoubi@idoubiccExpert Orchestration Agent 产品封装了半导体分析师 Peter(aleabitoreddit)的 serenity-skill,其分析框架基于 5,892 条推文和 4 篇长文蒸馏而成。agent runtime 采用前 WXG 高级工程师 idoubicc 的 FastClaw,与 OpenClaw 相比使用了更稳定的云原生架构设计。该产品旨在将专业分析师的经验转化为可复用的工具。AI产品Expert Orchestration AgentFastClawOpenClaw半导体分析智能体4 个信源在谈推荐理由:这个工具把半导体分析师 Peter 的几千条推文和分析文章做成了可复用的 Agent,底层用 FastClaw 云原生架构,比 OpenClaw 更稳,适合做行业分析。原文
13:26lmarena.ai@lmarena_aiAgent Arena的因果追踪方法论博客已发布。该方法论用于分析智能体在Agent Arena中的因果链。读者可通过博客深入了解Agent Arena的评估设计。论文Agent Arena因果追踪智能体推荐理由:想搞懂Agent Arena怎么分析智能体因果链的?这篇博客讲得明明白白。原文
13:23Jerry Liu@jerryjliu0精选LlamaParse现已成为n8n的官方验证社区节点,提供Parse、Extract、Classify、Split、Retrieve五大核心功能。用户可在n8n工作流中构建文档提取流程(如贷款处理)或索引文档知识库并接入AI Agent。该节点支持将每个资源作为可调用工具,让AI Agent自主决定何时检索上下文、解析文件或提取结构化数据。AI产品LlamaParsen8nLlamaIndex文档解析智能体推荐理由:LlamaIndex的文档解析工具正式入驻n8n,能处理复杂文档的提取、分类和检索,还能让AI Agent自主调用,搭建工作流超方便。原文
13:21LangChain@LangChainAILangChain与Chime合作发布指南,指导金融服务团队如何利用更强的监督机制构建生产级AI智能体。该指南涵盖LangChain框架的使用,强调可观测性、合规性和风险控制。指南提供具体步骤,帮助团队实现更可靠的AI部署。技巧LangChainChime智能体AI安全推荐理由:LangChain出了个新指南,专门讲金融服务怎么搞生产级智能体,还加了更强监督。做金融AI的可以看看,省了自己踩坑。原文
13:17HeyGen@HeyGen_OfficialHeyGen发布了新一代HyperFrames技能,包含9种可自动路由的视频工作流。智能体能够从上下文理解用户意图,自动匹配到启动视频、音乐视频、字幕和叠加等任务。用户无需手动切换,直接输入指令即可触发对应功能。该更新显著提升了AI视频制作的自动化程度。AI产品HeyGenHyperFrames视频生成智能体推荐理由:HeyGen的HyperFrames升级后,智能体能听懂你让它做哪种视频,直接开搞,不用自己选模板了,省事多了。原文
13:14OpenRouter@OpenRouterAI推文展示了如何使用OpenRouter的MCP功能构建一个模型委员会(Model Council),并针对用户的代码库和用例进行调优。该工作流由用户Lennox Saint验证,确认效果出色。示例提供了可操作的步骤,帮助开发者利用多个模型协作解决问题。技巧OpenRouterMCP模型委员会智能体提示词工程推荐理由:OpenRouter官方示范,手把手教你用MCP搭模型委员会,实测好用。原文
13:01LangChain@LangChainAI精选SierraPlatform的ZackRW在Max Agency播客中分享了一个关键洞察:在真实对话中,决定何时说话所需的脑力与决定说什么相当。传统语音代理并未以此方式构建。Sierra的突破是并行处理思考、倾听和说话,模拟人类对话的自然方式。这一理念来自Sierra的语音代理产品设计。行业LangChainSierraPlatform语音代理智能体推荐理由:Sierra的语音代理模仿人类并行处理对话,不是简单轮流说话,值得做语音产品的朋友看看。原文
12:53lmarena.ai@lmarena_aiAgent Arena排行榜已正式上线,用户可通过链接访问页面查看详情。排行榜支持按开放模型或实验室(lab)进行筛选过滤。目前该页面已有400次浏览,由xgo.ing提供技术支持。AI模型Agent Arena智能体评测基准开源模型实验室推荐理由:想看看谁家的智能体最强?Agent Arena排行榜刚上线,可以按开源模型和实验室筛选,挺方便。原文
12:36OpenRouter@OpenRouterAI精选OpenRouter 发布了新的 MCP(Model Context Protocol),使智能体能够实时获取最新模型信息。该功能允许 agent 根据当前任务自动挑选、定价并测试最适合的模型,不再依赖六个月前的训练数据。用户可通过视频演示看到 agent 如何动态执行模型选择流程。这一更新解决了智能体在模型调用时信息滞后的问题。AI产品OpenRouterMCP智能体模型选择推理模型推荐理由:OpenRouter 出了个 MCP,让你的智能体能自己挑最合适的模型,还能实时定价测试,不用瞎猜了。原文
12:26AI Engineer@aiDotEngineer精选Paul Bakaus 将在 AI Engineer World's Fair 发表两场演讲,涵盖智能体技能工程与设计工具控制。他基于构建 24+ 技能、跨越 9 种 harness/模型组合的实战经验,揭示平行子智能体、混合专家路由、技能记忆、自动钩子与环境变量等技巧。此外还介绍开源设计工具 Impeccable AI 的 24 个形容词级命令(如 /bolder、/quieter、/distill)。两场演讲分别聚焦如何突破模型默认安全输出,以及从形容词层面控制设计风格。技巧Paul Bakausai-engineer智能体提示词工程impeccable_ai推荐理由:想突破 agent 平庸输出?Paul Bakaus 分享 24+ 技能实战干货,还有形容词级设计控制,很实用。原文
12:21Nous Research@NousResearch精选NousResearch发布Hermes Agent,通过暴露MoA预设作为虚拟模型,提供超越公共前沿的能力。在即将发布的基准测试上,Hermes Agent比Opus 4.8高8%,比GPT 5.5高11%。该模型目前被限制访问,仅授予少数人。AI模型Hermes AgentOpusGPT 5.5NousResearch智能体推荐理由:Hermes Agent的MoA虚拟模型比Opus 4.8和GPT 5.5都强,分别高8%和11%,不过目前只能少数人用。原文
12:09NVIDIA AI@NVIDIAAIArtificialAnlys发布新基准AA-Briefcase,用于评估复杂项目中的现实任务。Nemotron 3 Ultra在该基准开放模型中排名靠前。该模型在多种长时间运行的智能体任务上表现强劲,即使首次面对这些任务也能保持性能。该基准旨在测试模型的长期执行与泛化能力。AI模型AA-BriefcaseNemotron 3 UltraArtificialAnlys智能体基准推荐理由:新出的AA-Briefcase基准可以看看,Nemotron 3 Ultra在开放模型里排前面,适合对比它处理复杂任务的能力。原文
12:06LangChain@LangChainAILangChain的Brace Sproul和Jake Broekhuizen在视频中比较了构建agent时使用MCP(Model Context Protocol)与CLI(命令行接口)的优缺点。MCP提供了标准化上下文传递,适合多步骤复杂agent任务;CLI更轻量直接,适合简单工具调用。视频通过实际案例演示了两种方式的适用场景和取舍。技巧智能体MCPCLILangChainagent推荐理由:LangChain的两位专家亲讲MCP和CLI在agent开发中的实战对比,帮你选对工具写代码。原文
12:03Harrison Chase@hwchase17Manus AI CEO Alex Olsen在推特上表示,KV-cache命中率是生产级AI代理唯一最重要的指标。Manus AI通过深度代理技术优化提示缓存,以提升缓存命中率。该指标直接影响推理成本和响应速度,目前已有669次浏览与2次点赞。Olsen强调,没有高KV-cache命中率的代理系统无法真正扩展。行业Manus AIKV-cache智能体缓存优化推荐理由:Manus AI的CEO说KV-cache命中率最关键,他们用深度代理优化缓存,搞AI基建的该看看。原文
12:01宝玉@dotey89°OpenAI于6月26日发布GPT-5.6,包括旗舰Sol、日常Terra和经济Luna。Sol在Terminal-Bench 2.1上,Ultra模式得分91.9%,Sol模式88.8%,高于Claude Mythos 5的88%和Gemini 3.1 Pro Preview的70.7%。API定价:Sol每百万token输入5美元输出30美元,Terra分别为2.5和15美元,Luna为1和6美元。模型经过超过70万A100等效GPU小时的红队测试,内置拒绝机制和实时分类器。Sol的网络安全能力被OpenAI自评为“高”级,未达到“关键”级。AI模型GPT-5.6SolOpenAI推理模型智能体10 个信源在谈推荐理由:这次GPT-5.6发布最特别的是只给20家合作伙伴用。Sol的Ultra模式能自己拆任务干活,性能碾压Claude和Gemini。Terra性价比超高,性能接近上一代但价格减半。原文
11:58elvis@omarsar0动态工作流(即时生成测试框架)被视为一种新的测试时计算形式。然而LLM在自主构建复杂工作流方面表现不佳,作者经常需要手动引导代理生成复杂模式。推文对Mythos/GPT-5.6在动态生成复杂工作流上的效果表示好奇。该推文获得9条评论、4次转发、22个喜欢和3179次浏览。AI模型MythosGPT-5.6动态工作流测试时计算智能体推荐理由:聊动态工作流和LLM的短板,还点名Mythos/GPT-5.6,看它能不能搞定复杂模式生成。原文
11:53Pika Labs@pika_labsPantryAgent 是一款 AI 工具,帮助用户将食品储藏室、餐食计划和购物清单整合为统一系统,确保食物在过期前被使用。团队使用 Pika MCP 生成了整个演示视频。该产品旨在减少家庭食物浪费,提升日常效率。AI产品PantryAgentPika MCP智能体视频生成推荐理由:PantryAgent 帮你用 AI 管好冰箱和购物清单,减少浪费。视频全是 Pika MCP 生成的,很酷。原文
11:51Guillermo Rauch@rauchg精选Agent调试困难,因为AI模型行为非确定,且Agent是复杂分布式系统,涉及多个步骤、函数、沙箱及数十个API服务。Vercel团队为eve.dev内置可观测性,支持检查模型调用、工具调用、运行时错误及token用量,已获用户好评。AI产品Verceleve智能体可观测性调试推荐理由:Vercel给eve.dev加了agent调试跟踪,能看模型调用、错误和token,开发者福音。原文
11:45Stanford AI Lab@StanfordAILab斯坦福AI实验室发布了Auto-psych系统,让AI智能体自主提出心理学理论、设计实验、在线招募真实人类参与者,并根据实验结果迭代改进。该系统实现了从理论到验证的闭环自动化,无需人工介入实验设计和数据收集环节。这是将大语言模型智能体应用于社会科学实证研究的一次实践。AI模型Auto-psychStanford智能体自动化科研心理学研究推荐理由:斯坦福AI实验室搞了个Auto-psych,AI智能体自己就能跑通心理学研究整个流程,从提理论到找人做实验再到改进,省掉了人工操作。原文
11:21LlamaIndex@llama_index精选LlamaParse Platform的n8n节点成为官方认证社区节点。新版本整合了文档解析、分类、提取、分割和检索功能,所有操作通过单个LlamaParse API凭证连接。每个资源可作为n8n AI Agent的可调用工具,让智能体动态决定何时检索上下文、解析文件或提取结构化数据。工作流还支持按文档类型路由、基于知识库的检索接入智能体,以及并行运行不同精度成本层级的解析输出。AI产品LlamaParsen8nLlamaIndex文档智能智能体推荐理由:LlamaParse和n8n联手,把文档解析、分类、提取都塞进低代码工作流,还能让AI Agent自动决策,不用写代码就能搭智能文档管线。原文
11:20Latent.Space@latentspacepodOpenAI首席研究官Mark Chen在播客中讨论了AGI距离,认为模型正越来越接近自主创新。他重申扩展定律和预训练仍然关键,并透露OpenAI如何分配算力。他还指出评估基准正面临危机,模型需提升长周期任务与多模态推理能力。行业OpenAIMark ChenAGI智能体多模态10 个信源在谈推荐理由:OpenAI内部的人聊AGI有多远,还讲了评估危机和长周期学习,干货不少。原文