22:39阿里通义 Qwen@Alibaba_Qwen精选73°阿里Qwen团队开源了Qwen-AgentWorld-35B-A3B模型,采用MoE架构,总参数量35B,每次推理激活3B参数,支持256K上下文长度。同时发布了AgentWorldBench基准,用于评估智能体的世界建模能力。该模型在多个现实环境模拟任务上表现优于同等规模模型。相关论文已发布于arXiv,代码和模型权重在GitHub和Hugging Face上开放。AI模型QwenAgentWorldMoE智能体世界建模推荐理由:阿里新开源了35B参数的MoE模型,只激活3B,256K超长上下文,配合AgentWorldBench,研究智能体世界建模的赶紧试试。原文
22:39阿里通义 Qwen@Alibaba_Qwen精选71°Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型,在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标,而非后处理适配。在AgentWorldBench基准上,该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习,效果超过在真实环境中训练。仅通过预测环境的预热训练,无需智能体特定微调,预测知识即可零微调迁移至智能体任务。AI模型Qwen-AgentWorld智能体世界模型模拟环境强化学习推荐理由:阿里Qwen造了个能模拟7种环境的AgentWorld,在AgentWorldBench上干掉了Claude和GPT最新版,训练智能体不用真实环境也能更强,零微调迁移呢。原文
19:24The Rundown AI@therundownaiAnthropic的Claude现在作为agentic coworker集成到Slack中。用户可以直接在Slack对话中调用Claude执行任务、回答问题和编写代码。该功能利用Claude 3.5 Sonnet的agentic能力实现自主工作。Meta同时宣布加大AI智能眼镜研发投入,但未公布具体数字。AI产品ClaudeSlackAnthropic智能体协作工具10 个信源在谈推荐理由:Claude现在能直接在Slack里当同事用,不用切窗口就能让它写报告查数据,团队协作效率拉满。原文
19:12orange.ai@oran_geCola上线了Seed 2.1 Pro模型,这是一款原生多模态模型,官方声称是目前多模态最强。相比Seed 2.0版本,该模型在Coding和Agent能力上有所增强。用户可通过colaos.ai进行体验。AI模型ColaSeed 2.1 Pro多模态智能体代码能力3 个信源在谈推荐理由:Cola刚发了Seed 2.1 Pro,说是多模态最强,coding和agent比2.0强不少,想试试去colaos.ai就行。原文
17:30Latent.Space@latentspacepod精选76°Anthropic发布了Claude Tag,一个针对Slack的Claude AI bot更新。它支持多玩家协作和主动监控功能,类似于Claude Code的增强版。内部版本已合并65%的产品PRs。这是Anthropic首个原生多玩家和主动式产品。AI产品ClaudeAnthropicSlack智能体协作10 个信源在谈推荐理由:Anthropic的Claude Tag让Slack里的Agent能多人协作、主动干活,内部已合并65% PR,值得试试。原文
16:09berryxia@berryxia精选Anthropic内部工程师运行300多个自改进的agent swarm来提升系统可靠性。核心方法是给模型验证自身输出的机制,包括计划模式、动态工作流和自我检查,根据真实反馈迭代。这种闭环系统让agent从一次性工具变为能自我迭代的系统,可靠性大幅提升但token消耗更高。效果远超大多数300美元的agent课程。技巧Anthropic智能体agent工作流自改进10 个信源在谈推荐理由:Anthropic工程师自己怎么用agent?300个自改进swarm加闭环验证,比花300美元买课实用多了。原文
12:30Nous Research@NousResearchHermes Agent现在支持用户领养一个动画宠物精灵,该宠物会在agent空闲、运行工具、思考、等待、完成、失败等状态下做出不同反应。用户可通过petdex画廊从近3000种宠物中选择,也可以提交自定义宠物。该功能在GUI和TUI界面中均可用。AI产品Hermes AgentNousResearch动画宠物智能体petdex推荐理由:给智能体领养一个会动的宠物,近3000种图案可选,还能自己画,太有趣了原文
10:58shao__meng@shao__meng精选作者使用Apodex(自进化重型求解器)测试了“AI Agent公司如何选择产品方向”,将问题拆解为开发者工具、企业工作流、研究助手三条线,并补充VC视角、TAM、Menlo Ventures等来源。经过反复证据核查,Apodex给出排序:垂直企业工作流Agent第一,垂直研究助手第二,开发者工具第三。它指出开发者工具竞争激烈,已有Codex、Cursor、Claude Code、Devin等占据用户心智,新公司难差异化。Apodex适合处理变量多、需验证证据的复杂问题,如创业方向、行业进入时机等。AI产品Apodex智能体企业工作流编程助手10 个信源在谈推荐理由:用Apodex做了个创业方向测试,它把问题拆成多条线,反复查证据才给结论,比普通聊天机器人靠谱很多。原文
10:45shao__meng@shao__meng精选Codex官方博客发布了Remote工程实践指南,提出手机是控制面而非终端的核心心智模型。指南列出了10个高杠杆能力,包括Queue与Steer模式切换、Side Chat旁路对话、Plan与Goal两种任务模式。还介绍了5个典型工作流如Release Captain和Mobile Reviewer,强调权限粒度与上下文生命周期管理。该指南旨在帮助开发者在手机上高效启动、指挥、审批远程开发任务。技巧Codex RemoteOpenAI编程助手智能体10 个信源在谈推荐理由:Codex官方写了10个手机上用Remote的实战技巧,比如用Steer纠偏、手机做Code Review,比单纯盯进度实用多了。想远程开发效率翻倍可以看看。原文
10:44AI Will@FinanceYF5Andrej Karpathy将Claude Tag定义为LLM交互的第三次范式迁移。第一代是网站访问模型,第二代是本地App,第三代是持久存在的团队成员,可异步工作并共享组织工具与上下文。Karpathy指出这一转变“需要一点时间理解,但确实有效且厉害”。该评论基于Claude Tag的实际功能体验。行业Andrej KarpathyClaude Tag智能体LLM交互8 个信源在谈推荐理由:Andrej Karpathy把Claude Tag比作团队里的异步同事,这视角挺新鲜,值得看看他怎么说的。原文
10:43AI Will@FinanceYF572°Andrej Karpathy将Claude的新交互模式称为LLM UI/UX的第三次重大重新设计。前两次分别是将LLM作为网站访问和作为App下载。第三次是把LLM打造成一个自包含、持久、异步的实体,拥有组织范围的工具和上下文。他认为这种模式让Claude无缝加入团队,可以像与人交谈一样交互。行业ClaudeAndrej Karpathy智能体人机协作推荐理由:Karpathy发了条推,说Claude现在可以像团队同事一样跟你干活,比当网站或App好用多了,建议看看他的新思路。原文
10:42AI Will@FinanceYF5精选Anthropic发布了Claude Tag,将其嵌入Slack,用户可在频道中像@同事一样@它分配任务。该功能在频道内共享上下文,无需重复解释。开启ambient模式后,Claude Tag会主动跟进未解决的任务。Anthropic内部65%的代码由Claude Tag生成。目前Enterprise和Team用户可用。AI产品AnthropicClaude TagSlack智能体代码生成10 个信源在谈推荐理由:把Claude当同事用:Slack里@它分配任务,自动记忆上下文,Ambient模式主动跟进未解决问题。原文
10:26Guillermo Rauch@rauchgVercel 创始人 Rauchg 在 X 上宣布为 eve.dev 创建一个反馈群。面向深度构建智能体的开发者。参与者可通过私信申请加入。直接与 eve 工程师交流。旨在收集高质量批评性反馈和需求。AI产品eve.devVercelRauchg智能体开发者社区推荐理由:做智能体开发的朋友,eve.dev 的工程师想直接听你吐槽。有意见可以私信 Rauchg 加入讨论群。原文
07:38Notion@NotionHQNotion的运营主管Amy构建了一套AI代理套件,自动处理日常行政工作:一个代理自动起草邮件回复会议安排请求,第二个代理每日检查联合创始人日历并分配会议室和会议细节,第三个AI代理自动生成会议笔记并转化为行动项。她还有一个代理监控其他代理的运行情况。Amy表示AI帮她节省了时间,并减轻了精神负担,她像带新人一样逐步给代理更多自主权。技巧Notion智能体工作流办公自动化1 个信源在谈推荐理由:Notion的运营主管分享了用AI自动处理邮件、安排会议室、记会议笔记的实际方法,还有代理监控代理的妙招。原文
07:38Nous Research@NousResearch精选Hermes Agent 推出新指令 /learn,允许用户向其提供任意源材料(包括代码、API 文档、手册、PDF 和配置文件),Agent 会自动学习并提炼出可验证且可重复使用的技能。该功能无需手动编写技能,只需指定数据目录即可。目前通过 NousResearch 平台开放使用。AI产品Hermes AgentNousResearch智能体技能学习推荐理由:Hermes Agent 现在能直接从代码、文档里学技能,喂什么学什么,省去手动配置,适合开发者和团队快速复用知识。原文
07:36Andrej Karpathy@karpathyAndrej Karpathy提出LLM交互的第三次范式变革:Claude作为自包含、持久、异步的实体,通过工具集成、计算环境、内存和安全等底层工程,无缝融入人类团队。与第一代(网站)和第二代(App)不同,这一代让Claude像同事一样可对话,处理多种工作负载。Karpathy认为这是LLM UIUX的第三次重大重新设计。行业ClaudeAnthropic智能体AI协作企业AI10 个信源在谈推荐理由:Karpathy说Claude以后不是网页也不是App,而是直接插进团队里当同事用,挺颠覆的,值得看看他的思路。原文
07:32berryxia@berryxiaFlowith旗下的Matrix产品接入了GLM-5.2模型,支持1M上下文长程执行。GLM-5.2擅长long-horizon coding和复杂多步执行,与Matrix的agentic workspace结合后,用户可构建产品、部门、工作流甚至整个agent公司。目前Matrix beta用户可领取1000万免费tokens(限时)。这标志着模型能力与执行环境的进一步融合。AI产品GLM-5.2FlowithMatrix智能体编程助手推荐理由:Flowith把GLM-5.2接进Matrix,1M上下文让你直接用AI建公司,beta用户还能领1000万免费tokens。原文
07:25orange.ai@oran_ge精选Anthropic推出Claude Tag功能,允许用户将Claude以团队成员身份添加到Slack频道。用户可通过@Claude Tag委托任务,如总结讨论、回答问题或执行工作流。该功能基于频道上下文(channel based context),而非传统角色或团队上下文。目前已在Slack中可用。AI产品ClaudeSlackAnthropic团队协作智能体10 个信源在谈推荐理由:Anthropic在Slack里加了Claude Tag,@一下就能派活,像多了一个不摸鱼的同事,协作效率直接拉满。原文
06:54Aadit Sheth@aaditshZeb Evans分享其公司在1000人团队中部署5000个智能体,人工与智能体比例达1:5,通过压缩上下文节省token。他强调AI能真正了解你的工作比更聪明的模型更有效,大多数公司用相同工具却因上下文量不同结果天差地别。团队通过Process Miner代理处理每天约10万条公司活动事件,从预处理、摘要和组织的上下文开始工作,而非每次从头搜索。技巧智能体上下文Agenttoken节省流程优化推荐理由:Zeb Evans用5000个agent给1000人干活,重点不是模型多强而是上下文给够。他们自己公司内部就是这么干的,效率飞升。原文
06:52Google AI Developers@googleaidevsGoogle 发布 Gemini Interactions API,用一个端点统一处理文本、多模态输入(图片、音频、视频)、工具调用(Function Calling)和托管智能体。该 API 旨在降低开发复杂度,帮助开发者从提示词快速过渡到生产部署。开发者可在 Google AI Studio 中获取详细指南。AI产品GeminiInteractions APIGoogle多模态智能体推荐理由:Google 把文本、多模态、工具和智能体塞进一个 API 里,少折腾接口,直接跑。原文
06:51Google AI Developers@googleaidevs精选73°Google 在 Gemini API 中推出 Managed Agents 功能,开发者只需一个 prompt 即可创建自主 Agent。该功能自动提供安全临时 Linux 沙箱,无需基础设施配置。Agent 可自主规划、纠错、执行代码。通过 agents.md 和 skills.md 文件定义指令和工具,Agent 能一次 API 调用完成研究主题、生成音频对话、创作音乐和专辑封面等复杂任务。AI产品Gemini APIManaged AgentsGoogle智能体推荐理由:Google 出了 Managed Agents,零配置让 Agent 自动干活,一个 prompt 就能研究主题并做出一个广播节目,比手动搭基础设施省心太多了。原文
06:24cat@_catwuClaude Tag 支持数百种自定义方式,官方分享了6种常见工作流。例如在事件响应中,将 Claude Tag 到 incident 线程后,它能自动拉取图表、diff 部署、找出根因并标记作者。团队可在线程内审批,Claude 自动打开修复、部署上线、监控指标恢复并关闭页面。这套流程节省了从发现问题到修复的跨团队沟通成本。技巧ClaudeClaude Tag智能体工作流事件响应7 个信源在谈推荐理由:想用 Claude 自动化你团队的 incident 响应流程吗?这篇官方指南给出了6个现成工作流模板,套上就能用。原文
06:21LangChain@LangChainAILangChain指出多数团队已有追踪能力,但缺乏持续改进Agent的系统。他们提出的Agent开发生命周期包含四个阶段:构建、测试、部署和监控。该流程以工程师人力速度扩展,无法规模化。团队需用更自动化的方法来迭代优化Agent性能。技巧LangChainAgent智能体开发流程生命周期推荐理由:LangChain总结了一套开发AI Agent的标准流程,帮你解决“只追踪不改进”的痛点,从构建到监控闭环。原文
06:21LangChain@LangChainAILangChain 推出了 LangSmith Engine,一个专门用于改进其他 AI Agent 的智能体。该引擎能从追踪数据中识别问题、聚类模式、自动起草修复方案,并提出评估建议以防止回归。它直接对接 LangSmith 的 tracing 项目,帮助开发者持续优化 agent 表现。AI产品LangSmithLangChainAgent智能体推荐理由:LangChain 出了新工具 Engine,能自动抓你 agent 的 bug、修 bug 还加测试,省心又省力。原文
06:13cat@_catwu74°Anthropic 发布新产品 Claude Tag,允许团队在 Slack 中将 Claude 添加为成员。用户可@Claude 并委派任务,Claude 会根据指令主动工作。内部版本已合并 65% 的产品 PR。这是 Anthropic 首个原生多玩家和主动式产品。AI产品ClaudeAnthropicSlack智能体团队协作10 个信源在谈推荐理由:Anthropic 出了 Claude Tag,你可以在 Slack 里 @Claude 让它干活,团队协作效率超爽。原文
06:13cat@_catwuAnthropic 发布了 Claude Tag 的代理权限配置指南,帮助用户快速上手设置代理身份。指南详细介绍了如何为 Claude Tag 配置 agent 权限,包括关键决策说明和身份配置步骤。用户可以通过该指南了解代理权限的核心概念和操作流程。技巧Claude Tag权限配置智能体Anthropic10 个信源在谈推荐理由:想给你的 Claude Tag 设置代理权限?这篇官方入门指南手把手教你配置,还有关键决策详解。原文
06:12Y Combinator@ycombinatorReynold Xin在YC炉边对话中类比电动机与工厂:AI代理的初效不显著,但重新设计软件工程后可能带来数倍提升。他提出初创公司在构建AI原生产品上有结构优势,因为不受旧架构拖累。下一代基础设施应当从第一天起就为代理工作负载设计,轻量且可扩展。这一观点基于Databricks自身在数据和AI领域的实践经验。行业DatabricksReynold Xin智能体YC软件工程推荐理由:听Databricks联合创始人讲AI代理怎么改变软件开发逻辑,对创业公司尤其有启发。原文
05:58@OpenAIDevs@OpenAIDevs精选76°OpenAI 在 X 上总结了过去6个月为API推出的30多项更新。新模型包括 GPT-5.5、GPT-5.4 mini、GPT-5.4 nano、GPT-Realtime-2、GPT-Realtime-Whisper、GPT-Realtime-Translate 和 GPT-Image-2。Agent 构建模块新增 Agents SDK harness & sandbox、Skills in the Responses API、Server-side compaction、WebSocket mode 和 Hosted shell。此外还推出了 Admin API 增强、OpenAI CLI 以及 Models on Amazon Bedrock 等新功能。AI产品OpenAIGPT-5.5GPT-5.4 miniAPI智能体10 个信源在谈推荐理由:搞API开发的朋友,OpenAI 这半年偷偷发了这么多新模型和Agent工具,GPT-5.5和实时翻译很实用,赶紧看看你漏了哪个。原文
05:45Claude@claudeai72°Claude Tag 是 Anthropic 为 Slack 集成推出的新功能,允许用户通过 @Claude 直接向它委派任务。团队可以设定 Claude 能访问的特定频道和工具,使其像正式成员一样协作。该功能旨在让成员把重复性工作交给 Claude 处理,从而专注其他事务。目前该功能已在 Twitter 上公开介绍。AI产品ClaudeSlackClaude Tag智能体团队协作10 个信源在谈推荐理由:Claude 现在能在 Slack 里当队友用了,@它就能派活,还能限制它能看到哪些频道,适合团队协作。原文
05:30Firecrawl@firecrawl_devFirecrawl 正式成为 Grok 的官方插件,用户可在 CLI 中让 Grok 智能体搜索、抓取并交互任意网页。该插件已上架 xAI 市场,提供每月 1000 次免费额度。这使 Grok 的 agent 能力扩展到实时网络数据访问,拓展了自动化工作流场景。AI产品FirecrawlGrok智能体网页抓取CLI推荐理由:Firecrawl 成了 Grok 的官方插件,以后在命令行就能让智能体抓网页,还送每月1000次免费,挺实用。原文
05:15mem0@mem0aiMem0 发布了针对 Pi Code 的插件,实现持久化、作用域化、语义记忆。该插件能捕获重要信息,通过语义搜索,在 AI 代理需要时带回相关上下文。用户可通过 pi install npm:@mem0/pi-agent-plugin 安装。Pi Code 因此获得跨会话和项目的记忆能力。AI产品Mem0Pi Code智能体语义记忆插件推荐理由:Pi Code 现在能记住你的项目上下文了,装上 Mem0 插件,跨会话也能找回之前的关键信息,写代码更连贯。原文
04:18LangChain@LangChainAI精选LangChain团队发布博客,介绍Deep Agents中的解释器功能。该方法在智能体循环内嵌入小型运行时,允许智能体动态编写和运行代码。这增强了智能体的灵活性和自主执行能力。博客由团队成员Hunt Lovell撰写,详细解释了实现原理。AI产品LangChainDeep Agents解释器代码执行智能体推荐理由:LangChain教你让智能体自己写代码执行,比传统工具调用更灵活,适合复杂任务。原文
03:45Alex Albert@alexalbert__Claude 推出新功能 Claude Tag,使 Claude 能作为团队成员加入 Slack 频道。用户可以直接 @Claude 并在频道中委派任务,同时继续处理其他工作。该功能支持选择 Claude 可访问的频道和工具。目前已有 176 个点赞和 21543 次查看,显示社区高度关注。AI产品ClaudeSlack智能体团队协作10 个信源在谈推荐理由:Claude 能在 Slack 里被 @ 了,像同事一样帮你干活,省了来回切换的麻烦。原文
03:27AK@_akhaliqLing and Ring 2.6 技术报告发布,展示了在万亿参数规模下实现高效且即时的智能体智能。该模型专注于 agentic intelligence 领域,通过优化架构和推理机制降低延迟。报告详细介绍了其训练方法、性能基准以及与传统大模型的对比结果。具体数字和基准名称需查阅完整报告。AI模型Ling and Ring智能体万亿参数规模推理模型推荐理由:想了解万亿参数级别的智能体模型怎么做吗?Ling and Ring 2.6 报告给出了具体方案。原文
02:26Harrison Chase@hwchase17精选Harrison Chase 指出,发布第一版只是构建智能体工作的一小部分,更关键的是建立可重复的改进生命周期。该流程包括 5 步:1)Build——搭配 agent、tools、context、prompts 和 workflows 构建可用原型;2)Test——使用 evals 评估 agent 行为是否正确,而非仅输出类似内容;3)Deploy——将 agent 部署到生产环境;4)Monitor——通过 traces 追踪 agent 实际调用的工具、使用的上下文和失败点;5)Improve——从真实使用中学习,优化 prompts、tools、evals 和 agent 本身。Chase 将在 6 月 24 日的“The Agent Development Lifecycle 101”网络研讨会中详细讲解。技巧LangChainAgent智能体工作流构建流程1 个信源在谈推荐理由:LangChain 创始人手把手教你如何迭代改进智能体,从构建到上线再到优化,全是实操干货,适合所有做 AI Agent 的团队。原文
02:25LangChain@LangChainAI精选LangChain联合创始人Harrison Chase在X上分享了构建可靠Agent的关键:发布第一个版本只是小部分工作,需要可重复的生命周期。该周期包括5个步骤:1) Build,构建Agent、工具、上下文、提示词和工作流;2) Test,使用eval确保Agent做正确的事;3) Deploy,将Agent部署到生产环境;4) Monitor,通过追踪查看Agent调用了什么工具、用了什么上下文、在哪失败;5) Improve,根据实际使用改进提示词、工具、eval和Agent。他将于6月24日在网络研讨会上详细讲解此生命周期。技巧LangChainHarrison Chase智能体开发周期Agent推荐理由:看看LangChain创始人怎么说Agent开发全流程——不只是搭出来,还要测试、部署、监控、迭代。五个步骤讲清楚怎么做出靠谱的Agent。原文
02:24elvis@omarsar0Latitude是一个开源(MIT许可)的Agent可观测性工具。将Latitude指向Claude Code设置后,可实时查看token预算消耗情况。它能展示Agent的完整行为,捕获重复失败的任务,并显示频率和原因。用户无需离开编辑器即可直接修复这些问题。AI产品LatitudeClaude Code智能体可观测性推荐理由:Claude Code吃token太猛?Latitude实时监控还能捉住重复失败的bug,免费开源,省心省钱!原文
02:15LangChain@LangChainAI精选LangChain 发布基于 Deep Agents 的循环工程方法,通过 self-harness 实现智能体自我改进。流程分三步:运行代理并观察失败(弱点挖掘)、提出 harness 改进方案、验证改进有效且无回归。论文见 arxiv.org/pdf/2606.09498,代码开源在 github.com/langchain-ai/d…。该方法可系统性提升 Agent 鲁棒性。技巧Deep AgentsLangChain智能体循环工程自我改进推荐理由:LangChain 公布了一种让智能体自己找弱点并改进的循环方法,每一步都给了具体操作,想调优 Agent 的可以照着试试。原文
01:36LangChain@LangChainAILangSmith Fleet 提供了两种类型的 agent:General Purpose Chat 和 Specialized Agents。通用代理适合开放式对话,专用代理针对特定任务优化。LangChain 博客详细解释了这种设计是故意的,并给出了选择建议。技巧LangSmithLangChain智能体通用聊天专用代理推荐理由:LangChain 发了新博客,讲他们 Fleet 的两种 agent 怎么选,通用聊天还是专用任务,挺实用的。原文
01:28DeepLearning.AI@DeepLearningAIDeepLearning.AI 发起为期7天的语音AI构建者挑战,目标是让AI编码代理仅在需要人类判断时请求帮助。参与者需要构建系统,使代理能在遇到自主解决不了的障碍时通过语音通知人类。挑战提供实时反馈和排行榜,优胜者将获得奖品。技巧DeepLearning.AIVoice AI编程助手智能体推荐理由:DeepLearning.AI 搞了个7天挑战,教你的AI编码代理只在必要时叫你帮忙,还有实时排行榜和奖品。原文