全部 AI 动态 · AI 热点

6月24日

22:39

阿里通义 Qwen@Alibaba_Qwen

精选73°

阿里Qwen团队开源了Qwen-AgentWorld-35B-A3B模型，采用MoE架构，总参数量35B，每次推理激活3B参数，支持256K上下文长度。同时发布了AgentWorldBench基准，用于评估智能体的世界建模能力。该模型在多个现实环境模拟任务上表现优于同等规模模型。相关论文已发布于arXiv，代码和模型权重在GitHub和Hugging Face上开放。

AI模型 Qwen AgentWorld MoE 智能体世界建模

推荐理由：阿里新开源了35B参数的MoE模型，只激活3B，256K超长上下文，配合AgentWorldBench，研究智能体世界建模的赶紧试试。

原文

22:39

阿里通义 Qwen@Alibaba_Qwen

精选71°

Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型，在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标，而非后处理适配。在AgentWorldBench基准上，该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习，效果超过在真实环境中训练。仅通过预测环境的预热训练，无需智能体特定微调，预测知识即可零微调迁移至智能体任务。

AI模型 Qwen-AgentWorld 智能体世界模型模拟环境强化学习

推荐理由：阿里Qwen造了个能模拟7种环境的AgentWorld，在AgentWorldBench上干掉了Claude和GPT最新版，训练智能体不用真实环境也能更强，零微调迁移呢。

原文

19:24

The Rundown AI@therundownai

Anthropic的Claude现在作为agentic coworker集成到Slack中。用户可以直接在Slack对话中调用Claude执行任务、回答问题和编写代码。该功能利用Claude 3.5 Sonnet的agentic能力实现自主工作。Meta同时宣布加大AI智能眼镜研发投入，但未公布具体数字。

AI产品 Claude Slack Anthropic 智能体协作工具

推荐理由：Claude现在能直接在Slack里当同事用，不用切窗口就能让它写报告查数据，团队协作效率拉满。

原文

19:12

orange.ai@oran_ge

Cola上线了Seed 2.1 Pro模型，这是一款原生多模态模型，官方声称是目前多模态最强。相比Seed 2.0版本，该模型在Coding和Agent能力上有所增强。用户可通过colaos.ai进行体验。

AI模型 Cola Seed 2.1 Pro 多模态智能体代码能力

推荐理由：Cola刚发了Seed 2.1 Pro，说是多模态最强，coding和agent比2.0强不少，想试试去colaos.ai就行。

原文

17:30

Latent.Space@latentspacepod

精选76°

Anthropic发布了Claude Tag，一个针对Slack的Claude AI bot更新。它支持多玩家协作和主动监控功能，类似于Claude Code的增强版。内部版本已合并65%的产品PRs。这是Anthropic首个原生多玩家和主动式产品。

AI产品 Claude Anthropic Slack 智能体协作

推荐理由：Anthropic的Claude Tag让Slack里的Agent能多人协作、主动干活，内部已合并65% PR，值得试试。

原文

16:09

berryxia@berryxia

精选

Anthropic内部工程师运行300多个自改进的agent swarm来提升系统可靠性。核心方法是给模型验证自身输出的机制，包括计划模式、动态工作流和自我检查，根据真实反馈迭代。这种闭环系统让agent从一次性工具变为能自我迭代的系统，可靠性大幅提升但token消耗更高。效果远超大多数300美元的agent课程。

技巧 Anthropic 智能体 agent 工作流自改进

推荐理由：Anthropic工程师自己怎么用agent？300个自改进swarm加闭环验证，比花300美元买课实用多了。

原文

12:30

Nous Research@NousResearch

Hermes Agent现在支持用户领养一个动画宠物精灵，该宠物会在agent空闲、运行工具、思考、等待、完成、失败等状态下做出不同反应。用户可通过petdex画廊从近3000种宠物中选择，也可以提交自定义宠物。该功能在GUI和TUI界面中均可用。

AI产品 Hermes Agent NousResearch 动画宠物智能体 petdex

推荐理由：给智能体领养一个会动的宠物，近3000种图案可选，还能自己画，太有趣了

原文

10:58

shao__meng@shao__meng

精选

作者使用Apodex（自进化重型求解器）测试了“AI Agent公司如何选择产品方向”，将问题拆解为开发者工具、企业工作流、研究助手三条线，并补充VC视角、TAM、Menlo Ventures等来源。经过反复证据核查，Apodex给出排序：垂直企业工作流Agent第一，垂直研究助手第二，开发者工具第三。它指出开发者工具竞争激烈，已有Codex、Cursor、Claude Code、Devin等占据用户心智，新公司难差异化。Apodex适合处理变量多、需验证证据的复杂问题，如创业方向、行业进入时机等。

AI产品 Apodex 智能体企业工作流编程助手

推荐理由：用Apodex做了个创业方向测试，它把问题拆成多条线，反复查证据才给结论，比普通聊天机器人靠谱很多。

原文

10:45

shao__meng@shao__meng

精选

Codex官方博客发布了Remote工程实践指南，提出手机是控制面而非终端的核心心智模型。指南列出了10个高杠杆能力，包括Queue与Steer模式切换、Side Chat旁路对话、Plan与Goal两种任务模式。还介绍了5个典型工作流如Release Captain和Mobile Reviewer，强调权限粒度与上下文生命周期管理。该指南旨在帮助开发者在手机上高效启动、指挥、审批远程开发任务。

技巧 Codex Remote OpenAI 编程助手智能体

推荐理由：Codex官方写了10个手机上用Remote的实战技巧，比如用Steer纠偏、手机做Code Review，比单纯盯进度实用多了。想远程开发效率翻倍可以看看。

原文

10:44

AI Will@FinanceYF5

Andrej Karpathy将Claude Tag定义为LLM交互的第三次范式迁移。第一代是网站访问模型，第二代是本地App，第三代是持久存在的团队成员，可异步工作并共享组织工具与上下文。Karpathy指出这一转变“需要一点时间理解，但确实有效且厉害”。该评论基于Claude Tag的实际功能体验。

行业 Andrej Karpathy Claude Tag 智能体 LLM交互

推荐理由：Andrej Karpathy把Claude Tag比作团队里的异步同事，这视角挺新鲜，值得看看他怎么说的。

原文

10:43

AI Will@FinanceYF5

72°

Andrej Karpathy将Claude的新交互模式称为LLM UI/UX的第三次重大重新设计。前两次分别是将LLM作为网站访问和作为App下载。第三次是把LLM打造成一个自包含、持久、异步的实体，拥有组织范围的工具和上下文。他认为这种模式让Claude无缝加入团队，可以像与人交谈一样交互。

行业 Claude Andrej Karpathy 智能体人机协作

推荐理由：Karpathy发了条推，说Claude现在可以像团队同事一样跟你干活，比当网站或App好用多了，建议看看他的新思路。

原文

10:42

AI Will@FinanceYF5

精选

Anthropic发布了Claude Tag，将其嵌入Slack，用户可在频道中像@同事一样@它分配任务。该功能在频道内共享上下文，无需重复解释。开启ambient模式后，Claude Tag会主动跟进未解决的任务。Anthropic内部65%的代码由Claude Tag生成。目前Enterprise和Team用户可用。

AI产品 Anthropic Claude Tag Slack 智能体代码生成

推荐理由：把Claude当同事用：Slack里@它分配任务，自动记忆上下文，Ambient模式主动跟进未解决问题。

原文

10:26

Guillermo Rauch@rauchg

Vercel 创始人 Rauchg 在 X 上宣布为 eve.dev 创建一个反馈群。面向深度构建智能体的开发者。参与者可通过私信申请加入。直接与 eve 工程师交流。旨在收集高质量批评性反馈和需求。

AI产品 eve.dev Vercel Rauchg 智能体开发者社区

推荐理由：做智能体开发的朋友，eve.dev 的工程师想直接听你吐槽。有意见可以私信 Rauchg 加入讨论群。

原文

07:38

Notion@NotionHQ

Notion的运营主管Amy构建了一套AI代理套件，自动处理日常行政工作：一个代理自动起草邮件回复会议安排请求，第二个代理每日检查联合创始人日历并分配会议室和会议细节，第三个AI代理自动生成会议笔记并转化为行动项。她还有一个代理监控其他代理的运行情况。Amy表示AI帮她节省了时间，并减轻了精神负担，她像带新人一样逐步给代理更多自主权。

技巧 Notion 智能体工作流办公自动化

推荐理由：Notion的运营主管分享了用AI自动处理邮件、安排会议室、记会议笔记的实际方法，还有代理监控代理的妙招。

原文

07:38

Nous Research@NousResearch

精选

Hermes Agent 推出新指令 /learn，允许用户向其提供任意源材料（包括代码、API 文档、手册、PDF 和配置文件），Agent 会自动学习并提炼出可验证且可重复使用的技能。该功能无需手动编写技能，只需指定数据目录即可。目前通过 NousResearch 平台开放使用。

AI产品 Hermes Agent NousResearch 智能体技能学习

推荐理由：Hermes Agent 现在能直接从代码、文档里学技能，喂什么学什么，省去手动配置，适合开发者和团队快速复用知识。

原文

07:36

Andrej Karpathy@karpathy

Andrej Karpathy提出LLM交互的第三次范式变革：Claude作为自包含、持久、异步的实体，通过工具集成、计算环境、内存和安全等底层工程，无缝融入人类团队。与第一代（网站）和第二代（App）不同，这一代让Claude像同事一样可对话，处理多种工作负载。Karpathy认为这是LLM UIUX的第三次重大重新设计。

行业 Claude Anthropic 智能体 AI协作企业AI

推荐理由：Karpathy说Claude以后不是网页也不是App，而是直接插进团队里当同事用，挺颠覆的，值得看看他的思路。

原文

07:32

berryxia@berryxia

Flowith旗下的Matrix产品接入了GLM-5.2模型，支持1M上下文长程执行。GLM-5.2擅长long-horizon coding和复杂多步执行，与Matrix的agentic workspace结合后，用户可构建产品、部门、工作流甚至整个agent公司。目前Matrix beta用户可领取1000万免费tokens（限时）。这标志着模型能力与执行环境的进一步融合。

AI产品 GLM-5.2 Flowith Matrix 智能体编程助手

推荐理由：Flowith把GLM-5.2接进Matrix，1M上下文让你直接用AI建公司，beta用户还能领1000万免费tokens。

原文

07:25

orange.ai@oran_ge

精选

Anthropic推出Claude Tag功能，允许用户将Claude以团队成员身份添加到Slack频道。用户可通过@Claude Tag委托任务，如总结讨论、回答问题或执行工作流。该功能基于频道上下文（channel based context），而非传统角色或团队上下文。目前已在Slack中可用。

AI产品 Claude Slack Anthropic 团队协作智能体

推荐理由：Anthropic在Slack里加了Claude Tag，@一下就能派活，像多了一个不摸鱼的同事，协作效率直接拉满。

原文

06:54

Aadit Sheth@aaditsh

Zeb Evans分享其公司在1000人团队中部署5000个智能体，人工与智能体比例达1:5，通过压缩上下文节省token。他强调AI能真正了解你的工作比更聪明的模型更有效，大多数公司用相同工具却因上下文量不同结果天差地别。团队通过Process Miner代理处理每天约10万条公司活动事件，从预处理、摘要和组织的上下文开始工作，而非每次从头搜索。

技巧智能体上下文 Agent token节省流程优化

推荐理由：Zeb Evans用5000个agent给1000人干活，重点不是模型多强而是上下文给够。他们自己公司内部就是这么干的，效率飞升。

原文

06:52

Google AI Developers@googleaidevs

Google 发布 Gemini Interactions API，用一个端点统一处理文本、多模态输入（图片、音频、视频）、工具调用（Function Calling）和托管智能体。该 API 旨在降低开发复杂度，帮助开发者从提示词快速过渡到生产部署。开发者可在 Google AI Studio 中获取详细指南。

AI产品 Gemini Interactions API Google 多模态智能体

推荐理由：Google 把文本、多模态、工具和智能体塞进一个 API 里，少折腾接口，直接跑。

原文

06:51

Google AI Developers@googleaidevs

精选73°

Google 在 Gemini API 中推出 Managed Agents 功能，开发者只需一个 prompt 即可创建自主 Agent。该功能自动提供安全临时 Linux 沙箱，无需基础设施配置。Agent 可自主规划、纠错、执行代码。通过 agents.md 和 skills.md 文件定义指令和工具，Agent 能一次 API 调用完成研究主题、生成音频对话、创作音乐和专辑封面等复杂任务。

AI产品 Gemini API Managed Agents Google 智能体

推荐理由：Google 出了 Managed Agents，零配置让 Agent 自动干活，一个 prompt 就能研究主题并做出一个广播节目，比手动搭基础设施省心太多了。

原文

06:24

cat@_catwu

Claude Tag 支持数百种自定义方式，官方分享了6种常见工作流。例如在事件响应中，将 Claude Tag 到 incident 线程后，它能自动拉取图表、diff 部署、找出根因并标记作者。团队可在线程内审批，Claude 自动打开修复、部署上线、监控指标恢复并关闭页面。这套流程节省了从发现问题到修复的跨团队沟通成本。

技巧 Claude Claude Tag 智能体工作流事件响应

推荐理由：想用 Claude 自动化你团队的 incident 响应流程吗？这篇官方指南给出了6个现成工作流模板，套上就能用。

原文

06:21

LangChain@LangChainAI

LangChain指出多数团队已有追踪能力，但缺乏持续改进Agent的系统。他们提出的Agent开发生命周期包含四个阶段：构建、测试、部署和监控。该流程以工程师人力速度扩展，无法规模化。团队需用更自动化的方法来迭代优化Agent性能。

技巧 LangChain Agent 智能体开发流程生命周期

推荐理由：LangChain总结了一套开发AI Agent的标准流程，帮你解决“只追踪不改进”的痛点，从构建到监控闭环。

原文

06:21

LangChain@LangChainAI

LangChain 推出了 LangSmith Engine，一个专门用于改进其他 AI Agent 的智能体。该引擎能从追踪数据中识别问题、聚类模式、自动起草修复方案，并提出评估建议以防止回归。它直接对接 LangSmith 的 tracing 项目，帮助开发者持续优化 agent 表现。

AI产品 LangSmith LangChain Agent 智能体

推荐理由：LangChain 出了新工具 Engine，能自动抓你 agent 的 bug、修 bug 还加测试，省心又省力。

原文

06:13

cat@_catwu

74°

Anthropic 发布新产品 Claude Tag，允许团队在 Slack 中将 Claude 添加为成员。用户可@Claude 并委派任务，Claude 会根据指令主动工作。内部版本已合并 65% 的产品 PR。这是 Anthropic 首个原生多玩家和主动式产品。

AI产品 Claude Anthropic Slack 智能体团队协作

推荐理由：Anthropic 出了 Claude Tag，你可以在 Slack 里 @Claude 让它干活，团队协作效率超爽。

原文

06:13

cat@_catwu

Anthropic 发布了 Claude Tag 的代理权限配置指南，帮助用户快速上手设置代理身份。指南详细介绍了如何为 Claude Tag 配置 agent 权限，包括关键决策说明和身份配置步骤。用户可以通过该指南了解代理权限的核心概念和操作流程。

技巧 Claude Tag 权限配置智能体 Anthropic

推荐理由：想给你的 Claude Tag 设置代理权限？这篇官方入门指南手把手教你配置，还有关键决策详解。

原文

06:12

Y Combinator@ycombinator

Reynold Xin在YC炉边对话中类比电动机与工厂：AI代理的初效不显著，但重新设计软件工程后可能带来数倍提升。他提出初创公司在构建AI原生产品上有结构优势，因为不受旧架构拖累。下一代基础设施应当从第一天起就为代理工作负载设计，轻量且可扩展。这一观点基于Databricks自身在数据和AI领域的实践经验。

行业 Databricks Reynold Xin 智能体 YC 软件工程

推荐理由：听Databricks联合创始人讲AI代理怎么改变软件开发逻辑，对创业公司尤其有启发。

原文

05:58

@OpenAIDevs@OpenAIDevs

精选76°

OpenAI 在 X 上总结了过去6个月为API推出的30多项更新。新模型包括 GPT-5.5、GPT-5.4 mini、GPT-5.4 nano、GPT-Realtime-2、GPT-Realtime-Whisper、GPT-Realtime-Translate 和 GPT-Image-2。Agent 构建模块新增 Agents SDK harness & sandbox、Skills in the Responses API、Server-side compaction、WebSocket mode 和 Hosted shell。此外还推出了 Admin API 增强、OpenAI CLI 以及 Models on Amazon Bedrock 等新功能。

AI产品 OpenAI GPT-5.5 GPT-5.4 mini API 智能体

推荐理由：搞API开发的朋友，OpenAI 这半年偷偷发了这么多新模型和Agent工具，GPT-5.5和实时翻译很实用，赶紧看看你漏了哪个。

原文

05:45

Claude@claudeai

72°

Claude Tag 是 Anthropic 为 Slack 集成推出的新功能，允许用户通过 @Claude 直接向它委派任务。团队可以设定 Claude 能访问的特定频道和工具，使其像正式成员一样协作。该功能旨在让成员把重复性工作交给 Claude 处理，从而专注其他事务。目前该功能已在 Twitter 上公开介绍。

AI产品 Claude Slack Claude Tag 智能体团队协作

推荐理由：Claude 现在能在 Slack 里当队友用了，@它就能派活，还能限制它能看到哪些频道，适合团队协作。

原文

05:30

Firecrawl@firecrawl_dev

Firecrawl 正式成为 Grok 的官方插件，用户可在 CLI 中让 Grok 智能体搜索、抓取并交互任意网页。该插件已上架 xAI 市场，提供每月 1000 次免费额度。这使 Grok 的 agent 能力扩展到实时网络数据访问，拓展了自动化工作流场景。

AI产品 Firecrawl Grok 智能体网页抓取 CLI

推荐理由：Firecrawl 成了 Grok 的官方插件，以后在命令行就能让智能体抓网页，还送每月1000次免费，挺实用。

原文

05:15

mem0@mem0ai

Mem0 发布了针对 Pi Code 的插件，实现持久化、作用域化、语义记忆。该插件能捕获重要信息，通过语义搜索，在 AI 代理需要时带回相关上下文。用户可通过 pi install npm:@mem0/pi-agent-plugin 安装。Pi Code 因此获得跨会话和项目的记忆能力。

AI产品 Mem0 Pi Code 智能体语义记忆插件

推荐理由：Pi Code 现在能记住你的项目上下文了，装上 Mem0 插件，跨会话也能找回之前的关键信息，写代码更连贯。

原文

04:18

LangChain@LangChainAI

精选

LangChain团队发布博客，介绍Deep Agents中的解释器功能。该方法在智能体循环内嵌入小型运行时，允许智能体动态编写和运行代码。这增强了智能体的灵活性和自主执行能力。博客由团队成员Hunt Lovell撰写，详细解释了实现原理。

AI产品 LangChain Deep Agents 解释器代码执行智能体

推荐理由：LangChain教你让智能体自己写代码执行，比传统工具调用更灵活，适合复杂任务。

原文

03:45

Alex Albert@alexalbert__

Claude 推出新功能 Claude Tag，使 Claude 能作为团队成员加入 Slack 频道。用户可以直接 @Claude 并在频道中委派任务，同时继续处理其他工作。该功能支持选择 Claude 可访问的频道和工具。目前已有 176 个点赞和 21543 次查看，显示社区高度关注。

AI产品 Claude Slack 智能体团队协作

推荐理由：Claude 能在 Slack 里被 @ 了，像同事一样帮你干活，省了来回切换的麻烦。

原文

03:27

AK@_akhaliq

Ling and Ring 2.6 技术报告发布，展示了在万亿参数规模下实现高效且即时的智能体智能。该模型专注于 agentic intelligence 领域，通过优化架构和推理机制降低延迟。报告详细介绍了其训练方法、性能基准以及与传统大模型的对比结果。具体数字和基准名称需查阅完整报告。

AI模型 Ling and Ring 智能体万亿参数规模推理模型

推荐理由：想了解万亿参数级别的智能体模型怎么做吗？Ling and Ring 2.6 报告给出了具体方案。

原文

02:26

Harrison Chase@hwchase17

精选

Harrison Chase 指出，发布第一版只是构建智能体工作的一小部分，更关键的是建立可重复的改进生命周期。该流程包括 5 步：1）Build——搭配 agent、tools、context、prompts 和 workflows 构建可用原型；2）Test——使用 evals 评估 agent 行为是否正确，而非仅输出类似内容；3）Deploy——将 agent 部署到生产环境；4）Monitor——通过 traces 追踪 agent 实际调用的工具、使用的上下文和失败点；5）Improve——从真实使用中学习，优化 prompts、tools、evals 和 agent 本身。Chase 将在 6 月 24 日的“The Agent Development Lifecycle 101”网络研讨会中详细讲解。

技巧 LangChain Agent 智能体工作流构建流程

推荐理由：LangChain 创始人手把手教你如何迭代改进智能体，从构建到上线再到优化，全是实操干货，适合所有做 AI Agent 的团队。

原文

02:25

LangChain@LangChainAI

精选

LangChain联合创始人Harrison Chase在X上分享了构建可靠Agent的关键：发布第一个版本只是小部分工作，需要可重复的生命周期。该周期包括5个步骤：1) Build，构建Agent、工具、上下文、提示词和工作流；2) Test，使用eval确保Agent做正确的事；3) Deploy，将Agent部署到生产环境；4) Monitor，通过追踪查看Agent调用了什么工具、用了什么上下文、在哪失败；5) Improve，根据实际使用改进提示词、工具、eval和Agent。他将于6月24日在网络研讨会上详细讲解此生命周期。

技巧 LangChain Harrison Chase 智能体开发周期 Agent

推荐理由：看看LangChain创始人怎么说Agent开发全流程——不只是搭出来，还要测试、部署、监控、迭代。五个步骤讲清楚怎么做出靠谱的Agent。

原文

02:24

elvis@omarsar0

Latitude是一个开源（MIT许可）的Agent可观测性工具。将Latitude指向Claude Code设置后，可实时查看token预算消耗情况。它能展示Agent的完整行为，捕获重复失败的任务，并显示频率和原因。用户无需离开编辑器即可直接修复这些问题。

AI产品 Latitude Claude Code 智能体可观测性

推荐理由：Claude Code吃token太猛？Latitude实时监控还能捉住重复失败的bug，免费开源，省心省钱！

原文

02:15

LangChain@LangChainAI

精选

LangChain 发布基于 Deep Agents 的循环工程方法，通过 self-harness 实现智能体自我改进。流程分三步：运行代理并观察失败（弱点挖掘）、提出 harness 改进方案、验证改进有效且无回归。论文见 arxiv.org/pdf/2606.09498，代码开源在 github.com/langchain-ai/d…。该方法可系统性提升 Agent 鲁棒性。

技巧 Deep Agents LangChain 智能体循环工程自我改进

推荐理由：LangChain 公布了一种让智能体自己找弱点并改进的循环方法，每一步都给了具体操作，想调优 Agent 的可以照着试试。

原文

01:36

LangChain@LangChainAI

LangSmith Fleet 提供了两种类型的 agent：General Purpose Chat 和 Specialized Agents。通用代理适合开放式对话，专用代理针对特定任务优化。LangChain 博客详细解释了这种设计是故意的，并给出了选择建议。

技巧 LangSmith LangChain 智能体通用聊天专用代理

推荐理由：LangChain 发了新博客，讲他们 Fleet 的两种 agent 怎么选，通用聊天还是专用任务，挺实用的。

原文

01:28

DeepLearning.AI@DeepLearningAI

DeepLearning.AI 发起为期7天的语音AI构建者挑战，目标是让AI编码代理仅在需要人类判断时请求帮助。参与者需要构建系统，使代理能在遇到自主解决不了的障碍时通过语音通知人类。挑战提供实时反馈和排行榜，优胜者将获得奖品。

技巧 DeepLearning.AI Voice AI 编程助手智能体

推荐理由：DeepLearning.AI 搞了个7天挑战，教你的AI编码代理只在必要时叫你帮忙，还有实时排行榜和奖品。

原文