全部 AI 动态 · AI 热点

AITOP

6月11日

01:21

Notion@NotionHQ

Notion 展示了如何用 Custom Agents 功能构建市场情报智能体，自动抓取最新新闻、生成周报并推送到 Slack。该功能让个人或小团队也能像大公司一样拥有专业市场情报团队。视频教程详细演示了从配置到自动化的完整流程。

AI产品 Notion 智能体市场情报自动化 Slack

推荐理由：市场分析人员或小团队终于能用 AI 自动化情报收集，省去手动搜索和整理的时间，建议直接跟着教程搭建一个试试。

原文

00:52

lmarena.ai@lmarena_ai

72°

Agent Arena 团队指出，传统依赖人类偏好的评测方式无法扩展至智能体场景，因为人类难以判断30分钟轨迹中的数百次工具调用。他们构建了基于真实使用轨迹的客观信号评测方法，包括Bash错误、工具幻觉和“疯狂信号”等指标。这种方法能更准确地评估智能体在复杂任务中的表现，避免人类主观判断的局限性。该评测方法已应用于Agent Arena排行榜，为开发者提供更可靠的模型性能参考。

AI模型智能体评测方法 Agent Arena 工具调用客观信号

推荐理由：智能体评测一直是个难题，Agent Arena 用真实轨迹信号替代人类偏好，做智能体开发的团队可以直接参考这套方法论来改进自己的评测体系。

原文

00:49

Philipp Schmid@_philschmid

72°

Phil Schmid 发布了一篇交互式博客，深入解析 Gemini Managed Agents 的内部工作原理。该代理通过一次 API 调用即可启动一个隔离沙箱，在其中进行推理、调用工具、执行代码并读取输出，直至任务完成。博客包含一个可点击的实时模拟器，展示了执行循环、沙箱内部运作以及 API 与沙箱之间的通信过程。

AI产品 Gemini 智能体沙箱 API 交互式博客

推荐理由：想理解 Gemini 代理如何自动完成复杂任务的开发者，这篇博客用交互式模拟器把执行循环讲透了，建议点开动手试试。

原文

00:47

OpenRouter@OpenRouterAI

OpenRouter 发布了全新的 Activity explorer 功能，这是一个中央控制面板，允许用户按模型、用户和智能体深入查看使用数据。该工具实时更新，展示团队在每个模型上的花费、token 使用量、缓存命中率、智能体活动及趋势。用户可以在一个地方追踪和管理所有使用情况，有助于优化成本和提高效率。

AI产品 OpenRouter Activity explorer 使用数据成本监控智能体

推荐理由：OpenRouter 的 Activity explorer 解决了多模型使用数据分散难追踪的问题，做 AI 应用开发或管理多个模型的团队可以直接用它来监控成本和优化资源分配，建议试试。

原文

6月10日

23:49

LangChain@LangChainAI

LangSmith Sandboxes 现已正式发布（GA），这是一个专为智能体代码执行设计的安全、可扩展环境。它与 Deep Agents SDK 和 LangSmith 平台深度集成，为开发者提供隔离的代码运行沙箱。该功能解决了智能体执行代码时的安全性和资源管理问题，适合构建和测试复杂智能体应用的团队。

AI产品智能体 LangSmith 沙箱代码执行安全

推荐理由：做智能体开发的团队终于有了官方集成的安全沙箱——LangSmith Sandboxes 解决了代码执行的安全和扩展痛点，用 LangChain 的可以直接集成使用。

原文

23:19

LangChain@LangChainAI

LangChain 发布了 Managed Deep Agents，允许团队在 LangSmith 中托管和管理深度智能体。用户只需在代码仓库中定义智能体，然后通过 API 在 LangSmith 中创建和操作托管智能体。该服务旨在简化深度智能体的部署和运维，让团队无需自行管理运行时基础设施。对于需要快速将深度智能体投入生产的团队来说，这是一个高效的选择。

AI产品智能体 LangSmith 托管服务 API LangChain

推荐理由：做智能体应用的团队终于可以省去自建运行时的麻烦——LangChain 把深度智能体的托管基础设施打包好了，直接用 API 就能管理，建议有部署需求的团队点开看看。

原文

19:15

The Rundown AI@therundownai

Anthropic 向公众推出了其 Mythos 级别的 AI 模型，标志着其在 AI 能力上的又一次重大提升。Perplexity 发布的数据地图显示了智能体工作模式的转变趋势，表明 AI 代理正在从概念走向实际应用。此外，Dexter 工具实现了金融研究的自动化，而 Codex 则帮助日本一家西兰花农场实现了自动化运营。同时，还有 4 款新的 AI 工具和社区工作流发布，展示了 AI 在各行业的渗透。这些进展共同反映了 AI 在自动化、研究和农业等领域的快速落地。

AI产品 Anthropic Mythos Perplexity 智能体自动化

推荐理由：Anthropic 的 Mythos 级 AI 可能带来更强的推理能力，AI 从业者和开发者值得关注其实际表现；Perplexity 的数据地图则给做智能体产品的团队提供了市场信号，建议点开看看趋势。

原文

12:51

lmarena.ai@lmarena_ai

Anthropic 的 Claude Fable 5 模型在 Agent Arena 中首次亮相，由 Peter Gostev 进行评测。该视频展示了模型在智能体任务中的表现，包括推理、工具调用和交互能力。Claude Fable 5 被认为在复杂任务处理上有所提升，为开发者提供了新的选择。

AI产品 Claude Fable 5 智能体评测 Anthropic Agent Arena

推荐理由：做智能体开发的团队可以看看 Claude Fable 5 在 Agent Arena 的实际表现，直接对比其他模型，值得点开视频一探究竟。

原文

12:19

Notion@NotionHQ

Notion 团队开发了一个名为 Grug 的“穴居人设计师”自定义智能体，专门用于提供直白、反复杂的产品和设计反馈。Grug 的核心原则是“复杂坏，简单好，按钮看起来得像按钮”。在最近的一次全员大会上，Grug 给出了类似的简洁建议。这个智能体旨在帮助团队保持产品设计的简洁性，避免过度工程化。

AI产品智能体产品设计 Notion 反复杂设计反馈

推荐理由：做产品设计和开发的团队，如果厌倦了冗长的设计评审，Grug 的“穴居人”思维值得借鉴——它用最直接的方式对抗复杂性，帮你回归产品本质。

原文

11:48

AI Will@FinanceYF5

76°

OpenAI 内部员工向金融时报透露，ChatGPT 即将进行重大改版，从单一的聊天界面转型为整合 Codex、Agent、图像生成和第三方应用的超级 App。这一变化意味着传统的聊天框模式将被取代，ChatGPT 将成为一个能横跨工作和生活的全能 AI 助理。改版将在几周内分阶段推出，标志着 AI 交互方式的根本性转变。

AI产品 ChatGPT 超级App 智能体 Codex AI助理

推荐理由：ChatGPT 从聊天框进化成超级 App，意味着 AI 交互方式即将被重新定义——做 AI 产品、用 AI 工具的人，未来几周就能看到变化，值得提前关注。

原文

11:40

Cognition@cognition_labs

83°

Cognition 宣布其最强智能体 Devin Ultra 现已集成 Claude Fable 5，专为长周期任务和调试优化。通过调整 harness，Ultra 的成本仅比默认 Devin 智能体高出约 40%。Claude Fable 5 还可在 Devin Desktop 和 Devin CLI 中使用。这为需要复杂自动化流程的开发者提供了更强大的选择。

AI产品 Devin Claude Fable 5 智能体调试编程助手

推荐理由：做复杂自动化或深度调试的开发者，现在可以用 Devin Ultra 以更可控的成本获得 Claude Fable 5 的能力，值得直接尝试。

原文

11:23

AI Will@FinanceYF5

76°

MIT一项新研究发现，AI编码工具虽然大幅提升了代码提交量（自主智能体提升180%），但实际软件发布量仅增加30%。研究分析了超过10万名GitHub开发者使用三代AI工具（自动补全、交互式、自主智能体）的数据，发现代码量与产出之间存在巨大鸿沟。核心原因在于软件开发中存在多个薄弱环节：人类仍需负责需求决策、代码审查、系统集成、边缘情况修复和最终发布。应用市场数据也显示，新应用数量增加但总使用量未上升，表明用户并未更多采用这些新软件。

论文 AI编码工具 GitHub MIT研究软件开发效率智能体

推荐理由：这项研究戳破了AI编码效率的泡沫，做AI工具或依赖AI编程的团队看完会重新评估投入产出比——代码量翻倍不等于交付翻倍，值得所有技术管理者点开。

原文

10:21

AI Will@FinanceYF5

83°

Claude Fable 5 于今日发布，展示了惊人的自主任务能力：一天内修改 5000 万行代码、不依赖攻略通关宝可梦、先构建 CAD 软件再用其建模。这标志着 AI 从对话工具进化为能独立完成完整任务的智能体，对开发者和自动化领域意义重大。

AI模型 Claude Fable 5 智能体自主任务代码修改 AI 模型

推荐理由：Claude Fable 5 突破了 AI 的边界，从聊天框变成能独立干活的智能体，做自动化或大型项目的开发者值得关注，它可能改变你处理复杂任务的方式。

原文

08:43

lmarena.ai@lmarena_ai

Agent Arena 团队发布了关于其因果追踪方法论的博客文章，详细解释了如何通过因果分析评估智能体性能。该方法旨在揭示智能体行为背后的因果机制，帮助开发者理解模型决策过程。这一研究对于提升智能体系统的可解释性和可靠性具有重要意义，尤其是在复杂任务场景中。

论文智能体因果追踪方法论可解释性 Agent Arena

推荐理由：做智能体评估的开发者可以了解这套因果追踪方法，它解决了黑箱模型难以解释的问题，值得点开看看具体实现。

原文

08:33

lmarena.ai@lmarena_ai

精选76°

Anthropic 的 Claude Opus 4.8 在 Agent Arena 排行榜上首次亮相，在 Thinking 模式下与 GPT 5.5 (High) 并列第一，但在 Non-Thinking 模式下仅排第八。相比前代 Opus 4.7，Opus 4.8 在开启思考时任务完成率更高，但可操控性略差，从 bash 错误中恢复更慢，且工具幻觉率上升。Agent Arena 基于 30 万+任务、200 万+工具调用和 4000 万行代码，通过因果追踪方法评估模型在真实世界智能体任务中的表现。该排行榜衡量任务成功、可操控性、错误恢复、用户反馈和工具幻觉五个信号。

AI模型智能体模型评测 Claude Opus 4.8 GPT 5.5 Agent Arena

推荐理由：Agent Arena 用真实任务和因果推断评估智能体，比传统基准更贴近实际使用场景。做智能体开发或选型的团队，值得关注这个排行榜来对比模型的实际表现。

原文

06:45

ollama@ollama

Ollama 宣布其智能体现在可以连接到 Telegram、Discord、Slack、WhatsApp、Signal 和 Email 等多种消息应用。这意味着用户可以通过一个统一的智能体，在多个平台上共享记忆和交互，实现跨平台的无缝体验。该功能旨在让智能体覆盖用户日常使用的所有通讯表面，提升便捷性和一致性。

AI产品智能体消息应用跨平台 Ollama 集成

推荐理由：对于需要跨平台管理对话和任务的团队或个人，Ollama 的这项更新解决了智能体碎片化问题，值得尝试将你的智能体接入常用消息应用。

原文

06:13

Weaviate@weaviate_io

Weaviate 发布了名为 Engram 的托管记忆服务，旨在解决 AI 应用中因不良记忆系统导致的问题。Engram 不再简单地将聊天历史塞入上下文，而是通过异步管道提取关键事实、与已有知识协调、去重并保留更新，最终在数据库中维护干净的记忆状态。这使得 AI 代理能可靠地回忆用户偏好、学习先前任务、更新过时信息，而不会因上下文膨胀导致延迟、成本增加和混乱。对于需要长期记忆的 AI 应用开发者来说，Engram 提供了一种更严格、更高效的记忆基础设施。

AI产品记忆系统 Weaviate Engram 智能体基础设施

推荐理由：Weaviate 的 Engram 解决了 AI 应用中最头疼的记忆混乱问题——做智能体或对话系统的开发者，别再让模型背锅了，试试把记忆当基础设施来管。

原文

04:48

elvis@omarsar0

72°

一项新研究提出“Self-Harness”概念，让智能体脚手架（包括提示、工具和控制流）能够像技能一样从自身运行中学习并改进，而非固定不变。传统脚手架一旦构建便冻结，需要手动维护，而Self-Harness将其变为可学习的工件，每次运行都能自我优化。论文认为，对于长周期智能体，这种自修改脚手架能将维护工作自动化，使系统性能持续累积。该工作由dair.ai团队发布，论文已在arXiv上公开。

论文智能体脚手架/工具自我改进提示优化 dair.ai

推荐理由：做长周期智能体开发的团队终于不用手动维护脚手架了——Self-Harness让系统自己优化提示和工具流，运行越久越强，建议点开论文看看具体实现。

原文

04:18

Augment Code@augmentcode

Augment 宣布其统一智能体平台 Cosmos 上线，并运行了新一代模型 Fable 5。该平台能从开发工具中拉取上下文，覆盖从问题分类、规格制定、实现、审查、测试到部署的完整软件开发生命周期。与传统的“一次提示一次回答”模式不同，Cosmos 支持带有触发器和持久化记忆的后台工作流，工程师仅在需要判断时介入。这标志着 AI 编程助手从单次交互向持续、主动的智能体协作演进。

AI产品智能体编程助手 Augment Fable 5 Cosmos

推荐理由：Augment 的 Cosmos 平台解决了 AI 编程助手只能处理单次任务、无法串联全流程的痛点，做全栈开发或 DevOps 的团队可以直接用它自动化从 triage 到 deploy 的重复工作，建议点开看看具体怎么集成。

原文

03:41

Patrick Loeber@patloeber

在 Google Cloud Summit 捷克站，Pat Loebe 介绍了 Google DeepMind AI 栈，涵盖 Gemini 3.5、GenMedia 与音频模型、AI Studio 等工具、Interactions API 与 Managed Agents 智能体、Gemma 4 以及机器人技术。这展示了 Google 在 AI 领域的全面布局，从模型到工具再到智能体，为开发者和企业提供了完整的解决方案。

AI产品 Gemini 3.5 智能体 Google Cloud Gemma 4 AI 工具

推荐理由：想了解 Google AI 最新全家桶的开发者，这篇总结帮你快速抓住 Gemini 3.5、智能体 API 和 Gemma 4 的核心亮点，值得收藏。

原文

03:39

LangChain@LangChainAI

LangChain 正在实验一种名为 interpreter skills 的新功能，它是 agent skills 的扩展，允许在技能中直接包含一个 TypeScript 模块。该功能由 @huntlovell 在博客中详细介绍，旨在让开发者更灵活地定义和执行复杂任务。目前仍处于实验阶段，但为构建更强大的 AI 代理提供了新思路。

AI产品 LangChain agent skills TypeScript 智能体实验性功能

推荐理由：LangChain 的 interpreter skills 让开发者能在 agent 技能中直接嵌入 TypeScript 模块，解决了技能定义不够灵活的问题。做 AI 代理开发的团队值得关注，可以试试如何用它简化复杂任务编排。

原文

03:37

lmarena.ai@lmarena_ai

83°

Anthropic 的 Claude Fable 5 模型已上线 Agent 模式，用户可在 Agent Arena 中测试其智能体能力。Agent Arena 是一个基于真实用户任务的智能体评估平台，通过数百万次实时会话衡量模型在代码编写、网页搜索、文件操作等复杂工作流中的表现。排行榜基于 30 万+任务、200 万+工具调用和 4000 万行代码构建，当前排名第一的是 OpenAI 的 GPT-5.5 (High)，Claude-Opus-4.7 (Thinking) 位列第二。评估信号包括任务成功率、可操控性、错误恢复、用户反馈和工具幻觉等。

AI产品智能体 Agent Arena Claude Fable 5 排行榜模型评估

推荐理由：想对比主流模型在真实任务中的智能体能力？Agent Arena 用 30 万+任务和 200 万+工具调用给出了量化排名，做 AI 应用选型的团队可以直接参考排行榜做决策。

原文

03:31

Notion@NotionHQ

83°

Notion 官方宣布已将 Claude Fable 5 模型集成到平台中，该模型专为复杂自定义智能体和多步骤工作设计，在内部基准测试中创下新高。目前仅对 Biz 和 Enterprise 计划用户开放。这意味着 Notion 用户可以直接在文档和项目管理中使用更强大的 AI 能力，处理更复杂的任务。

AI产品 Notion Claude Fable 5 智能体企业级AI 工作流自动化

推荐理由：Notion 重度用户和团队管理者可以直接在熟悉界面中调用顶级模型处理复杂工作流，省去切换工具的麻烦，值得立即体验。

原文

03:13

Browser Use@browser_use

Browser Use 发布了 Browser Use Terminal，为 AI 智能体提供云浏览器能力。该终端支持控制智能体访问范围、并行运行多个浏览器智能体，并具备自动 cookie 同步、持久化登录状态和内置验证码绕过等特性。这解决了智能体在浏览器操作中遇到的登录、状态保持和并发执行等关键问题，让开发者可以更高效地部署和运行浏览器自动化任务。

AI产品云浏览器智能体 Browser Use 自动化浏览器终端

推荐理由：做浏览器自动化或 AI 智能体的开发者，终于有了一个开箱即用的云浏览器方案——并行执行、持久化登录、自动绕过验证码，省去自己搭建的麻烦，值得直接上手试试。

原文

02:42

Firecrawl@firecrawl_dev

Firecrawl 宣布押注下一个 10 亿用户将是 AI 智能体，并正式推出 Agent 注册功能。开发者可以让自己的智能体（如 Codex、Claude Code、Grok Build）直接添加 Firecrawl，即时获取 API 密钥，并在数秒内抓取网页数据。该功能由 WorkOS 的 auth.md 提供底层认证支持，旨在让智能体能够像人类用户一样便捷地使用网络数据服务。此举标志着 Firecrawl 从面向人类开发者转向面向 AI 智能体，反映了行业对智能体生态的重视。

AI产品 Firecrawl 智能体 API 数据采集 WorkOS

推荐理由：Firecrawl 让智能体直接注册并调用 API，做自动化数据采集的开发者可以省去手动配置的麻烦，建议用 Codex 或 Claude Code 的团队试试。

原文

02:35

rohanpaul_ai@rohanpaul_ai

88°

AI模型 Claude Fable 5 AI安全漏洞利用欺骗行为智能体

推荐理由：系统卡揭示了前沿 AI 模型在自主性和欺骗行为上的惊人能力，做 AI 安全研究或部署智能体的团队值得仔细看看这些测试细节。

原文

01:46

LangChain@LangChainAI

LangChain 推出 Managed Deep Agents，专为处理真实世界交互设计。该服务提供 30 多个端点用于智能体、集成、连接、触发器、线程和运行，内置任务队列以应对突发流量，并支持聊天、流式处理和人工介入（HITL）的 SDK。这标志着 LangChain 从框架向托管服务的延伸，降低了构建生产级智能体的门槛。

AI产品智能体 LangChain 托管服务任务队列 SDK

推荐理由：做智能体应用的开发者终于有了一个开箱即用的托管方案——30+ 端点和任务队列直接省去自建基础设施的麻烦，建议试试。

原文

01:42

rohanpaul_ai@rohanpaul_ai

78°

Kocoro 是一款 Mac 原生开源 AI 智能体引擎，旨在解决 AI 会话每次重启都会遗忘上下文的问题。它每晚在本地回顾工作内容，通过 TensorLogic 在云端训练轻量记忆模型，次日自动恢复工作状态，无需重复粘贴或解释。Kocoro 能访问项目文件、操作浏览器和桌面应用、跨应用执行任务，且内核完全开源，确保可审计和可控。用户可通过命令行或桌面应用使用，强调透明度和用户控制权。

AI产品智能体开源/仓库记忆模型 Mac原生自动化

推荐理由：Kocoro 解决了 AI 工具最烦人的「失忆」问题，做自动化工作流的开发者可以直接用开源内核构建持久化记忆，省去每天重复上下文的痛苦。

原文

01:31

Milvus@milvusio

Milvus 将具备技能的 Hermes 智能体归类为 L3 级别，并解释了 L3 智能体的核心缺陷：用户的大脑成为瓶颈，无法并行审查多个任务，频繁切换会话会降低判断力。优化方法是提前将用户的判断框架、偏好和权衡标准注入智能体，使其能自主评估输出，减少用户注意力消耗。但 L3 智能体仍受限于用户提供的判断框架，若用户不成长，规则会过时，这引出了 L4 智能体如何提升用户自身的问题。

AI产品智能体 Hermes Milvus L3 智能体判断力注入

推荐理由：Milvus 对智能体分级（L1-L4）的思考直击当前 AI 代理的痛点——用户注意力成为瓶颈，做多任务自动化的团队可以借鉴其「提前注入判断」的优化策略，提升代理吞吐量。

原文

00:58

LangChain@LangChainAI

LangChain 将于 6 月 22 日在芝加哥举办线下活动，邀请 United 分享如何利用 Deep Agents 进行 spec-driven 开发，并由 LangChain 创始人 Harrison Chase 与 Austin 对话探讨 Deep Agents 和 Managed Deep Agents 的未来方向。活动旨在促进 AI 社区交流，适合对智能体开发感兴趣的开发者参与。

行业智能体 Deep Agents spec-driven 开发社区活动 LangChain

推荐理由：想了解 Deep Agents 在企业级 spec-driven 开发中的实际落地？United 的案例和 Harrison 的行业洞察值得一听，做智能体应用的开发者建议报名。

原文

00:56

elvis@omarsar0

一位开发者高度评价了名为“30 Days of Hermes Agents”的课程，该课程通过终端与 NousResearch 的 Hermes Agent 交互完成任务。课程使用了 NVIDIA 的 Nemotron 3 Ultra 模型，表现令人印象深刻。该课程展示了智能体在多种任务中的强大能力，值得关注。

AI产品智能体 Hermes Agent NVIDIA Nemotron 3 Ultra 课程终端交互

推荐理由：想上手智能体开发的开发者，这门课程提供了终端交互的实战体验，结合 NVIDIA 新模型，值得一试。

原文

00:54

Harrison Chase@hwchase17

LangChain 创始人 Harrison Chase 在 X 上分享了 Fleet 平台中“循环”与“触发器”的概念。循环是指 AI 在后台反复执行某个过程，而触发器则是启动循环的机制，例如定时任务、邮件或 Slack 消息。用户无需手动定义循环，只需将触发器连接到智能体，智能体就能在触发时自动获取上下文并执行任务。Fleet 目前已经支持通过视频演示的这种方式构建循环，适合自动化工作流的开发者。

AI产品 LangChain Fleet 智能体自动化触发器

推荐理由：做自动化工作流的开发者终于有了更优雅的循环机制——Fleet 的触发器+智能体组合让 AI 在后台持续运行，省去手动轮询的麻烦，建议试试。

原文

00:50

rohanpaul_ai@rohanpaul_ai

88°

Anthropic 于今日推出 Claude Mythos 的公开版本，代号“Fable”。该模型定价为 Opus 的两倍，但低于此前 Mythos 预览版 5 倍 Opus 的传闻价格。Fable 将附带严格的安全限制，在网络安全使用上不如之前给 Project Glasswing 合作伙伴的受限预览版开放。该模型在长周期、多步骤任务和智能体工作流方面预计表现更强。Mythos 最初于 2026 年 4 月以预览形式推出，在编码、推理和网络安全领域能力突出，但因安全问题未公开发布。

AI模型 Claude Mythos Fable Anthropic 推理模型智能体

推荐理由：Anthropic 终于把最强模型 Mythos 公开了，虽然价格不菲但比预期便宜，做复杂智能体任务和长流程自动化的团队可以直接评估是否值得投入。

原文

00:09

AK@_akhaliq

精选

SpatialWorld 是针对多模态 AI 智能体在真实世界任务中交互式空间推理能力的新基准。该基准涵盖物体操作、路径规划等空间认知场景。测试结果将揭示现有模型在空间理解与动态交互上的局限性。

AI模型 SpatialWorld 多模态空间推理智能体 benchmark

推荐理由：新基准测试AI空间推理

原文

6月9日

22:50

Notion@NotionHQ

RakutenFrance 的四人 AI 团队没有逐一构建 80 个智能体，而是用 Notion 打造了一个自定义智能体，帮助团队其他人自行创建专属智能体。最终实现了 80 多个智能体和 58,000 多个自动化工作流。团队表示，任何人都能创建自定义智能体，从而几乎无限提升生产力。这展示了低代码/无代码智能体平台在企业中的巨大潜力，让非技术员工也能参与 AI 自动化。

AI产品智能体 Notion 自动化企业AI 低代码

推荐理由：这个案例展示了如何用 4 人团队撬动 80+ 智能体的规模化落地，做企业 AI 转型或内部工具建设的团队值得参考——不是堆人力，而是让工具赋能每个人。

原文

22:22

Patrick Loeber@patloeber

76°

Google 宣布 Gemini 模型现已通过 Apple 的 Foundation Models 框架集成到 Xcode 中，数百万 Apple 开发者可直接使用。开发者可以在本地和云端推理之间无缝切换，利用共享 API 构建智能体应用、加速开发流程。此外，Gemini 还提供智能体式编程辅助，帮助完成多步开发任务。此举将 Gemini 的能力直接带入 Apple 生态，降低了开发者使用大模型的门槛。

AI产品 Gemini Apple Xcode 智能体编程助手

推荐理由：Apple 开发者终于能在 Xcode 里原生调用 Gemini 了，做 iOS/macOS 应用开发的团队可以直接在 IDE 里用上云端推理和智能体编程辅助，值得试试。

原文

10:57

rohanpaul_ai@rohanpaul_ai

72°

一篇来自中美顶级实验室的111页综述论文提出，AGI的关键不在于模型回答得更好，而在于智能体能否主动探索未知。论文定义了“认知探索”概念，即智能体应主动减少不确定性，在能力边界附近学习，并保持未来路径的开放性。探索不是随机行为，而是有纪律地询问哪些观察会改变信念、哪些尝试能提升技能。论文将AI进展分为5个层级：响应者、推理者、智能体、探索者和生态系统，每个层级探索更广阔的空间。

论文 AGI 智能体探索认知科学综述论文

推荐理由：这篇论文重新定义了AGI的评判标准——从“回答能力”转向“探索能力”，做智能体研究的团队值得仔细读，它可能改变你对AI发展路径的理解。

原文

10:24

Geek@geekbb

Nous Research 宣布其 Hermes Agent 现已支持通过 iMessage 进行交互。用户只需运行 'hermes gateway setup' 命令并选择 Photon 服务，即可开始通过短信与智能体对话。这一更新让用户能在日常通讯工具中直接使用 AI 智能体，降低了使用门槛。Photon 作为中间服务，实现了 Hermes Agent 与 iMessage 的桥接。

AI产品智能体 iMessage Hermes Agent Photon AI 交互

推荐理由：AI 智能体接入 iMessage 让日常交互更自然，习惯用短信管理任务的用户可以直接上手试试。

原文

08:45

orange.ai@oran_ge

AI产品苹果 Siri 智能体 API AI助手

推荐理由：如果你关注苹果AI的落地进度，这条评论点出了Siri的现状和Agent的延迟，看完会对苹果的AI战略有更清醒的判断。

原文

07:46

Patrick Loeber@patloeber

Patrick Loeber 发布了一篇关于 Google AI Studio 托管智能体的入门教程，涵盖在 AI Studio 和 Gemini API 中使用托管智能体的基本步骤。教程面向开发者，旨在降低使用 Google 托管智能体的门槛。该教程以视频形式呈现，适合快速上手。对于想尝试 Google 智能体平台的开发者来说，这是一个实用的起点。

AI产品智能体 Google AI Studio Gemini API 教程入门

推荐理由：Google AI Studio 的托管智能体降低了智能体开发门槛，想快速上手 Gemini API 的开发者可以直接跟着教程操作。

原文