全部 AI 动态 · AI 热点

AITOP

5月29日

10:45

shao__meng@shao__meng

精选

AI产品 Cursor AI 编程开发者习惯代码产出 Agent

推荐理由：这份报告用数据证明了 AI 编程从辅助工具向自动化基础设施的转变，做 AI 编程工具或使用 Cursor 的开发者值得一看，能帮你理解行业趋势并调整自己的使用策略。

原文

10:07

berryxia@berryxia

76°

ZenMux 平台现已免费提供 Claude Opus 4.8 体验，用户可直接通过 API 调用。有开发者用其生成纯 Three.js 图元构建的波音 747-400 飞机，从提示词到完整可运行 HTML 页面一次成型，比例严谨、细节到位。该模型在 SWE-bench、Terminal-Bench 等多项榜单排名第一，专为 Agent 与长程编码设计，代码与多模态理解能力显著提升。ZenMux 提供零延迟首发和限时免费额度，并支持按量计费与 Builder 套餐。

AI产品 Claude Opus 4.8 ZenMux Three.js 代码生成 Agent

推荐理由：Claude Opus 4.8 的复杂空间推理与工程代码能力在真实场景中得到了验证，做 3D 可视化或 Agent 开发的团队可以直接在 ZenMux 上免费试，一次成型的效果值得亲自跑一遍。

原文

5月28日

17:56

宝玉@dotey

讨论 Agent 生成结果是否需要人工审查，关键在于验证方法是否可靠以及模型能力是否足够强。对于代码生成，中间结果可减少人工检查，但初始的 Plan/Design 和最终审查仍需人工把关。有观点认为，非专业架构师的人工审查可能反而带偏项目，Agent 提供的思路可能更优。

行业 Agent 人工审查代码生成验证方法模型能力

推荐理由：做 AI Agent 开发或使用的团队，看完会重新思考人工审查的边界——不是所有环节都需要人，但关键节点不能放。

原文

17:47

AI Will@FinanceYF5

精选

Anthropic提出了“Agentic Technical Debt”概念，指出AI项目中的技术债不是线性增长，而是复利式的。每个session的健忘、每次重新推导架构导致结果不一致，三个月后代码库每块单独看合理，合在一起却像精神分裂。解药是写一份CLAUDE.md作为“项目宪法”，每次开session先读再干。

行业技术债 Agent CLAUDE.md Anthropic 代码管理

推荐理由：做AI Agent开发的团队终于有了一个可落地的债务管理工具——CLAUDE.md能终结session间的架构混乱，建议所有用Claude写代码的人立刻试试。

原文

09:49

LangChain@LangChainAI

精选

LangChain 发布了 LangSmith Context Hub，为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。

AI产品 LangSmith Context Hub Agent 上下文管理开源/仓库

推荐理由：做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题，建议做 AI 应用架构的开发者点开视频看看。

原文

09:16

berryxia@berryxia

Replit 创始人 Michele Catasta 的愿景——让每个人都能轻松创建软件——正在成为现实。目前已有超过 5000 万用户通过自然语言在 Replit 平台上构建真实应用，且与 Claude 的合作紧密到新模型发布当天就能上线新版 Replit Agent。这标志着编程门槛彻底消失，普通人只需对话就能将想法变成可运行的网站、App 和工具。AI 不再只是取代程序员，而是让“不会写代码”的人也能成为创造者。

AI产品 Replit Claude Agent 自然语言编程 AI Native

推荐理由：Replit + Claude 的组合正在验证 AI Native 公司的 Agent 化趋势，对想用自然语言快速验证产品想法的非技术创业者、产品经理和设计师来说，这是可以直接上手的工具，值得体验。

原文

5月27日

21:57

Viking@vikingmute

AnySearch 是一个专为 AI Agent 设计的搜索引擎，聚合了金融、法律、学术、网络安全等专业领域的大规模数据，通过单一 API 提供结构化输出，减少 Token 浪费。它支持 API、MCP 与 Skill 接入，旨在成为 AI 时代的搜索基础设施。作者用其查询显卡性能对比，获得了丰富且具体的参考信息。

AI产品搜索 API Agent 专业数据结构化输出 MCP

推荐理由：做 Agent 开发的团队终于有了一个专门优化过的搜索源，能直接拿到结构化专业数据，省 Token 又省心，建议接入试试。

原文

18:27

Harrison Chase@hwchase17

LangChain 创始人 Harrison Chase 转发了 Adam Łucek 关于追踪数据重要性的观点。追踪数据记录了 Agent 的输入、输出、步骤和元数据，是分析效率瓶颈和改进方向的核心。除了用于观察行为，追踪数据还能以更复杂的方式构建稳健的评估体系。文章介绍了两种利用追踪数据为生产级 Agent 构建评估的方法。

AI产品 Agent 追踪数据评估 LangChain 迭代

推荐理由：做 Agent 开发的团队，追踪数据是你迭代和评估的命脉，学会用它构建评估能大幅提升 Agent 的可靠性，值得深入看看。

原文

13:41

岚叔@lufzzliz

Grok 推出了自己的 Agent 功能，用户通过跳转授权即可使用。该 Agent 能生成图片、文本生成视频，并调用已有的全局 Skill，体验流畅。SuperGrok 和 X Premium+ 订阅者可以提前体验。安装命令已提供，使得用 Grok 生图和生视频更加简单。

AI产品 Grok Agent 文生视频生图 X Premium+

推荐理由：Grok 的 Agent 让多模态创作一步到位，做内容生成的用户可以直接用，省去切换工具的麻烦，建议试试。

原文

11:22

LangChain@LangChainAI

精选

LangChain 的 Adam Łucek 分享了如何利用 Agent 运行时的 Trace 数据来构建生产级评估。Trace 数据记录了 Agent 的输入、输出、执行步骤和元数据，是优化 Agent 行为的关键。通过分析 Trace，可以识别低效环节，并用于构建更复杂的评估体系。文章介绍了两种利用 Trace 构建评估的具体方法，帮助团队快速迭代和提升 Agent 的可靠性。

AI产品 Agent Trace 评估 LangChain 生产部署

推荐理由：做 Agent 开发的团队终于有了可落地的评估方法论——Trace 数据不再是日志垃圾，而是构建评估的黄金矿，建议做生产级 Agent 的开发者点开看看具体怎么用。

原文

11:08

LangChain@LangChainAI

LangChain 将于 5 月 27 日在波士顿举办线下 Meetup，由团队核心成员 Sydney Runkle 与 Blitzy 的 Dillon Jones 共同主持。活动聚焦部署长运行 Agent 的挑战与运行时能力，适合对 Agent 生产化部署感兴趣的开发者。现场名额有限，需提前通过 Luma 报名。

行业 LangChain Agent 线下活动部署实战波士顿

推荐理由：想了解长运行 Agent 在生产环境落地的真实坑点？LangChain 团队和 Blitzy 的实战分享值得一听，做 Agent 部署的开发者建议报名。

原文

09:35

宝玉@dotey

83°

微软联合上海交大、复旦、同济等机构提出SkillOpt框架，将Agent Skills的优化过程自动化。该框架通过独立的优化器模型对Skill进行编辑操作，并设计harness闭环流程，只有通过验证集分数提升的修改才会被合并。实验表明，每一步设置4到8个编辑操作预算效果最佳，最终最佳Skill仅包含1到4个核心修改。该框架使GPT-5.5的直接对话准确率提升23.5%，标志着提示词工程正式进入机器学习领域。

论文 SkillOpt 提示词工程 Agent 微软自动化优化

推荐理由：做Agent框架或提示词工程的开发者，终于有了系统级的方法来优化Skills，不用再靠手动瞎改和调试了。建议直接看论文实验数据，特别是编辑预算的设置，对实际落地很有参考价值。

原文

08:36

berryxia@berryxia

83°

MiniMax AI工程负责人Skyler Miao预告了下一代模型M3的发布，并透露其核心架构：基于GQA的动态块稀疏注意力。该技术通过轻量索引分支快速筛选相关token块，仅对关键块执行稀疏注意力计算，大幅降低算力需求。在1M token上下文下，M3的预填充速度比M2快9.7倍，解码速度快15.6倍。这使得百万token级别的Agent任务从理论走向实用，长上下文处理变得又快又省。M3的发布将为长上下文模型赛道增添有力竞争者。

AI模型 MiniMax M3 长上下文稀疏注意力 Agent

推荐理由：MiniMax M3用动态稀疏注意力把1M上下文的算力成本打下来了，做长上下文Agent的开发者可以直接关注，这可能是让百万token任务真正落地的关键突破。

原文

5月25日

12:13

宝玉@dotey

宝玉分享了 Codex 的两个实用功能：Steer 和 Queue。Steer 允许用户在任务执行中途打断并插入新指令，无需手动停止再继续；Queue 则用于在任务完成后排队执行后续指令。Steer 影响当前轮次，Queue 影响下一轮次，但实测 Queue 可能不会按预期执行。这两个功能能提升 Agent 任务的灵活性和效率。

技巧 Codex Agent 任务控制 Steer Queue

推荐理由：做自动化任务的开发者终于可以更灵活地控制 Agent 执行流程——Steer 省去手动打断的麻烦，Queue 适合睡前挂机跑任务，值得一试。

原文

11:02

AI Will@FinanceYF5

Anthropic 正在为 Claude 开发“文件式记忆”功能，允许用户在 Memory Files 和传统记忆之间选择。该功能会在聊天中自动整理笔记，并在相关对话时自动读取，用户也可随时查看和编辑。这被视为此前 Knowledge Bases 的升级版，旨在为未来更强的常驻 Agent 能力做准备。

AI产品 Claude 文件式记忆 Memory Files Agent 记忆管理

推荐理由：Claude 用户终于有了更灵活的记忆管理方式，做长期项目或需要上下文连贯的团队可以直接用，建议关注上线时间。

原文

07:57

berryxia@berryxia

72°

Anthropic 宣布推出 Memory Files 功能，允许 Claude 在对话中自动记录关键笔记并持久化存储，用户可随时浏览和编辑这些记忆。与传统的“记住聊天记录”不同，Memory Files 将记忆变为结构化、透明且可控的文件系统，更接近 always-on Agent 的持久记忆方式。该功能旨在解决长期 Vibe Coding 项目中每次重新打开对话需重复上下文的痛点。用户可选择使用 Memory Files 或经典记忆模式。这波更新为未来 Claude Conway 等 Agent 的长期协作能力铺路。

AI产品 Claude 记忆管理 Vibe Coding Agent Anthropic

推荐理由：长期用 Claude 做 Vibe Coding 的开发者终于不用每次重复上下文了——Memory Files 让记忆可编辑可审计，建议直接体验新功能。

原文

5月24日

16:37

阿里云 Alibaba Cloud@alibaba_cloud

5月26日，阿里云国际业务副总裁、北美区域总经理陈亮将在新加坡金沙会展中心主舞台演讲。主题为Agent Engine的规模化推理与智能体释放。该活动聚焦AI推理和Agent技术的大规模应用。

行业智能体 Agent 大模型阿里云

推荐理由：阿里云高管讲Agent规模化

原文

16:36

阿里云 Alibaba Cloud@alibaba_cloud

5月26日，阿里云产品工程副总裁、计算平台负责人王俊华将在新加坡金沙会展中心发表主题演讲，解读 Agentic Cloud 如何赋能 Token 与智能体。该演讲聚焦云平台对 AI 代理的支持，注册链接已开放。

行业阿里云 Agent 智能体云平台

推荐理由：阿里云 VP 亲讲 Agent 云战略

原文

16:02

阿里云 Alibaba Cloud@alibaba_cloud

阿里云CTO李飞飞将于5月26日在新加坡金沙会展中心发表主题演讲，主题为“Ship the Next”和“Scaling Trustworthy Agents”。该活动聚焦AI智能体的规模化部署与可信性挑战。李飞飞将分享阿里云在智能体领域的技术进展与实践经验。

行业智能体 Agent 阿里云

推荐理由：阿里云CTO讲智能体规模化

原文

16:02

阿里云 Alibaba Cloud@alibaba_cloud

阿里巴巴通义大模型业务部多模态交互负责人Steven Hoi教授将于5月26日在新加坡金沙会展中心发表主题演讲，探讨Agent时代的基础模型。该演讲聚焦于基础模型如何支撑智能体应用的发展。活动面向AI从业者和研究者开放注册。

行业 Agent 大模型多模态智能体

推荐理由：阿里专家讲Agent时代基础模型

原文

5月22日

19:05

岚叔@lufzzliz

83°

阿里通义千问发布 Qwen3.7-Max，在第三方 Arena 全球大模型盲测总榜中超越 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，位列国产第一，与 GPT、Claude、Gemini 最强模型接近。在编程智能体方面，SWE-Pro、SWE-Multilingual 等测评领先，Terminal Bench 2.0 得分 69.7。通用智能体能力显著提升，在 MCP-Atlas、MCP-Mark 等现实测试中创国产新高。新增 preserve_thinking 参数，保留前序思维内容以增强 Agent 决策一致性，减少重复推理 Token 消耗，默认关闭。实测在 Claude Code 下跨框架泛化能力不错，但需要更精准的提示词和多轮迭代。

AI模型 Qwen3.7-Max 国产模型编程智能体 Agent MCP/工具

推荐理由：Qwen3.7-Max 在多项基准上追平国际顶尖模型，做 Agent 和编程自动化的开发者可以直接拿来替代闭源方案，尤其是 preserve_thinking 参数对长周期任务很有用，值得一试。

原文

08:05

LangChain@LangChainAI

精选

LangChain 发布新的流式协议，旨在解决 Agent 流式输出中工具、状态、子代理、媒体、中断和重连等复杂场景的解析难题。传统流式方案依赖原始事件流，开发者需手动解析大量日志，效率低下。新协议将 Agent 运行转化为类型化投影，应用可直接订阅，大幅降低开发复杂度。该协议特别适合需要实时渲染多模态 Agent 输出的应用场景。

AI产品 LangChain 流式协议 Agent 开发者工具实时交互

推荐理由：Agent 流式输出一直是个痛点，LangChain 的新协议让开发者不再需要手动解析原始事件流，做 Agent 应用或实时交互界面的团队可以直接用，省去大量底层工作。

原文

5月21日

21:51

berryxia@berryxia

MemOS 2.0 开源项目在 GitHub 上获得 9.3K Star，其核心升级是“执行即学习”功能。不同于传统记忆方案仅记录聊天记录或使用 RAG 检索，MemOS 2.0 在 Agent 执行任务时，将整个执行过程拆解为可学习的单元，自动分层提炼为原始轨迹、通用套路、世界模型和肌肉记忆。双重反馈机制自动评分，强化有效经验，淡忘低效行为。用户反馈显示，第二天新任务时，Agent 能自动沿用前一轮磨合出的代码风格和习惯，实现真正的持续进化。支持 Hermes 和 OpenClaw 无缝迁移，一行命令安装，并提供 Memory Viewer 可视化记忆链路。

AI产品 MemOS AI记忆执行即学习开源/仓库 Agent

推荐理由：做 AI Agent 或自动化工具的开发者，MemOS 2.0 解决了记忆碎片化、无法持续学习的痛点，越用越懂你，建议直接试试一行命令迁移。

原文

10:48

Viking@vikingmute

精选

AnySearch 是一个专为 AI Agent 设计的搜索引擎，聚合了金融、法律、学术、网络安全等专业领域的大规模数据，通过单一 API 即可访问。它解决了传统搜索引擎数据盲区大、结果未针对 Agent 优化的问题，支持结构化输出以减少 Token 浪费，并原生支持 API、MCP 与 Skill 接入。用户实测在查询显卡性能对比时，能提供具体参考链接和丰富信息。AnySearch 定位为 AI 时代的搜索基础设施，为 Agent 提供高质量信息门户。

AI产品搜索 API Agent AnySearch 结构化输出 MCP/工具

推荐理由：做 Agent 开发的团队终于有了一个真正为 AI 优化的搜索 API，不用再忍受 Google 的盲区和 Token 浪费，建议直接接入试试。

原文

10:48

Viking@vikingmute

AnySearch 宣布面向所有开发者免费开放体验，支持接入任意 Agent 或 AI 工作流作为搜索引擎。开发者可以将其替换掉 Agent 中的默认搜索引擎，以获得更灵活、更可控的搜索能力。该服务旨在为 AI 应用提供定制化的搜索接口，提升信息检索的准确性和效率。目前 AnySearch 已开放试用，开发者可直接通过链接体验。

AI产品搜索引擎 Agent AI 工作流免费 AnySearch

推荐理由：做 AI Agent 或工作流的开发者终于有了一个可自由替换的搜索引擎选项，建议直接替换默认搜索试试效果。

原文

08:00

LangChain@LangChainAI

LangChain 团队与 Blitzy 合作，将于 5 月 27 日在波士顿举办线下聚会。活动中，LangChain 的 Sydney Runkle 和 Blitzy 的 Dillon Jones 将分享部署长运行 Agent 的经验，并介绍支撑其运行的运行时能力。活动适合对 Agent 部署感兴趣的开发者，可免费报名参加。

行业 LangChain Agent 部署线下活动 Blitzy

推荐理由：想了解长运行 Agent 在生产环境中的部署要点？LangChain 官方和 Blitzy 的实战分享值得一听，做 Agent 开发的建议报名。

原文

07:59

Cursor@cursor_ai

Cursor 宣布现在可以在 Agent 工作区中直接创建和管理自动化任务，无需切换界面。该功能已在 Agent 窗口上线，并且新创建的自动化任务在接下来 7 天内享受 50% 的折扣。这简化了开发者的工作流程，提升了效率。

AI产品 Cursor Agent 自动化工作流开发者工具

推荐理由：Cursor 把自动化管理直接塞进 Agent 工作区，省去了来回切换的麻烦，做自动化流程的开发者可以趁 7 天半价优惠试试。

原文

07:57

LangChain@LangChainAI

精选

LangSmith Sandboxes 正式发布，为 AI Agent 提供隔离的真实文件系统、Shell 和包管理器。该功能与 Deep Agents、Open SWE 及用户自有代码兼容，使用现有 API 密钥即可认证，无需额外构建或管理运行时。这解决了 Agent 在沙盒环境中执行复杂操作的安全与隔离问题，让开发者能更安全地测试和运行 Agent 代码。

AI产品 Agent 沙盒 LangSmith 安全隔离开发者工具

推荐理由：做 Agent 开发的团队终于有了开箱即用的隔离沙盒，不用自己搭环境就能安全跑代码，建议直接试试。

原文

5月20日

18:30

berryxia@berryxia

72°

ZenMux 平台已上线 Gemini 3.5 Flash 模型，用户可免费体验。该模型在递归二叉树生长测试中，从输入提示词到生成完整 HTML 动画网页仅用 77.56 秒，效果自然优雅。Gemini 3.5 Flash 专为 Agent 设计，在 MCP Atlas、Toolathlon 等多项榜单排名第一，多模态能力超越上一代 Gemini 3.1 Pro。支持按量计费和 Builder 套餐，兼容主流 API 格式。

AI产品 Gemini 3.5 Flash ZenMux Agent 多模态免费体验

推荐理由：AI 开发者可以零成本体验 Google 最新旗舰模型，77 秒生成动画网页展示了其极速推理和 Agent 能力，做创意编程或 Agent 应用的建议立即试用。

原文

14:35

berryxia@berryxia

72°

ZenMux 平台已免费上线 Google 最新发布的 Gemini 3.5 Flash 模型，用户可直接体验。该模型在递归二叉树生长测试中，从输入提示词到生成完整 HTML 动画网页仅用 77.56 秒，效果惊艳。Gemini 3.5 Flash 专为 Agent 设计，在 MCP Atlas、Toolathlon 等多项榜单排名第一，多模态理解能力全面超越上一代 Gemini 3.1 Pro。平台支持零延迟首发，兼容主流 API 格式，并提供免费试用额度。

AI产品 Gemini 3.5 Flash ZenMux Agent 多模态免费试用

推荐理由：Google I/O 刚发布就能免费白嫖，做 Agent 或动画生成的开发者可以立刻上手测试，77 秒出完整 HTML 动画的效率值得一试。

原文

07:26

orange.ai@oran_ge

83°

Google 昨晚发布 Gemini flash 3.5 模型，现已可用。该模型在多项指标上大幅超越 3.1 Pro，与 GPT 5.5 接近，且在 Agentic 和多模态能力上更优。价格仅为 GPT 5.5 的三分之一，缓存价格六分之一，API 定价 $1.50/$9.00 每百万 token。上下文窗口达 1M token，速度是其他旗舰模型的 4 倍，非常适合 Agent 场景。

AI模型 Gemini flash 3.5 推理模型多模态 Agent

推荐理由：做 Agent 和多模态应用的开发者终于有了性价比更高的选择——Gemini flash 3.5 速度是旗舰模型的 4 倍，价格却只有 GPT 5.5 的三分之一，建议直接试 API。

原文

00:49

AlphaSignal@AlphaSignalAI

76°

Anthropic 发布了两项新功能：Sandboxes 和 Tunnels，旨在解决 AI Agent 在执行层常见的失败问题，如凭证过期、缺乏重试逻辑以及工具访问不当。Sandboxes 允许在用户自己的基础设施内运行工具执行，而 Tunnels 则通过单一出站加密连接让 Agent 访问内部系统，无需暴露公共端点。这些更新不涉及新模型，而是专注于增强对模型决策后执行过程的控制。对于依赖 Agent 自动化任务的团队来说，这能显著提升可靠性和安全性。

AI产品 Anthropic Agent 执行层 Sandboxes Tunnels

推荐理由：做 Agent 自动化的团队终于不用在提示词上瞎折腾了——Anthropic 直接解决了执行层的常见崩溃点，建议搞内部工具集成的开发者点开看看。

原文

5月18日

16:21

orange.ai@oran_ge

精选

刘小排认为AI常顺着用户说话导致信息茧房，建议让AI扮演魔鬼代言人猛泼冷水。他开源了一个名为“魔鬼代言人”的Cola Skill，供用户免费安装到Agent中使用。该Skill旨在通过质疑用户观点促进独立思考。GitHub仓库名称为orange2ai/devi…，已获8个反应和1906次查看。

技巧刘小排 Cola 魔鬼代言人 Agent 开源提示词工程

推荐理由：让AI当杠精，免费开源Skill

原文

14:49

李继刚@lijigang_com

开发者李继刚分享了一种新的阅读方式：通过微信读书 skill，让 AI agent 每晚分析当天对话内容，基于用户兴趣和思考盲区，推荐一本书中的对应章节。用户可直接点击打开微信读书阅读。有用户反馈 agent 连续三天推荐同一章节，最终意识到是自己未理解内容。这种方式每天只需 20 分钟，就能读到最适合当下自己的内容。

AI产品微信读书 Agent 阅读推荐定时任务个性化学习

推荐理由：这个玩法把 AI 从工具变成了阅读向导，适合想通过阅读解决实际困惑但不知道读什么的读者，建议试试让 agent 帮你挑章节。

原文

5月17日

15:24

orange.ai@oran_ge

微信读书的Skill功能被开发者发现可用于Agent，作为数据库构建智能图书馆。该功能基于用户的阅读记录推荐可能感兴趣的书，并通过分析真实内容判断用户是否真正感兴趣。此外，微信读书新增了“连接纸书”功能，允许用户通过拍照将纸质书内容划线同步到App。这一发现为Agent应用提供了新的数据源，提升了阅读推荐的精准度。

AI产品微信读书 Agent 智能推荐阅读记录纸书同步

推荐理由：微信读书的Skill功能为Agent开发者提供了新的数据接口，做个性化推荐或阅读助手的团队可以直接利用它构建更智能的图书馆，值得一试。

原文

5月16日

22:58

Yangyi@Yangyixxxx

DeepSeek 正在招聘 Agent Harness 产品经理，团队使命是“Model + Harness = Agent”，将前沿模型能力转化为领先的 Agent 产品。该职位将参与桌面端 Agent 产品全过程，定义 Harness 理念，要求候选人深度使用过 Claude Code、Cursor 等主流 Agent 产品，并具备数据分析、UI/UX 设计等能力。有评论认为桌面 Agent 潜力巨大，更期待 DeepSeek 直接做操作系统，挑战将完全不同。这标志着 DeepSeek 正从模型公司向 Agent 平台转型，对 AI 产品经理和 Agent 生态开发者是重要信号。

行业 DeepSeek Agent 产品经理桌面端 Harness

推荐理由：DeepSeek 正式进军桌面 Agent 领域，做 Agent 产品经理或关注 Agent 生态的开发者值得关注——这可能是定义下一代人机交互范式的机会。

原文

22:32

向阳乔木@vista8

Raycast 发布了 Beta 版本，新增了 Agent 和 Skill 功能，用户可免费使用多种顶级 AI 模型。该版本目前存在较多 Bug，且不支持 Cloud 同步，导致快捷键和 Prompt 需要重新设置。对于习惯使用 Raycast 提高效率的开发者来说，这是一个值得尝试的更新，但需注意稳定性问题。

AI产品 Raycast Agent Skill AI 模型 Beta

推荐理由：Raycast 用户终于等来了 Agent 和 Skill 功能，还能免费调用顶级 AI 模型，效率控值得立刻下载体验，但记得备份好快捷键设置。

原文

22:20

向阳乔木@vista8

Vercel 发布基于 20 万个项目、7 个月、十万亿 token 消耗的分析报告，揭示不同模型在实际生产中的使用格局。按费用计算，Anthropic 占 61% 居首，但按 token 量 Google 占 38% 领先，说明 Claude Opus 贵但用于关键任务，Gemini Flash 便宜量大。B2B 场景 token 量仅占 29.7%，费用却占 40.7%，表明企业更倾向高价值模型。Agent 请求占比从 31.6% 涨至 58.9%，一次 Agent 请求消耗 token 是普通聊天的 2.6 倍。大规模团队平均使用 35 个模型，模型选择高度碎片化。

行业模型成本 Anthropic Google Agent Vercel

推荐理由：这份报告用真实 token 消耗数据揭示了谁在真正赚钱、谁在烧钱，做模型选型或成本优化的团队值得细读，能帮你避开 arena 榜的噪音。

原文

20:31

orange.ai@oran_ge

飞书 CLI 在开源一个月后，GitHub 星标数突破一万。相比同期其他 CLI 工具，飞书 CLI 在开发者社群中口碑最好。飞书团队在打造面向 Agent 的软件方面表现出色，该工具为开发者提供了高效的命令行交互体验。

AI产品飞书 CLI 开源/仓库 Agent 开发者工具

推荐理由：飞书 CLI 的快速破万星证明了其解决 Agent 开发痛点的能力，做自动化或 CLI 工具的开发者值得关注这个口碑最好的选择。

原文

19:58

宝玉@dotey

DeepSeek 正在招聘 Agent Harness 产品经理，负责将前沿模型能力转化为领先的 Agent 产品。该职位属于 Harness 团队，涵盖模型之外的所有工作，包括产品路线规划、用户需求分析、与研究员协作实现模型与 Harness 共同进化，以及维护用户社群。任职要求包括 2 年以上产品经验、能使用 vibe coding 写代码、是 Agent 产品的高强度用户，并熟悉 LLM 及 Agent 技术原理。这标志着 DeepSeek 正式加速 Agent 产品化，为 AI 产品经理提供了参与定义下一代人机交互范式的机会。

行业 DeepSeek Agent 产品经理招聘 Harness

推荐理由：DeepSeek 首次公开招募 Agent 产品经理，把模型能力转化为可用产品的关键岗位，做 AI 产品经理或想切入 Agent 赛道的开发者值得关注，这可能是定义未来 Agent 交互范式的机会。

原文