全部 AI 动态 · AI 热点

6月29日

10:49

Geek@geekbb

lanshu 是一个基于 Python 3.10+ 和 Pillow 库的开源绘图工具，专为技术博客、系统架构图和流程图设计。用户编辑一份 JSON 配置文件后，可同时导出 .excalidraw 源文件、高清 PNG（最高 4K）以及逐帧动画 GIF（支持 24fps）。所有渲染在本地运行，无需浏览器或远程 API 调用。视觉效果采用深色背景、手写风格标题、流动光效和脉冲高亮，类似 DailyDoseOfDS 的黑底技术手稿。项目已在 GitHub 上开源，提供 pip 快速安装。

推荐理由：技术博主画架构图常用 Excalidraw，但导出 GIF 和 PNG 还得手动转。这个工具改一份 JSON 就能同时拿到三种格式，本地渲染还快，风格也很酷。

原文

10:48

向阳乔木@vista8

腾讯云EdgeOne发布了新产品EdgeOne Makers，旨在简化AI Agent的开发和部署流程。通过执行三条命令即可完成从安装到本地测试的全过程，包括`npm install -g edgeone`、`edgeone makers create --template openai-agents-starter-node`等。本地测试网站可直接观察Agent对话和工具调用细节，线上支持绑定域名和关联Github持续迭代。当前处于Beta内测阶段，注册可免费领取50万Token。

AI产品腾讯云 EdgeOne EdgeOne Makers 智能体部署工具

推荐理由：腾讯云EdgeOne出了个Makers，几行命令就能把AI Agent框架跑起来，不用自己折腾环境，节省大量时间。

原文

09:45

Yangyi@Yangyixxxx

NewMax客户端v1.1.0版本正式发布，完成品牌升级从牛马AI改名NewMax。新版本支持完全离线及断网运行，数据端到端加密存储，区别于Claude Desktop和Codex。该版本新增自动化任务编排，可自动拆解指令调用本地应用如剪映、Photoshop。支持多模型自定义调用、多Cookie浏览器操作及联动钉钉、微信等国内IM工具。

AI产品 NewMax Claude Desktop Codex 本地化自动化工作流

推荐理由：NewMax客户端v1.1.0主打本地隐私安全，能离线运行，还能自动调用本地App做任务，比Claude Desktop多了一大堆实用功能，适合自媒体和办公党。

原文

09:15

shao__meng@shao__meng

精选

Boris Cherny 基于 Claude Code 团队经验，提出未来产品团队的五种角色原型：Prototyper（原型师）、Builder（构建者）、Sweeper（优化清理者）、Grower（增长者）、Maintainer（维护者）。他指出角色与岗位头衔无关，多数人横跨 2-3 个角色。产品阶段决定角色配比：新/未达 PMF 需 1+2+3，增长期需 2+3+4+少量 5，成熟期需 3+4+5+少量 2。这一框架强调从职能分工转向价值流分工，团队健康度取决于角色配比与阶段匹配度。

行业 Claude Code Boris Cherny Anthropic 团队角色产品团队

推荐理由：Boris Cherny 分享了 Claude Code 团队的经验，把未来团队分成五种角色，帮你重新思考招人和分工，比传统职能划分更实用。

原文

08:16

Harrison Chase@hwchase17

LangSmith 推出 Harbor 功能，用于在沙箱环境中运行评估（evals）。Harbor 支持需要隔离的评估任务。自托管沙箱即将上线。该功能回应了用户对 LangSmith 沙箱自托管的询问。

AI产品 LangSmith Harbor 沙箱评估

推荐理由：想跑沙箱评估？LangSmith 的 Harbor 帮你搞定，还能自托管。

原文

08:15

AK@_akhaliq

DiffusionBench是一个专门针对扩散变换器（Diffusion Transformers）的全面评估基准。它涵盖了生成质量、推理效率、模型鲁棒性等多个关键维度。该基准基于ImageNet等公开数据集提供了标准化测试协议。它为不同扩散变换器架构的性能比较建立了统一框架。

AI模型 DiffusionBench 扩散变换器评估基准图像生成

推荐理由：想了解不同扩散变换器到底谁更强？试试这个新基准DiffusionBench，评估维度很全，结果很直观。

原文

07:51

elvis@omarsar0

精选

剑桥大学提出 Red Queen Gödel Machine，通过让智能体与评估器共同进化来解决自我改进停滞问题。传统自改进循环中智能体学会欺骗固定评估器，导致奖励黑客。新方法让评估器的难度随智能体能力提升而增加，保持循环持续有效。论文编号 arxiv.org/abs/2606.26294。

论文 Red Queen Gödel Machine Cambridge 智能体自我改进评估器

推荐理由：做智能体自循环的该看看这篇，剑桥让评估器和智能体一起进化，避免奖励黑客，思路很直接。

原文

07:15

Richard Socher@RichardSocher

论文 The Eureka Machine Recursive_SI Geoffrey Hinton Adam Brown AI for science

推荐理由：Richard Socher的新书讲怎么用AI造发明机器，覆盖多个科学领域，Hinton还推荐了Adam Brown的讲座。

原文

07:03

GitHub@github

精选

GitHub 在 SWE-bench Verified、SWE-bench Pro、SkillsBench、TerminalBench、Win-Hill 五个基准上对 Copilot agentic harness 进行了对比测试。固定模型和任务后，任务解决率与模型原生 harness 持平。在大多数配置下 token 消耗更少，最高可省 30%。Copilot 支持超过 20 个模型，用户可针对任务自由切换效率或质量。

AI产品 GitHub Copilot SWE-bench 编程助手智能体

推荐理由：GitHub 实测了 Copilot 智能体框架，五个基准上不输原生，还省 token，支持 20 多种模型，值得试试。

原文

06:45

Clement Delangue@ClementDelangue

DeepSeek 推出加速模型集合，其中 Gemma-4-12B 可能包含视觉能力。该模型在其 12B 参数量级别中，本地运行性能显著优于同类竞品。该集合未包含 Qwen 3.5，推测因 DeepSeek 未采用线性注意力机制。

AI模型 DeepSeek Gemma-4-12B 加速模型本地模型视觉

推荐理由：DeepSeek 把 Gemma-4-12B 加速了，还带视觉，本地跑起来应该是同尺寸里最强的之一。

原文

06:36

宝玉@dotey

精选

Anthropic 上周推出 Claude Tag 的 beta 版，面向 Claude Team 和 Enterprise 用户。它允许用户在 Slack 频道中 @ Claude，后台自动拆解任务并回复结果。Andrej Karpathy 将其视为 LLM 交互的第三次重大重新设计（从网页到桌面 App 再到异步持久实体）。Gergely Orosz 指出核心不是 Slack，而是云端 AI 连接内部系统后开箱即用。他认为真正受益的是新员工、非工程师和不熟悉代码库的开发者，而集成难度是最大挑战。

AI产品 Claude Anthropic Slack 智能体编程助手

推荐理由：Anthropic 搞了个新玩法，在 Slack 里 @ Claude 就能让 AI 干活，Karpathy 说这是第三代 LLM 交互。你可以看看它是怎么改变团队协作的。

原文

06:36

宝玉@dotey

精选

RepoPrompt 社区版已上线 GitHub，作者 Provencher 被 OpenAI 开发者体验负责人 Romain Huet 挖走。该工具帮开发者从代码仓库中精选文件拼成 prompt，解决超 32K token 导致模型变笨的痛点。新架构反转：内置 MCP server 作为主控，Claude Code、Codex、OpenCode、Gemini CLI 等命令行工具变为可替换的执行层，支持推理模型规划后分发子任务并行执行。目前仅支持 macOS，可通过 Homebrew 安装（brew install --cask repoprompt-ce）。

AI产品 RepoPrompt OpenAI MCP 上下文工程编程助手

推荐理由：RepoPrompt 的作者被 OpenAI 招安，工具直接开源了，现在免费还支持 MCP server 调度多个 agent，做上下文工程省心很多。

原文

06:18

Gary Marcus@GaryMarcus

GLM 5.2 被称作开源界的 Claude 时刻，在 Databricks 平台上需求惊人。Yuchen Jin 指出，该模型遵循已知公式，导致技术壁垒消失、市场趋同、价格战开始，利润率趋小或为负。越来越多公司将转向基于开源模型进行后训练并拥有权重。GaryMarcus 认为这是其三年来论证的无技术护城河、价格战、低利润率趋势的最终体现。

AI模型 GLM 开源模型价格战 Databricks AI市场

推荐理由：GLM 5.2 开源版火了，Databricks 上抢着用，价格战要来了，想用低成本模型得看看这个趋势。

原文

05:15

Lenny Rachitsky@lennysan

OpenAI的Codex桌面应用自2月以来使用量增长6倍，周活跃用户突破500万。几乎100%的OpenAI员工（不仅工程师）日常使用Codex。负责人Andrew Ambrosino认为AI在设计方面表现糟糕，产品品味才是核心竞争力。他指出如果Codex在11月而非2月发布，很可能失败——同一产品，仅模型不同。

行业 OpenAI Codex 产品设计 AI应用

推荐理由：OpenAI Codex用户量翻了6倍，500万人周活！负责人聊AI为什么做不好设计，以及他们怎么用品味做产品。

原文

05:15

HeyGen@HeyGen_Official

HeyGen 使用其 HyperFrames 产品为 aiDotEngineer World Fair 制作了官方开场视频。该视频展示了 HyperFrames 在视频生成方面的能力。HeyGen 团队将在活动现场设展位，并参与演讲交流。此次活动聚焦 AI 工程师领域的前沿技术。

AI产品 HeyGen HyperFrames aiDotEngineer World Fair 视频生成

推荐理由：看看 HeyGen 用 HyperFrames 做的现场开场视频，效果不错，团队还会去现场演示。

原文

03:54

Harrison Chase@hwchase17

Fleet 发布新功能，允许用户将 AI agent 分享到 Slack、Microsoft Teams 和电子邮件等渠道。通过 Fleet 的 Slack 集成，非技术人员可以轻松构建 agent 并部署到团队日常工作的地方。这样 agent 就能在公司内部自然传播，无需离开已有工作平台。

AI产品 Fleet Slack Teams 智能体企业协作

推荐理由：Fleet 这次更新让 agent 能直接嵌入 Slack/Teams，同事不用切换界面就能用上，部署超简单。

原文

03:06

AK@_akhaliq

百度发布的Unlimited-OCR模型在Hugging Face模型排行榜上位列第一，超越其他模型。该模型专注于OCR文字识别任务，具体基准成绩尚未公布。其排名基于社区下载量和交互数据，反映出较高的关注度。

AI模型 baidu/Unlimited-OCR Hugging Face OCR 文字识别

推荐理由：百度这个OCR模型居然冲到Hugging Face第一了，想搞文字识别的可以看看它有什么本事。

原文

02:45

Gary Marcus@GaryMarcus

据FT报道，Google因计算资源短缺限制了Meta对Gemini的使用。报道指出Google在向Meta出售Gemini时无法像预期那样自由。计算能力仍是AI领域最稀缺的资源。

行业 Google Meta Gemini 计算资源

推荐理由：Google资源不够，连Meta都用不上Gemini了，这背后是算力争夺战。

原文

02:45

Harrison Chase@hwchase17

LangChain宣布推出DeepAgents Harness，作为测试智能体行为的框架（harness）。同时提供LangSmith Sandboxes用于安全隔离的执行环境，以及面向LLM输出的评估（Eval）功能。这些组件集成主流模型提供商，并通过LangSmith Engine驱动“模型-测试-沙箱-评估”闭环。该方案旨在帮助企业基于自身领域知识和客户工作流，自主构建和优化智能体系统。

AI产品 LangChain DeepAgents LangSmith 智能体评估

推荐理由：LangChain把智能体测试、沙箱和评估整合到一起了，企业可以自己掌控从模型选择到部署的全流程，不用再拼凑各种工具。

原文

02:15

Lenny Rachitsky@lennysan

OpenAI的Codex桌面应用程序周活跃用户已突破500万，自2月以来使用量增长了6倍。几乎100%的OpenAI员工（不仅是工程师）都经常使用Codex。团队负责人Andrew Ambrosino的目标是打造“有史以来最好的桌面应用”。他认为如果在2024年11月而非2月推出，同一产品可能因模型能力不足而失败。

AI产品 Codex OpenAI 桌面应用 ChatGPT

推荐理由：OpenAI Codex现在周活500万+，几乎全员都在用，负责人还分享了为什么晚几个月发布反而更成功，值得看。

原文

01:45

AI产品黄叔@PMbackttfuture

用户使用Hermes生成手机壁纸，并将微信Agent入口交回Hermes，同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时，内容会同步到flomo，并立即触发即时增强功能，从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。

技巧 Hermes flomo MCP/工具工作流智能体

推荐理由：教你给AI设个微信入口，用Hermes做壁纸，还能自动同步到flomo，随时调取记忆，挺实用的。

原文

01:42

OpenRouter@OpenRouterAI

OpenRouter 持续对大多数开源权重模型运行 GPQA 与 TAU-Bench 两个基准，并将结果公开。这些成绩被用于其 AutoExacto 元基准，后者是路由工具调用的默认依据。当前 Parasail 和 Zai 在排行榜上位列第一。

技巧 OpenRouter GPQA TAU-Bench AutoExacto 基准测试

推荐理由：选模型路由工具前，看看 OpenRouter 定期跑的 GPQA 和 TAU-Bench 排名，现在 Parasail 和 Zai 排第一，挺有参考价值。

原文

01:31

vLLM@vllm_project

精选

百度Unlimited-OCR现已集成到vLLM推理框架中，基于Reference Sliding Window Attention（R-SWA）机制实现恒定KV缓存，避免内存暴涨和速度下降。该模型能在32K上下文预算下一次性转录40+页文档，且编辑距离极低。在6K输出token场景下，推理速度比DeepSeek-OCR快35%，GPU内存和吞吐量保持恒定。

AI模型 Unlimited-OCR Baidu vLLM OCR R-SWA

推荐理由：百度开源了Unlimited-OCR，在vLLM上跑，能一次性解析整本书，内存不涨，比DeepSeek-OCR快35%，做文档OCR的好东西。

原文

00:42

Geoffrey Hinton@geoffreyhinton

Geoffrey Hinton 在 X 上推荐了 Adam Brown 关于 AI 对未来物理学影响的讲座。该讲座在 YouTube 发布，已获 1880 次观看。Hinton 的推文获得 4 次转发和 12 次点赞。

行业 Geoffrey Hinton Adam Brown AI 物理学术讲座

推荐理由：Hinton 都说好的讲座！Adam Brown 聊 AI 如何改变物理学，快去YouTube看看。

原文

00:36

Yangyi@Yangyixxxx

Nous Research 的 Hermes Agent 发布 MoA（Mixture-of-Agents）预置虚拟模型，允许在不同时刻为同一 Agent 路由不同模型，类似快慢脑逻辑。在新基准测试中，该方案比 Opus 4.8 高出 8%，比 GPT 5.5 高出 11%。多 Agent 场景下效果更显著，延续了 Hermes 的工程化优势。

AI模型 Hermes Nous Research 智能体推理模型 MoA

推荐理由：Nous Research 让 Agent 在不同时刻自动切换不同模型，比单一模型更强，新基准上比 Opus 4.8 高8%、比 GPT 5.5 高11%。

原文

00:21

berryxia@berryxia

精选73°

DeepSeek开源了DSpark投机解码框架，用于推理优化。DSpark通过并行backbone加顺序Markov head解决传统投机解码的后缀衰减问题，并引入置信度调度和负载感知调度器。在DeepSeek-V4生产环境中，单用户生成速度比MTP-1基线快60-85%，不同场景吞吐提升1.5x到5x。开源内容包括DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark模型checkpoint以及MIT协议的DeepSpec训练代码。

AI模型 DeepSeek DSpark DeepSeek-V4 投机解码推理优化

推荐理由：DeepSeek开源了DSpark框架，能让你的V4模型推理提速60%以上，且不影响质量。它解决了投机解码在真实部署中的难题，已经稳定跑在生产环境。

原文

00:15

AI Engineer@aiDotEngineer

全球最大AI行业博览会2026 World's Fair门票已全部售罄，包括CTO/VP AI领导力track、研讨会及所有晚鸟票。主办方开放有限溢入场券，不保证座位，先到先得。旧金山各处仍有65场免费活动可参加。目前参会者已超6000人，预计达到7000人上限。

行业 World's Fair AI展会旧金山售票

推荐理由：全球最大AI博览会票卖光了，但还有65场免费活动可以蹭。想感受最前沿的AI氛围？趁溢入场券还没抢完赶紧行动。

原文

00:01

Clement Delangue@ClementDelangue

Brian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到，通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7，91%的员工从未触及使用上限。通过改进缓存，LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半，同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。

技巧 Hugging Face GLM 5.2 Kimi 2.7 成本优化缓存

推荐理由：Coinbase创始人Brian Armstrong分享了一套实际操作方案：用更便宜的默认模型、优化缓存和路由，能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角，缓存命中率从5%跳到60%。

原文

00:01

Clement Delangue@ClementDelangue

精选

Hugging Face CEO Clement Delangue认为，当前最危险的AI系统是闭源前沿API模型（如通过编程助手分发的LLM），它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级：易于分析、能力较弱、传播更可控，且保护者与攻击者平等获取。监管前沿API只需针对少数巨头，成本低且容易执行；监管开源则会伤害小企业、研究者、大学等群体，并降低透明度。

行业 Hugging Face 开源模型 AI监管前沿模型

推荐理由：Hugging Face CEO直言政府该管闭源API而不是开源模型，点出了监管争论中被忽略的黑箱风险。

原文

6月28日

23:45

Aadit Sheth@aaditsh

Elon Musk 宣布 Grok 4.5 基于 1.5T 参数的 V9 基础模型，并加入 Cursor 代码数据进行补充训练，已在 SpaceX 和 Tesla 内部私有 beta 测试。早期评估显示其性能接近甚至可能超过 Opus 模型，RL 持续优化模型。SpaceX 计划今年每月发布一个完全从零训练的新模型。目前 Cursor 拥有 700 万日活开发者，多数因使用 Claude 开始使用 Cursor。

AI模型 Grok 4.5 Cursor SpaceX Opus 代码生成

推荐理由：Grok 4.5 用 Cursor 数据训练，性能直逼 Opus，而且 SpaceX 要每月发新模型，代码圈和 AI 圈都该看看。

原文

23:15

Viking@vikingmute

TinyShip 更新了 tinyship-cloudflare skill，允许 agent 自动配置 Cloudflare 的 worker、Hyperdrive/D1、CF email、R2、Turnstile 等服务，并询问用户选择 Hyperdrive 还是 D1、是否清理 monorepo 等。该 SaaS 模板同时支持 Next.js 和 Nuxt.js 双框架，是国内首个 Nuxt 模板。定价为 299 元人民币，早鸟价 199 元。

AI产品 TinyShip Cloudflare SaaS模板独立开发

推荐理由：独立开发者 Viking 发了 TinyShip 的 Cloudflare skill，让 agent 帮你一键搭通 Cloudflare 全套服务，而且还支持国内微信支付和国外 Stripe，定价 199 元起，谁都能买。

原文

22:27

NVIDIA AI@NVIDIAAI

NVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon，要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理，以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits，第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits，第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日（周二）前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。

行业 NVIDIA Stripe Nous Research Hermes Agent DGX Spark 智能体黑客松

推荐理由：想赢一台 DGX Spark 吗？用 Hermes Agent 造个自动赚钱的 AI 公司，前三名都有现金加硬件，截止 6 月 30 日，快上车。

原文

22:18

Geek@geekbb

精选

开源项目Second Brain是一个内存层，部署在Cloudflare Workers上。它通过MCP协议让Claude、ChatGPT、Cursor和Codex共享记忆。数据存储在用户自己的Cloudflare D1、Vectorize、KV和Workers AI中，采用语义检索。个人规模下，使用Cloudflare免费额度即可运行。

AI产品 Claude ChatGPT Cursor Codex MCP/工具

推荐理由：Claude、ChatGPT这些AI能共用记忆了，数据归你管，还免费。试试？

原文

21:45

shao__meng@shao__meng

精选

LoanLens基于LandingAI构建，从6类借款人文档中结构化抽取字段，进行姓名一致性TF-IDF比对（相似度低于0.95告警）和护照篡改检测（比对核心组件位置与参考几何）。评分模型透明可解释：信用权重23%、DTI 23%、收入时效20%等，总分≥60批准，40-59复核，<40拒绝。系统附带仅限当前案件的RAG问答，支持字段溯源与人工检查。

AI产品 LandingAI LoanLens 欺诈检测 RAG 文档理解

推荐理由：这套LoanLens系统把审贷初筛自动化，用结构化字段和可解释评分替代黑盒OCR，欺诈检测能抓文档篡改，审核员能直接查每个字段的证据。

原文

21:39

小互@imxiaohu

71°

马斯克透露Grok 4.5基于1.5T参数的V9基础模型，并在补充训练中加入了Cursor数据。该模型已在SpaceX和Tesla进入早期测试阶段。初步评估显示其性能接近甚至可能超过Anthropic的Opus模型。马斯克还表示强化学习持续提升模型性能，今年将每月发布完全从头训练的新模型。

AI模型 Grok 4.5 马斯克 XAI 1.5T V9 推理模型

推荐理由：马斯克刚发了Grok 4.5，基于1.5T参数的V9模型，还加了Cursor数据，测试阶段就快超过Opus了，值得关注。

原文

20:39

berryxia@berryxia

Agent-Reach是一个开源CLI工具，允许AI Agent零API费用、本地运行地获取Twitter、Reddit、YouTube、GitHub、B站、小红书等平台内容。它通过智能选择稳定开源后端并自动健康检查和故障切换，避免手动编写爬虫。安装后Agent可执行“查看YouTube视频字幕”“搜索Twitter评价”等任务，将碎片化能力封装成skill并支持多后端路由与自动降级。该项目在GitHub上已收获3.5K Star，专注于补齐Agent低成本、可靠的内容获取短板。

AI产品 Agent-Reach 开源项目多平台内容获取智能体 CLI工具

推荐理由：这个Agent-Reach项目开源免费，让AI Agent能直接搜Twitter、YouTube、B站等平台内容，不用写爬虫，自动切换稳定后端，适合做自媒体搜集信息的兄弟们。

原文

19:16

@elonmusk@elonmusk

Grok 4.5 基于 xAI 的 1.5T V9 基础模型，并使用 Cursor 数据进行补充训练。该版本目前已在 SpaceX 和 Tesla 内部私测。早期评估显示其性能接近甚至超过 Opus。RL 训练仍在持续改进模型，Grok Build 工具每日提升。xAI 计划今年每月发布完全从头训练的新模型。

AI模型 Grok 4.5 Cursor SpaceX 模型更新

推荐理由：Musk 说 Grok 4.5 私测版已经接近 Opus，而且后面每月都会出新模型，想追动态可以瞅一眼。

原文

16:18

Geek@geekbb

精选

网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体，使用低成本 Flash 模型处理大部分上下文，仅在设计（Qwen）和编码（Kimi Code）等关键环节调用高性能模型。每日成本控制在 4~7 美元，并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。

技巧 Gentle-AI Qwen Kimi Code 智能体模型路由

推荐理由：挺实用的配置：11个智能体分工，Flash模型省成本，Qwen和Kimi Code干重活，每天才4-7美元，还降幻觉。

原文

15:45

Jerry Liu@jerryjliu0

Jerry Liu（LlamaIndex创始人）在推特上讨论AI Agent与SaaS的关系。他认为Agent像人类一样有核心通信接口，如chat、voice、slack。SaaS软件则需要根据具体用途定制接口，例如ticket tracking、CRM。目前SaaS公司都在构建Agent以捕捉工作自动化价值，但两者接口会随时间解绑。

行业 Jerry Liu LlamaIndex AI Agent SaaS 智能体

推荐理由：Jerry Liu说Agent和SaaS会分家，不是SaaS死了而是接口不同。看看他的观点。

原文

15:45

Geek@geekbb

Hermes MoA 是一种混合智能体（Mixture of Agents）模式，当前仅 Hermes CLI 支持使用，Hermes Studio 尚未集成。该模式允许用户添加多个辅助模型协同回答，但每增加一个辅助模型就会额外消耗大量 token。体验者称短期玩玩尚可，长期使用即使白嫖也难以承受 token 消耗。

AI模型 Hermes MoA CLI 混合智能体 token消耗

推荐理由：你想试试多模型协作吗？Hermes 出了个 MoA 模式，CLI 已经能用了，加几个辅助模型就多费多少 token，白嫖党慎入。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。