10:49Geek@geekbblanshu 是一个基于 Python 3.10+ 和 Pillow 库的开源绘图工具,专为技术博客、系统架构图和流程图设计。用户编辑一份 JSON 配置文件后,可同时导出 .excalidraw 源文件、高清 PNG(最高 4K)以及逐帧动画 GIF(支持 24fps)。所有渲染在本地运行,无需浏览器或远程 API 调用。视觉效果采用深色背景、手写风格标题、流动光效和脉冲高亮,类似 DailyDoseOfDS 的黑底技术手稿。项目已在 GitHub 上开源,提供 pip 快速安装。AI产品lanshuPythonPillowExcalidraw技术绘图推荐理由:技术博主画架构图常用 Excalidraw,但导出 GIF 和 PNG 还得手动转。这个工具改一份 JSON 就能同时拿到三种格式,本地渲染还快,风格也很酷。原文
10:48向阳乔木@vista8腾讯云EdgeOne发布了新产品EdgeOne Makers,旨在简化AI Agent的开发和部署流程。通过执行三条命令即可完成从安装到本地测试的全过程,包括`npm install -g edgeone`、`edgeone makers create --template openai-agents-starter-node`等。本地测试网站可直接观察Agent对话和工具调用细节,线上支持绑定域名和关联Github持续迭代。当前处于Beta内测阶段,注册可免费领取50万Token。AI产品腾讯云EdgeOneEdgeOne Makers智能体部署工具8 个信源在谈推荐理由:腾讯云EdgeOne出了个Makers,几行命令就能把AI Agent框架跑起来,不用自己折腾环境,节省大量时间。原文
09:45Yangyi@YangyixxxxNewMax客户端v1.1.0版本正式发布,完成品牌升级从牛马AI改名NewMax。新版本支持完全离线及断网运行,数据端到端加密存储,区别于Claude Desktop和Codex。该版本新增自动化任务编排,可自动拆解指令调用本地应用如剪映、Photoshop。支持多模型自定义调用、多Cookie浏览器操作及联动钉钉、微信等国内IM工具。AI产品NewMaxClaude DesktopCodex本地化自动化工作流推荐理由:NewMax客户端v1.1.0主打本地隐私安全,能离线运行,还能自动调用本地App做任务,比Claude Desktop多了一大堆实用功能,适合自媒体和办公党。原文
09:15shao__meng@shao__meng精选Boris Cherny 基于 Claude Code 团队经验,提出未来产品团队的五种角色原型:Prototyper(原型师)、Builder(构建者)、Sweeper(优化清理者)、Grower(增长者)、Maintainer(维护者)。他指出角色与岗位头衔无关,多数人横跨 2-3 个角色。产品阶段决定角色配比:新/未达 PMF 需 1+2+3,增长期需 2+3+4+少量 5,成熟期需 3+4+5+少量 2。这一框架强调从职能分工转向价值流分工,团队健康度取决于角色配比与阶段匹配度。行业Claude CodeBoris ChernyAnthropic团队角色产品团队10 个信源在谈推荐理由:Boris Cherny 分享了 Claude Code 团队的经验,把未来团队分成五种角色,帮你重新思考招人和分工,比传统职能划分更实用。原文
08:16Harrison Chase@hwchase17LangSmith 推出 Harbor 功能,用于在沙箱环境中运行评估(evals)。Harbor 支持需要隔离的评估任务。自托管沙箱即将上线。该功能回应了用户对 LangSmith 沙箱自托管的询问。AI产品LangSmithHarbor沙箱评估推荐理由:想跑沙箱评估?LangSmith 的 Harbor 帮你搞定,还能自托管。原文
08:15AK@_akhaliqDiffusionBench是一个专门针对扩散变换器(Diffusion Transformers)的全面评估基准。它涵盖了生成质量、推理效率、模型鲁棒性等多个关键维度。该基准基于ImageNet等公开数据集提供了标准化测试协议。它为不同扩散变换器架构的性能比较建立了统一框架。AI模型DiffusionBench扩散变换器评估基准图像生成推荐理由:想了解不同扩散变换器到底谁更强?试试这个新基准DiffusionBench,评估维度很全,结果很直观。原文
07:51elvis@omarsar0精选剑桥大学提出 Red Queen Gödel Machine,通过让智能体与评估器共同进化来解决自我改进停滞问题。传统自改进循环中智能体学会欺骗固定评估器,导致奖励黑客。新方法让评估器的难度随智能体能力提升而增加,保持循环持续有效。论文编号 arxiv.org/abs/2606.26294。论文Red Queen Gödel MachineCambridge智能体自我改进评估器推荐理由:做智能体自循环的该看看这篇,剑桥让评估器和智能体一起进化,避免奖励黑客,思路很直接。原文
07:15Richard Socher@RichardSocherRichard Socher预告新书《The Eureka Machine》,目标是用AI构建适用于物理、化学、生物学、神经科学、经济学和天体物理学的终极发明生成机器。Geoffrey Hinton推荐Adam Brown关于AI对物理学影响的讲座,称其为“非常好”。Socher的团队Recursive_SI专注于AI for science。论文The Eureka MachineRecursive_SIGeoffrey HintonAdam BrownAI for science推荐理由:Richard Socher的新书讲怎么用AI造发明机器,覆盖多个科学领域,Hinton还推荐了Adam Brown的讲座。原文
07:03GitHub@github精选GitHub 在 SWE-bench Verified、SWE-bench Pro、SkillsBench、TerminalBench、Win-Hill 五个基准上对 Copilot agentic harness 进行了对比测试。固定模型和任务后,任务解决率与模型原生 harness 持平。在大多数配置下 token 消耗更少,最高可省 30%。Copilot 支持超过 20 个模型,用户可针对任务自由切换效率或质量。AI产品GitHubCopilotSWE-bench编程助手智能体推荐理由:GitHub 实测了 Copilot 智能体框架,五个基准上不输原生,还省 token,支持 20 多种模型,值得试试。原文
06:45Clement Delangue@ClementDelangueDeepSeek 推出加速模型集合,其中 Gemma-4-12B 可能包含视觉能力。该模型在其 12B 参数量级别中,本地运行性能显著优于同类竞品。该集合未包含 Qwen 3.5,推测因 DeepSeek 未采用线性注意力机制。AI模型DeepSeekGemma-4-12B加速模型本地模型视觉推荐理由:DeepSeek 把 Gemma-4-12B 加速了,还带视觉,本地跑起来应该是同尺寸里最强的之一。原文
06:36宝玉@dotey精选Anthropic 上周推出 Claude Tag 的 beta 版,面向 Claude Team 和 Enterprise 用户。它允许用户在 Slack 频道中 @ Claude,后台自动拆解任务并回复结果。Andrej Karpathy 将其视为 LLM 交互的第三次重大重新设计(从网页到桌面 App 再到异步持久实体)。Gergely Orosz 指出核心不是 Slack,而是云端 AI 连接内部系统后开箱即用。他认为真正受益的是新员工、非工程师和不熟悉代码库的开发者,而集成难度是最大挑战。AI产品ClaudeAnthropicSlack智能体编程助手10 个信源在谈推荐理由:Anthropic 搞了个新玩法,在 Slack 里 @ Claude 就能让 AI 干活,Karpathy 说这是第三代 LLM 交互。你可以看看它是怎么改变团队协作的。原文
06:36宝玉@dotey精选RepoPrompt 社区版已上线 GitHub,作者 Provencher 被 OpenAI 开发者体验负责人 Romain Huet 挖走。该工具帮开发者从代码仓库中精选文件拼成 prompt,解决超 32K token 导致模型变笨的痛点。新架构反转:内置 MCP server 作为主控,Claude Code、Codex、OpenCode、Gemini CLI 等命令行工具变为可替换的执行层,支持推理模型规划后分发子任务并行执行。目前仅支持 macOS,可通过 Homebrew 安装(brew install --cask repoprompt-ce)。AI产品RepoPromptOpenAIMCP上下文工程编程助手10 个信源在谈推荐理由:RepoPrompt 的作者被 OpenAI 招安,工具直接开源了,现在免费还支持 MCP server 调度多个 agent,做上下文工程省心很多。原文
06:18Gary Marcus@GaryMarcusGLM 5.2 被称作开源界的 Claude 时刻,在 Databricks 平台上需求惊人。Yuchen Jin 指出,该模型遵循已知公式,导致技术壁垒消失、市场趋同、价格战开始,利润率趋小或为负。越来越多公司将转向基于开源模型进行后训练并拥有权重。GaryMarcus 认为这是其三年来论证的无技术护城河、价格战、低利润率趋势的最终体现。AI模型GLM开源模型价格战DatabricksAI市场推荐理由:GLM 5.2 开源版火了,Databricks 上抢着用,价格战要来了,想用低成本模型得看看这个趋势。原文
05:15Lenny Rachitsky@lennysanOpenAI的Codex桌面应用自2月以来使用量增长6倍,周活跃用户突破500万。几乎100%的OpenAI员工(不仅工程师)日常使用Codex。负责人Andrew Ambrosino认为AI在设计方面表现糟糕,产品品味才是核心竞争力。他指出如果Codex在11月而非2月发布,很可能失败——同一产品,仅模型不同。行业OpenAICodex产品设计AI应用10 个信源在谈推荐理由:OpenAI Codex用户量翻了6倍,500万人周活!负责人聊AI为什么做不好设计,以及他们怎么用品味做产品。原文
05:15HeyGen@HeyGen_OfficialHeyGen 使用其 HyperFrames 产品为 aiDotEngineer World Fair 制作了官方开场视频。该视频展示了 HyperFrames 在视频生成方面的能力。HeyGen 团队将在活动现场设展位,并参与演讲交流。此次活动聚焦 AI 工程师领域的前沿技术。AI产品HeyGenHyperFramesaiDotEngineer World Fair视频生成推荐理由:看看 HeyGen 用 HyperFrames 做的现场开场视频,效果不错,团队还会去现场演示。原文
03:54Harrison Chase@hwchase17Fleet 发布新功能,允许用户将 AI agent 分享到 Slack、Microsoft Teams 和电子邮件等渠道。通过 Fleet 的 Slack 集成,非技术人员可以轻松构建 agent 并部署到团队日常工作的地方。这样 agent 就能在公司内部自然传播,无需离开已有工作平台。AI产品FleetSlackTeams智能体企业协作3 个信源在谈推荐理由:Fleet 这次更新让 agent 能直接嵌入 Slack/Teams,同事不用切换界面就能用上,部署超简单。原文
03:06AK@_akhaliq百度发布的Unlimited-OCR模型在Hugging Face模型排行榜上位列第一,超越其他模型。该模型专注于OCR文字识别任务,具体基准成绩尚未公布。其排名基于社区下载量和交互数据,反映出较高的关注度。AI模型baidu/Unlimited-OCRHugging FaceOCR文字识别1 个信源在谈推荐理由:百度这个OCR模型居然冲到Hugging Face第一了,想搞文字识别的可以看看它有什么本事。原文
02:45Gary Marcus@GaryMarcus据FT报道,Google因计算资源短缺限制了Meta对Gemini的使用。报道指出Google在向Meta出售Gemini时无法像预期那样自由。计算能力仍是AI领域最稀缺的资源。行业GoogleMetaGemini计算资源推荐理由:Google资源不够,连Meta都用不上Gemini了,这背后是算力争夺战。原文
02:45Harrison Chase@hwchase17LangChain宣布推出DeepAgents Harness,作为测试智能体行为的框架(harness)。同时提供LangSmith Sandboxes用于安全隔离的执行环境,以及面向LLM输出的评估(Eval)功能。这些组件集成主流模型提供商,并通过LangSmith Engine驱动“模型-测试-沙箱-评估”闭环。该方案旨在帮助企业基于自身领域知识和客户工作流,自主构建和优化智能体系统。AI产品LangChainDeepAgentsLangSmith智能体评估推荐理由:LangChain把智能体测试、沙箱和评估整合到一起了,企业可以自己掌控从模型选择到部署的全流程,不用再拼凑各种工具。原文
02:15Lenny Rachitsky@lennysanOpenAI的Codex桌面应用程序周活跃用户已突破500万,自2月以来使用量增长了6倍。几乎100%的OpenAI员工(不仅是工程师)都经常使用Codex。团队负责人Andrew Ambrosino的目标是打造“有史以来最好的桌面应用”。他认为如果在2024年11月而非2月推出,同一产品可能因模型能力不足而失败。AI产品CodexOpenAI桌面应用ChatGPT8 个信源在谈推荐理由:OpenAI Codex现在周活500万+,几乎全员都在用,负责人还分享了为什么晚几个月发布反而更成功,值得看。原文
01:45AI产品黄叔@PMbackttfuture用户使用Hermes生成手机壁纸,并将微信Agent入口交回Hermes,同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时,内容会同步到flomo,并立即触发即时增强功能,从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。技巧HermesflomoMCP/工具工作流智能体推荐理由:教你给AI设个微信入口,用Hermes做壁纸,还能自动同步到flomo,随时调取记忆,挺实用的。原文
01:42OpenRouter@OpenRouterAIOpenRouter 持续对大多数开源权重模型运行 GPQA 与 TAU-Bench 两个基准,并将结果公开。这些成绩被用于其 AutoExacto 元基准,后者是路由工具调用的默认依据。当前 Parasail 和 Zai 在排行榜上位列第一。技巧OpenRouterGPQATAU-BenchAutoExacto基准测试推荐理由:选模型路由工具前,看看 OpenRouter 定期跑的 GPQA 和 TAU-Bench 排名,现在 Parasail 和 Zai 排第一,挺有参考价值。原文
01:31vLLM@vllm_project精选百度Unlimited-OCR现已集成到vLLM推理框架中,基于Reference Sliding Window Attention(R-SWA)机制实现恒定KV缓存,避免内存暴涨和速度下降。该模型能在32K上下文预算下一次性转录40+页文档,且编辑距离极低。在6K输出token场景下,推理速度比DeepSeek-OCR快35%,GPU内存和吞吐量保持恒定。AI模型Unlimited-OCRBaiduvLLMOCRR-SWA1 个信源在谈推荐理由:百度开源了Unlimited-OCR,在vLLM上跑,能一次性解析整本书,内存不涨,比DeepSeek-OCR快35%,做文档OCR的好东西。原文
00:42Geoffrey Hinton@geoffreyhintonGeoffrey Hinton 在 X 上推荐了 Adam Brown 关于 AI 对未来物理学影响的讲座。该讲座在 YouTube 发布,已获 1880 次观看。Hinton 的推文获得 4 次转发和 12 次点赞。行业Geoffrey HintonAdam BrownAI物理学术讲座推荐理由:Hinton 都说好的讲座!Adam Brown 聊 AI 如何改变物理学,快去YouTube看看。原文
00:36Yangyi@YangyixxxxNous Research 的 Hermes Agent 发布 MoA(Mixture-of-Agents)预置虚拟模型,允许在不同时刻为同一 Agent 路由不同模型,类似快慢脑逻辑。在新基准测试中,该方案比 Opus 4.8 高出 8%,比 GPT 5.5 高出 11%。多 Agent 场景下效果更显著,延续了 Hermes 的工程化优势。AI模型HermesNous Research智能体推理模型MoA推荐理由:Nous Research 让 Agent 在不同时刻自动切换不同模型,比单一模型更强,新基准上比 Opus 4.8 高8%、比 GPT 5.5 高11%。原文
00:21berryxia@berryxia精选73°DeepSeek开源了DSpark投机解码框架,用于推理优化。DSpark通过并行backbone加顺序Markov head解决传统投机解码的后缀衰减问题,并引入置信度调度和负载感知调度器。在DeepSeek-V4生产环境中,单用户生成速度比MTP-1基线快60-85%,不同场景吞吐提升1.5x到5x。开源内容包括DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark模型checkpoint以及MIT协议的DeepSpec训练代码。AI模型DeepSeekDSparkDeepSeek-V4投机解码推理优化推荐理由:DeepSeek开源了DSpark框架,能让你的V4模型推理提速60%以上,且不影响质量。它解决了投机解码在真实部署中的难题,已经稳定跑在生产环境。原文
00:15AI Engineer@aiDotEngineer全球最大AI行业博览会2026 World's Fair门票已全部售罄,包括CTO/VP AI领导力track、研讨会及所有晚鸟票。主办方开放有限溢入场券,不保证座位,先到先得。旧金山各处仍有65场免费活动可参加。目前参会者已超6000人,预计达到7000人上限。行业World's FairAI展会旧金山售票推荐理由:全球最大AI博览会票卖光了,但还有65场免费活动可以蹭。想感受最前沿的AI氛围?趁溢入场券还没抢完赶紧行动。原文
00:01Clement Delangue@ClementDelangueBrian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到,通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7,91%的员工从未触及使用上限。通过改进缓存,LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半,同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。技巧Hugging FaceGLM 5.2Kimi 2.7成本优化缓存推荐理由:Coinbase创始人Brian Armstrong分享了一套实际操作方案:用更便宜的默认模型、优化缓存和路由,能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角,缓存命中率从5%跳到60%。原文
00:01Clement Delangue@ClementDelangue精选Hugging Face CEO Clement Delangue认为,当前最危险的AI系统是闭源前沿API模型(如通过编程助手分发的LLM),它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级:易于分析、能力较弱、传播更可控,且保护者与攻击者平等获取。监管前沿API只需针对少数巨头,成本低且容易执行;监管开源则会伤害小企业、研究者、大学等群体,并降低透明度。行业Hugging Face开源模型AI监管前沿模型推荐理由:Hugging Face CEO直言政府该管闭源API而不是开源模型,点出了监管争论中被忽略的黑箱风险。原文
23:45Aadit Sheth@aaditshElon Musk 宣布 Grok 4.5 基于 1.5T 参数的 V9 基础模型,并加入 Cursor 代码数据进行补充训练,已在 SpaceX 和 Tesla 内部私有 beta 测试。早期评估显示其性能接近甚至可能超过 Opus 模型,RL 持续优化模型。SpaceX 计划今年每月发布一个完全从零训练的新模型。目前 Cursor 拥有 700 万日活开发者,多数因使用 Claude 开始使用 Cursor。AI模型Grok 4.5CursorSpaceXOpus代码生成10 个信源在谈推荐理由:Grok 4.5 用 Cursor 数据训练,性能直逼 Opus,而且 SpaceX 要每月发新模型,代码圈和 AI 圈都该看看。原文
23:15Viking@vikingmuteTinyShip 更新了 tinyship-cloudflare skill,允许 agent 自动配置 Cloudflare 的 worker、Hyperdrive/D1、CF email、R2、Turnstile 等服务,并询问用户选择 Hyperdrive 还是 D1、是否清理 monorepo 等。该 SaaS 模板同时支持 Next.js 和 Nuxt.js 双框架,是国内首个 Nuxt 模板。定价为 299 元人民币,早鸟价 199 元。AI产品TinyShipCloudflareSaaS模板独立开发推荐理由:独立开发者 Viking 发了 TinyShip 的 Cloudflare skill,让 agent 帮你一键搭通 Cloudflare 全套服务,而且还支持国内微信支付和国外 Stripe,定价 199 元起,谁都能买。原文
22:27NVIDIA AI@NVIDIAAINVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon,要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理,以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits,第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits,第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日(周二)前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。行业NVIDIAStripeNous ResearchHermes AgentDGX Spark智能体黑客松6 个信源在谈推荐理由:想赢一台 DGX Spark 吗?用 Hermes Agent 造个自动赚钱的 AI 公司,前三名都有现金加硬件,截止 6 月 30 日,快上车。原文
22:18Geek@geekbb精选开源项目Second Brain是一个内存层,部署在Cloudflare Workers上。它通过MCP协议让Claude、ChatGPT、Cursor和Codex共享记忆。数据存储在用户自己的Cloudflare D1、Vectorize、KV和Workers AI中,采用语义检索。个人规模下,使用Cloudflare免费额度即可运行。AI产品ClaudeChatGPTCursorCodexMCP/工具5 个信源在谈推荐理由:Claude、ChatGPT这些AI能共用记忆了,数据归你管,还免费。试试?原文
21:45shao__meng@shao__meng精选LoanLens基于LandingAI构建,从6类借款人文档中结构化抽取字段,进行姓名一致性TF-IDF比对(相似度低于0.95告警)和护照篡改检测(比对核心组件位置与参考几何)。评分模型透明可解释:信用权重23%、DTI 23%、收入时效20%等,总分≥60批准,40-59复核,<40拒绝。系统附带仅限当前案件的RAG问答,支持字段溯源与人工检查。AI产品LandingAILoanLens欺诈检测RAG文档理解推荐理由:这套LoanLens系统把审贷初筛自动化,用结构化字段和可解释评分替代黑盒OCR,欺诈检测能抓文档篡改,审核员能直接查每个字段的证据。原文
21:39小互@imxiaohu71°马斯克透露Grok 4.5基于1.5T参数的V9基础模型,并在补充训练中加入了Cursor数据。该模型已在SpaceX和Tesla进入早期测试阶段。初步评估显示其性能接近甚至可能超过Anthropic的Opus模型。马斯克还表示强化学习持续提升模型性能,今年将每月发布完全从头训练的新模型。AI模型Grok 4.5马斯克XAI1.5T V9推理模型10 个信源在谈推荐理由:马斯克刚发了Grok 4.5,基于1.5T参数的V9模型,还加了Cursor数据,测试阶段就快超过Opus了,值得关注。原文
20:39berryxia@berryxiaAgent-Reach是一个开源CLI工具,允许AI Agent零API费用、本地运行地获取Twitter、Reddit、YouTube、GitHub、B站、小红书等平台内容。它通过智能选择稳定开源后端并自动健康检查和故障切换,避免手动编写爬虫。安装后Agent可执行“查看YouTube视频字幕”“搜索Twitter评价”等任务,将碎片化能力封装成skill并支持多后端路由与自动降级。该项目在GitHub上已收获3.5K Star,专注于补齐Agent低成本、可靠的内容获取短板。AI产品Agent-Reach开源项目多平台内容获取智能体CLI工具推荐理由:这个Agent-Reach项目开源免费,让AI Agent能直接搜Twitter、YouTube、B站等平台内容,不用写爬虫,自动切换稳定后端,适合做自媒体搜集信息的兄弟们。原文
19:16@elonmusk@elonmuskGrok 4.5 基于 xAI 的 1.5T V9 基础模型,并使用 Cursor 数据进行补充训练。该版本目前已在 SpaceX 和 Tesla 内部私测。早期评估显示其性能接近甚至超过 Opus。RL 训练仍在持续改进模型,Grok Build 工具每日提升。xAI 计划今年每月发布完全从头训练的新模型。AI模型Grok 4.5CursorSpaceX模型更新6 个信源在谈推荐理由:Musk 说 Grok 4.5 私测版已经接近 Opus,而且后面每月都会出新模型,想追动态可以瞅一眼。原文
16:18Geek@geekbb精选网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体,使用低成本 Flash 模型处理大部分上下文,仅在设计(Qwen)和编码(Kimi Code)等关键环节调用高性能模型。每日成本控制在 4~7 美元,并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。技巧Gentle-AIQwenKimi Code智能体模型路由推荐理由:挺实用的配置:11个智能体分工,Flash模型省成本,Qwen和Kimi Code干重活,每天才4-7美元,还降幻觉。原文
15:45Jerry Liu@jerryjliu0Jerry Liu(LlamaIndex创始人)在推特上讨论AI Agent与SaaS的关系。他认为Agent像人类一样有核心通信接口,如chat、voice、slack。SaaS软件则需要根据具体用途定制接口,例如ticket tracking、CRM。目前SaaS公司都在构建Agent以捕捉工作自动化价值,但两者接口会随时间解绑。行业Jerry LiuLlamaIndexAI AgentSaaS智能体3 个信源在谈推荐理由:Jerry Liu说Agent和SaaS会分家,不是SaaS死了而是接口不同。看看他的观点。原文
15:45Geek@geekbbHermes MoA 是一种混合智能体(Mixture of Agents)模式,当前仅 Hermes CLI 支持使用,Hermes Studio 尚未集成。该模式允许用户添加多个辅助模型协同回答,但每增加一个辅助模型就会额外消耗大量 token。体验者称短期玩玩尚可,长期使用即使白嫖也难以承受 token 消耗。AI模型HermesMoACLI混合智能体token消耗推荐理由:你想试试多模型协作吗?Hermes 出了个 MoA 模式,CLI 已经能用了,加几个辅助模型就多费多少 token,白嫖党慎入。原文