Agent 存算分离架构设计：从 18 台服务器降到 3 台

精选理由

做 Agent 托管服务的团队会直接受益——存算分离架构把服务器成本砍到 1/6，利润空间瞬间打开。想规模化部署 Agent 的开发者建议仔细看，这套方案解决了多租户、长时间运行和成本控制的经典矛盾。

AI 摘要

作者 idoubicc 分享了 Agent 存算分离架构的设计思路，将 Agent 运行分为本地裸机、本地沙盒和云端多副本三种模式，并重点介绍了云端场景下结合 serverless 的存算分离方案。通过将热状态、对话记录、长期记忆和工作产物分别存储在 KV、关系数据库、向量数据库和对象存储中，计算层依赖 Pod 和沙盒动态扩缩容，大幅降低运营成本。作者将 OpenClaw 托管服务迁移到 FastClaw 后，服务器从 18 台降到 3 台，成本降至原来的 1/6，同时 MRR 突破 8k 美元。

AI 翻译 · 中文

idoubi聊一聊 Agent 的存算分离架构设计👇 一个有灵魂，有记忆的 Agent，一次任务的生命周期包括以下步骤 1. 用户输入 query（text + files） 2. Agent 读取提示词文件（soul.md，identify.md，user.md 等） 3. Agent 读取可用的工具和技能（tools，skills 等） 4. Agent 读取记忆（memory.md，memory_search 查询） 5. Agent 构建…

IT之家06-01 10:03原文
shao__meng06-01 13:41原文
小互06-03 00:26原文
Hunyuan06-01 09:01原文
AI Will06-02 06:17原文
GitHub06-03 22:20原文

查看原推