11:18shao__meng@shao__meng精选开发者用 Step 3.7 Flash 完成了一个真实 Coding Agent 任务:将一组 Agent Memory 运行痕迹(包括 memory_events、structured_facts、memory_chunks 等)转化为一个本地可检查的 HTML 工具。模型先读取现有代码和测试输出,再检索 Letta、LangSmith 等工具的展示方式,最终生成单文件 agent_memory_inspector.html,展示 8 条 memory events、9 条 structured facts、9/9 场景测试通过等关键信息。这次测试表明,模型不仅能回答问题,还能理解上下文、查资料、写代码并产出可运行的工具。虽然还不是生产级观测平台,但作为 first-pass 任务,它验证了模型将真实 Agent traces 转化为可用工具的能力。AI产品Step 3.7 FlashCoding AgentAgent Memory本地工具调试推荐理由:做 Agent 开发或调试的团队,终于有个快速把混乱运行痕迹变成可视化检查工具的方法——Step 3.7 Flash 这次实测值得点开看看,可以直接复现验证。原文