02:21Greg Brockman@gdb精选Tom Osman展示了一个在Codex中运行的自动化循环,用于遍历应用所有功能并生成用户故事与预期行为。该流程维护一个单源电子表格跟踪功能状态,然后切换到测试每个用户故事并记录所有错误。最后修复逻辑或UX错误后,再次测试所有用户行为。这个循环能处理数百个用户故事,展示了Codex的自动化测试能力。技巧CodexTom Osman自动化测试工作流智能体推荐理由:Tom Osman用Codex搞了个自动化循环,从生成用户故事到测试修复一条龙,省人工还管几百个功能,太实用了。原文