00:30Google AI Developers@googleaidevs精选73°Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体,处理长时任务。新增特性包括:内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。AI产品Gemini 3.5 FlashComputer Use智能体自动化测试Google推荐理由:Google 给 Gemini 3.5 Flash 加了 Computer Use 工具,能让智能体跨浏览器、手机和桌面干活,还能自定义安全策略,实用!原文
03:48Greg Brockman@gdb用户 Tom Osman 利用 Codex 的 "/goal" 循环功能,将提示词设为“遍历应用中每个功能,根据代码创建用户故事和期望行为,维护单一电子表格追踪状态”,随后自动切换到测试每个用户故事并记录所有错误,最终修复逻辑或 UX 错误后再次测试。整个过程无需人工干预,自动处理成百上千的用户故事。该案例展示了 Codex 在自动化测试与修复工作流中的实际应用。技巧Codex编程助手自动化测试工作流推荐理由:试试在 Codex 里贴一段类似的循环指令,它就能自动帮你测完整个 App 的每个功能,连修 bug 都包了。原文
02:21Greg Brockman@gdb精选Tom Osman展示了一个在Codex中运行的自动化循环,用于遍历应用所有功能并生成用户故事与预期行为。该流程维护一个单源电子表格跟踪功能状态,然后切换到测试每个用户故事并记录所有错误。最后修复逻辑或UX错误后,再次测试所有用户行为。这个循环能处理数百个用户故事,展示了Codex的自动化测试能力。技巧CodexTom Osman自动化测试工作流智能体推荐理由:Tom Osman用Codex搞了个自动化循环,从生成用户故事到测试修复一条龙,省人工还管几百个功能,太实用了。原文
00:56宝玉@dotey精选文章将传统软件工程实践迁移到 AI Agent 开发中,强调需求分析时需给 Agent 充足上下文并反复对齐,系统设计时用 plan 模式拆分里程碑。代码审查建议先让 Agent 审查格式和逻辑,但人需兜底业务逻辑。自动化测试包括单元测试、集成测试和端到端测试,需与 CI 集成自动运行。灰度发布和 CI/CD 机制(如 feature flag、自动回滚)可减少线上不稳定。线上修复目前更现实的是 AI 辅助定位、人确认后再提交,而非全自动闭环。技巧Agent软件工程代码审查自动化测试CI/CD推荐理由:宝玉分享的实操经验:把传统软件工程的代码审查、测试覆盖、灰度发布等方法用到 AI Agent 上,能少写 bug、少修 bug,适合正在用 Agent 写代码的团队。原文
10:37Replit@ReplitReplit 宣布其 Agent 与 Squidler 集成,实现了完整的 AI QA 循环:Agent 构建应用,Squidler 像真实用户一样测试,发现问题后自动反馈给 Agent 修复。用户只需用自然语言描述应用行为,无需编写测试脚本或选择器。该集成已上线 Replit 的 MCP 库,旨在让开发者无需测试技能即可自信发布。AI产品Replit AgentSquidlerAI QA自动化测试MCP/工具推荐理由:Replit 用户终于有了自动化的测试闭环——Squidler 模拟真实用户操作,Agent 自动修复,省去手写测试的麻烦。做快速原型或 MVP 的开发者可以直接用,减少发布前的焦虑。原文
11:00rohanpaul_ai@rohanpaul_ai83°Google 的 Gemini 3.5 Flash 模型在多个真实工作自动化测试中超越了上一代旗舰 Gemini 3.1 Pro。其输出速度提升 4 倍,且在 Terminal-Bench 2.1、MCP Atlas 等硬核智能体和编程基准测试中表现更优。该模型已集成到 Gemini 应用、搜索 AI 模式、API、Antigravity、Android Studio 及企业智能体产品中。结合更新的 Antigravity 框架,3.5 Flash 能高效部署协作子智能体,例如一个子智能体检查文件夹、另一个重写代码、第三个测试结果、第四个总结变更。这使得它成为日常工作中既快又便宜的强大智能体模型。AI模型Gemini 3.5 Flash智能体自动化测试编程助手Antigravity推荐理由:做自动化测试和智能体开发的团队终于有了又快又便宜的选择——Gemini 3.5 Flash 在多个硬核基准上超越旗舰 Pro,输出速度还快 4 倍,建议直接上手试。原文