11:19IT之家(博客/媒体)Anthropic 正在测试手机端 Claude Cowork,用户可通过手机发起并调整任务。Claude Cowork 是 2026 年 1 月 13 日发布的桌面智能体工作模式,代码几乎全部由 Claude 完成,开发周期仅一周半,初始仅向 Mac 端 Claude Max 订阅用户开放。2026 年 3 月 24 日,Anthropic 测试了 Computer Use 功能并推出 Dispatch 功能,允许手机向电脑端 Claude 发送指令。此次移动端测试将 Claude Cowork 定位为远程控制器,用于发起任务、调整方向和查看进度。AI产品AnthropicClaude Cowork智能体Computer UseClaude Max10 个信源在谈推荐理由:Anthropic 正在给 Claude Cowork 加手机端,以后你能拿手机远程挂着任务让电脑端跑,还能随时调整进度,挺方便。原文
22:12shao__meng@shao__meng开发者@Zai_org为ZCode安装了开源Computer Use插件Cua,使Agent能通过CGEvent和Accessibility API直接操控macOS。它可截图、读取无障碍树、点击、打字,绕开了Apple Events权限限制。测试中Agent自己计算7×6=42,并打开Chrome导航到微博和X。这展示了GUI正从人机接口变成Agent可操作的界面。AI产品ZCodeCuaComputer Use智能体GUI操作1 个信源在谈推荐理由:ZCode装上Cua后,你的Agent就能直接点屏幕、开浏览器了,还能自己算数和发帖,非常酷。原文
00:30Google AI Developers@googleaidevs精选73°Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体,处理长时任务。新增特性包括:内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。AI产品Gemini 3.5 FlashComputer Use智能体自动化测试Google推荐理由:Google 给 Gemini 3.5 Flash 加了 Computer Use 工具,能让智能体跨浏览器、手机和桌面干活,还能自定义安全策略,实用!原文
17:30Decoder@Matthias Bastian71°Google 将“Computer Use”能力直接集成到 Gemini 3.5 Flash,使模型可自主操作电脑、浏览器和移动设备。在 OSWorld 基准测试中,Gemini 3.5 Flash 得分 78.4,与 GPT-5.5 成绩相当。开发者可利用 Gemini API 构建用于软件测试或办公自动化的智能体。AI模型Gemini 3.5 FlashComputer UseOSWorld智能体自动化推荐理由:Google 把屏幕操控塞进了 Gemini 3.5 Flash,OSWorld 得分和 GPT-5.5 差不多。开发者直接用 API 就能做自动化,很实在。原文
13:54IT之家(博客/媒体)精选谷歌在 Chrome 149 浏览器中新增“Select from screen”功能,用户可通过光标选中屏幕上的图片或文字,直接与 Gemini 3.5 Flash 模型交互提问。该功能与 Google Lens 类似,但将屏幕内容送入对话式 AI 处理。此外,Gemini 3.5 Flash 模型原生引入 Computer Use 工具,使 AI 智能体能在网页、桌面、移动端执行访问网站、填写表单、点击按钮等任务。AI产品ChromeGemini 3.5 FlashComputer UseAI交互智能体推荐理由:现在你逛鞋店网站时,直接框选几双鞋问Gemini哪双适合你,省去复制粘贴的麻烦。原文
20:24shao__meng@shao__meng精选用户shao__meng今天开始使用Zcode编程助手,搭配GLM-5.2模型,体验快速且好用。但与Codex相比,Zcode在Computer Use等全面能力上仍有差距。用户感谢SeTriones赞助GLM API Key,并认为Zcode的能力全面性有待提升。AI产品CodexZcodeGLM-5.2编程助手Computer Use推荐理由:老TL分享了Zcode和Codex的对比体验,GLM-5.2模型真的快,但Zcode的Computer Use还比不上Codex。原文
09:26Yangyi@Yangyixxxx精选OpenAI Codex 桌面端推出 Record & Replay 功能,用户可在 macOS 上演示重复性操作,Codex 自动生成可复用的 Skill 文件。生成的 Skill 包含触发条件、输入、步骤和验证方式,支持检查和编辑。重放时只需告诉 Codex 应用的 Skill 并传入新参数,Codex 结合 Computer Use、浏览器和已连 plugin 完成任务。目前仅限 macOS,欧盟暂不可用,使用前需开启 Computer Use。AI产品OpenAICodexmacOSComputer Use自动化10 个信源在谈推荐理由:OpenAI Codex 新功能让你在 Mac 上演示一遍操作,它就能自动记录并重复执行,以后填单、发视频这类固定流程再不用手写了。原文
04:32宝玉@dotey精选73°OpenAI Codex 桌面端新增 Record & Replay 功能,允许用户在 Mac 上录制一系列操作,Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS,欧盟地区不可用,使用前需开启 Computer Use。该功能旨在简化日常重复性任务,如报销填单、发布视频、创建 issue 等。录制完成后,用户可在新对话中调用 Skill 并传入不同参数,由 Codex 结合 Computer Use、浏览器和插件自动执行。AI产品OpenAI CodexRecord & ReplayComputer Use自动化智能体10 个信源在谈推荐理由:OpenAI Codex 这次不用你写指令了,Mac 上演示一遍操作就能生成可复用的 Skill,下次改改参数自动跑,报销填单之类的好用了。原文
10:31shao__meng@shao__meng精选73°OpenAI Codex 提供三种操作电脑能力:@ Browser 是线程内隔离浏览器,适合本地开发与视觉调试,无登录态和扩展;@ Chrome 使用真实 Chrome 身份,支持多标签和已登录 SaaS,操作等同于用户本人;@ Computer 控制整个桌面 GUI,用于原生 App 和无 API 流程,速度最慢但覆盖面最广。此外,Appshots 仅提供当前窗口上下文,不赋予控制权。文章还给出了基于任务场景的选择决策框架和三个典型应用案例。技巧OpenAICodexComputer UseChromeBrowser教程10 个信源在谈推荐理由:Codex 团队手把手教你区分三种控制模式:本地开发用 Browser,登录 SaaS 用 Chrome,原生应用用 Computer。还有决策框架,实测好用。原文
08:16宝玉@dotey73°Codex 的 Computer Use 模式像人一样操作任何桌面应用,但速度慢,Mac 可后台运行而 Windows 需占用前台,曾自动完成亚马逊退款流程。Chrome 扩展利用已登录浏览器会话,可操作 Gmail、LinkedIn 等需登录的工具,支持多标签页任务,但发送付款等操作建议人工确认。内置浏览器是隔离的沙盒环境,适合开发调试,支持直接标注元素让 Codex 修改代码。Jason 的建议:优先用结构化插件或 MCP,视觉控制是最后手段。技巧CodexComputer UseChrome扩展内置浏览器编程助手推荐理由:Jason 把三种操作方式拆得明明白白,哪个场景该用哪个直接照搬。尤其是内置浏览器的标注交互,做前端调试能省一多半来回截图的时间。原文
12:22向阳乔木@vista8一位用户分享其践行AI First原则,即遇到任何任务先尝试用AI解决。具体案例是使用OpenAI的Codex模型及其Computer Use功能,自动填写Word合同。这展示了AI在办公自动化中的实际应用,尤其适合重复性文档处理场景。该实践降低了手动操作成本,值得关注AI办公效率的团队参考。AI产品AI First原则CodexComputer Use办公自动化Word合同10 个信源在谈推荐理由:AI First原则是当前高效工作法的核心,用Codex的Computer Use填合同解决了文档自动化的痛点,做行政、法务或日常办公的团队可以直接借鉴。原文
16:34歸藏(guizang.ai)@op7418Codex 昨晚发布了一系列体验更新,其中最受关注的是 Windows 版 Computer Use 功能的支持,以及通过移动端 ChatGPT 远程控制 Windows 上的 Codex。不过 Windows 版 Computer Use 在控制时用户无法操作,与 Mac 版不同。此外,更新还包括聊天记录管理(置顶、查找、归类、存档)、个人资料页面(显示 Token 消耗、连续登录天数、最长任务)、ChatGPT 上的 Codex 控制新增侧边对话(/side 命令)、一键模型切换、iPad 专属快捷方式以及 Git Diff 显示等功能。这些更新显著提升了 Codex 在 Windows 平台上的可用性和用户体验。AI产品CodexWindowsComputer UseChatGPT远程控制推荐理由:Windows 用户终于等到了 Codex 的 Computer Use 支持,做自动化脚本和远程控制的开发者可以直接在 Windows 上体验,建议试试侧边对话和 Git Diff 功能。原文
09:11berryxia@berryxia72°OpenAI 将 Codex 的 Computer Use 功能扩展至 Windows 平台,允许 AI agent 在真实 Windows 桌面上执行任务。用户可通过 ChatGPT 手机 App 远程启动、查看和指挥 Codex 操作电脑,实现跨设备协同。这一更新打破了此前 AI 电脑操作依赖 Mac 或云端的限制,对 Windows 主力用户意义重大。目前该功能处于早期体验阶段,但已展现出跨设备 agent 落地的潜力。AI产品OpenAICodexComputer UseWindows远程操控10 个信源在谈推荐理由:Windows 用户终于等来了 AI agent 直接操作桌面的能力,还能用手机远程指挥,做自动化办公或跨设备协作的团队值得一试。原文
04:04宝玉@dotey72°OpenAI 宣布 Codex 的 Computer Use 功能正式支持 Windows 系统,该功能允许 AI 像人类一样操作桌面应用,包括看屏幕、点鼠标和打字。此前该功能仅支持 macOS,此次更新扩大了适用范围。同时,Codex 在 ChatGPT 手机 App 中的远程控制功能也扩展至 Windows 主机,用户可以在手机上启动、监控和审批电脑上的任务。这意味着用户出门在外也能通过手机远程操控家里的 Windows 电脑完成工作,流程更加完整。AI产品CodexComputer UseWindows远程控制ChatGPT10 个信源在谈推荐理由:Windows 用户终于能用上 Codex 的桌面操作能力,远程控制功能让移动办公更灵活,做自动化或远程运维的开发者可以直接试试。原文
00:16向阳乔木@vista8Anthropic 发布了 Computer Use 的最佳实践指南,针对 API 调用中的常见问题给出优化建议。指南指出,高分辨率图片会被自动降采样导致坐标偏移,建议 Claude 4.6 系列使用 1280x720,Opus 4.7 使用 1080p。文本指令必须放在图片之前,以提升识别准确率。每张截图消耗约 1000-1800 token,200k 上下文易满。反常识发现:截图切块和坐标网格不提升精度;Low thinking 模式比不开更省 token;Max Thinking 性价比低,Medium 模式更优。AI产品Computer UseAnthropicAPI 优化最佳实践性价比10 个信源在谈推荐理由:做 Computer Use 自动化或 GUI 操作开发的团队,这篇指南能帮你省下大量调试时间和 API 费用,建议直接收藏原文对照实践。原文
13:23小互@imxiaohuOpenAI 正在推进 Codex 的远程控制能力,从手机控制自己的电脑扩展到控制任意电脑。5 月 14 日,ChatGPT 手机 App 已支持远程查看 Mac 上 Codex 的运行状态、审批命令、切换模型和派发新任务,但要求 Mac 必须保持唤醒和解锁状态。目前 OpenAI 正在开发让 Computer Use 在 Mac 锁屏或睡眠时也能继续操作的能力,这样用户无需解锁电脑即可远程执行开发任务。这一改进将大幅提升远程开发的便利性和实用性。AI产品Codex远程控制Computer UseChatGPTMac10 个信源在谈推荐理由:远程开发场景的痛点终于要被解决了——做 AI 编程或需要远程操控电脑的开发者,不用再为锁屏中断任务而烦恼,值得关注后续进展。原文