全部 AI 动态 · AI 热点

6月27日

11:19

11:19IT之家（博客/媒体）

Anthropic 正在测试手机端 Claude Cowork，用户可通过手机发起并调整任务。Claude Cowork 是 2026 年 1 月 13 日发布的桌面智能体工作模式，代码几乎全部由 Claude 完成，开发周期仅一周半，初始仅向 Mac 端 Claude Max 订阅用户开放。2026 年 3 月 24 日，Anthropic 测试了 Computer Use 功能并推出 Dispatch 功能，允许手机向电脑端 Claude 发送指令。此次移动端测试将 Claude Cowork 定位为远程控制器，用于发起任务、调整方向和查看进度。

AI产品 Anthropic Claude Cowork 智能体 Computer Use Claude Max

推荐理由：Anthropic 正在给 Claude Cowork 加手机端，以后你能拿手机远程挂着任务让电脑端跑，还能随时调整进度，挺方便。

原文

6月26日

22:12

shao__meng@shao__meng

开发者@Zai_org为ZCode安装了开源Computer Use插件Cua，使Agent能通过CGEvent和Accessibility API直接操控macOS。它可截图、读取无障碍树、点击、打字，绕开了Apple Events权限限制。测试中Agent自己计算7×6=42，并打开Chrome导航到微博和X。这展示了GUI正从人机接口变成Agent可操作的界面。

AI产品 ZCode Cua Computer Use 智能体 GUI操作

推荐理由：ZCode装上Cua后，你的Agent就能直接点屏幕、开浏览器了，还能自己算数和发帖，非常酷。

原文

00:30

Google AI Developers@googleaidevs

精选73°

Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体，处理长时任务。新增特性包括：内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。

AI产品 Gemini 3.5 Flash Computer Use 智能体自动化测试 Google

推荐理由：Google 给 Gemini 3.5 Flash 加了 Computer Use 工具，能让智能体跨浏览器、手机和桌面干活，还能自定义安全策略，实用！

原文

6月25日

17:30

Decoder@Matthias Bastian

71°

Google 将“Computer Use”能力直接集成到 Gemini 3.5 Flash，使模型可自主操作电脑、浏览器和移动设备。在 OSWorld 基准测试中，Gemini 3.5 Flash 得分 78.4，与 GPT-5.5 成绩相当。开发者可利用 Gemini API 构建用于软件测试或办公自动化的智能体。

AI模型 Gemini 3.5 Flash Computer Use OSWorld 智能体自动化

推荐理由：Google 把屏幕操控塞进了 Gemini 3.5 Flash，OSWorld 得分和 GPT-5.5 差不多。开发者直接用 API 就能做自动化，很实在。

原文

13:54

13:54IT之家（博客/媒体）

精选

谷歌在 Chrome 149 浏览器中新增“Select from screen”功能，用户可通过光标选中屏幕上的图片或文字，直接与 Gemini 3.5 Flash 模型交互提问。该功能与 Google Lens 类似，但将屏幕内容送入对话式 AI 处理。此外，Gemini 3.5 Flash 模型原生引入 Computer Use 工具，使 AI 智能体能在网页、桌面、移动端执行访问网站、填写表单、点击按钮等任务。

AI产品 Chrome Gemini 3.5 Flash Computer Use AI交互智能体

推荐理由：现在你逛鞋店网站时，直接框选几双鞋问Gemini哪双适合你，省去复制粘贴的麻烦。

原文

6月24日

20:24

shao__meng@shao__meng

精选

用户shao__meng今天开始使用Zcode编程助手，搭配GLM-5.2模型，体验快速且好用。但与Codex相比，Zcode在Computer Use等全面能力上仍有差距。用户感谢SeTriones赞助GLM API Key，并认为Zcode的能力全面性有待提升。

AI产品 Codex Zcode GLM-5.2 编程助手 Computer Use

推荐理由：老TL分享了Zcode和Codex的对比体验，GLM-5.2模型真的快，但Zcode的Computer Use还比不上Codex。

原文

6月19日

09:26

Yangyi@Yangyixxxx

精选

OpenAI Codex 桌面端推出 Record & Replay 功能，用户可在 macOS 上演示重复性操作，Codex 自动生成可复用的 Skill 文件。生成的 Skill 包含触发条件、输入、步骤和验证方式，支持检查和编辑。重放时只需告诉 Codex 应用的 Skill 并传入新参数，Codex 结合 Computer Use、浏览器和已连 plugin 完成任务。目前仅限 macOS，欧盟暂不可用，使用前需开启 Computer Use。

AI产品 OpenAI Codex macOS Computer Use 自动化

推荐理由：OpenAI Codex 新功能让你在 Mac 上演示一遍操作，它就能自动记录并重复执行，以后填单、发视频这类固定流程再不用手写了。

原文

04:32

宝玉@dotey

精选73°

OpenAI Codex 桌面端新增 Record & Replay 功能，允许用户在 Mac 上录制一系列操作，Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS，欧盟地区不可用，使用前需开启 Computer Use。该功能旨在简化日常重复性任务，如报销填单、发布视频、创建 issue 等。录制完成后，用户可在新对话中调用 Skill 并传入不同参数，由 Codex 结合 Computer Use、浏览器和插件自动执行。

AI产品 OpenAI Codex Record & Replay Computer Use 自动化智能体

推荐理由：OpenAI Codex 这次不用你写指令了，Mac 上演示一遍操作就能生成可复用的 Skill，下次改改参数自动跑，报销填单之类的好用了。

原文

6月17日

10:31

shao__meng@shao__meng

精选73°

OpenAI Codex 提供三种操作电脑能力：@ Browser 是线程内隔离浏览器，适合本地开发与视觉调试，无登录态和扩展；@ Chrome 使用真实 Chrome 身份，支持多标签和已登录 SaaS，操作等同于用户本人；@ Computer 控制整个桌面 GUI，用于原生 App 和无 API 流程，速度最慢但覆盖面最广。此外，Appshots 仅提供当前窗口上下文，不赋予控制权。文章还给出了基于任务场景的选择决策框架和三个典型应用案例。

技巧 OpenAI Codex Computer Use Chrome Browser 教程

推荐理由：Codex 团队手把手教你区分三种控制模式：本地开发用 Browser，登录 SaaS 用 Chrome，原生应用用 Computer。还有决策框架，实测好用。

原文

08:16

宝玉@dotey

73°

Codex 的 Computer Use 模式像人一样操作任何桌面应用，但速度慢，Mac 可后台运行而 Windows 需占用前台，曾自动完成亚马逊退款流程。Chrome 扩展利用已登录浏览器会话，可操作 Gmail、LinkedIn 等需登录的工具，支持多标签页任务，但发送付款等操作建议人工确认。内置浏览器是隔离的沙盒环境，适合开发调试，支持直接标注元素让 Codex 修改代码。Jason 的建议：优先用结构化插件或 MCP，视觉控制是最后手段。

技巧 Codex Computer Use Chrome扩展内置浏览器编程助手

推荐理由：Jason 把三种操作方式拆得明明白白，哪个场景该用哪个直接照搬。尤其是内置浏览器的标注交互，做前端调试能省一多半来回截图的时间。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:22

向阳乔木@vista8

一位用户分享其践行AI First原则，即遇到任何任务先尝试用AI解决。具体案例是使用OpenAI的Codex模型及其Computer Use功能，自动填写Word合同。这展示了AI在办公自动化中的实际应用，尤其适合重复性文档处理场景。该实践降低了手动操作成本，值得关注AI办公效率的团队参考。

AI产品 AI First原则 Codex Computer Use 办公自动化 Word合同

推荐理由：AI First原则是当前高效工作法的核心，用Codex的Computer Use填合同解决了文档自动化的痛点，做行政、法务或日常办公的团队可以直接借鉴。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月30日

16:34

歸藏(guizang.ai)@op7418

Codex 昨晚发布了一系列体验更新，其中最受关注的是 Windows 版 Computer Use 功能的支持，以及通过移动端 ChatGPT 远程控制 Windows 上的 Codex。不过 Windows 版 Computer Use 在控制时用户无法操作，与 Mac 版不同。此外，更新还包括聊天记录管理（置顶、查找、归类、存档）、个人资料页面（显示 Token 消耗、连续登录天数、最长任务）、ChatGPT 上的 Codex 控制新增侧边对话（/side 命令）、一键模型切换、iPad 专属快捷方式以及 Git Diff 显示等功能。这些更新显著提升了 Codex 在 Windows 平台上的可用性和用户体验。

AI产品 Codex Windows Computer Use ChatGPT 远程控制

推荐理由：Windows 用户终于等到了 Codex 的 Computer Use 支持，做自动化脚本和远程控制的开发者可以直接在 Windows 上体验，建议试试侧边对话和 Git Diff 功能。

原文

09:11

berryxia@berryxia

72°

OpenAI 将 Codex 的 Computer Use 功能扩展至 Windows 平台，允许 AI agent 在真实 Windows 桌面上执行任务。用户可通过 ChatGPT 手机 App 远程启动、查看和指挥 Codex 操作电脑，实现跨设备协同。这一更新打破了此前 AI 电脑操作依赖 Mac 或云端的限制，对 Windows 主力用户意义重大。目前该功能处于早期体验阶段，但已展现出跨设备 agent 落地的潜力。

AI产品 OpenAI Codex Computer Use Windows 远程操控

推荐理由：Windows 用户终于等来了 AI agent 直接操作桌面的能力，还能用手机远程指挥，做自动化办公或跨设备协作的团队值得一试。

原文

04:04

宝玉@dotey

72°

OpenAI 宣布 Codex 的 Computer Use 功能正式支持 Windows 系统，该功能允许 AI 像人类一样操作桌面应用，包括看屏幕、点鼠标和打字。此前该功能仅支持 macOS，此次更新扩大了适用范围。同时，Codex 在 ChatGPT 手机 App 中的远程控制功能也扩展至 Windows 主机，用户可以在手机上启动、监控和审批电脑上的任务。这意味着用户出门在外也能通过手机远程操控家里的 Windows 电脑完成工作，流程更加完整。

AI产品 Codex Computer Use Windows 远程控制 ChatGPT

推荐理由：Windows 用户终于能用上 Codex 的桌面操作能力，远程控制功能让移动办公更灵活，做自动化或远程运维的开发者可以直接试试。

原文

5月29日

00:16

向阳乔木@vista8

Anthropic 发布了 Computer Use 的最佳实践指南，针对 API 调用中的常见问题给出优化建议。指南指出，高分辨率图片会被自动降采样导致坐标偏移，建议 Claude 4.6 系列使用 1280x720，Opus 4.7 使用 1080p。文本指令必须放在图片之前，以提升识别准确率。每张截图消耗约 1000-1800 token，200k 上下文易满。反常识发现：截图切块和坐标网格不提升精度；Low thinking 模式比不开更省 token；Max Thinking 性价比低，Medium 模式更优。

AI产品 Computer Use Anthropic API 优化最佳实践性价比

推荐理由：做 Computer Use 自动化或 GUI 操作开发的团队，这篇指南能帮你省下大量调试时间和 API 费用，建议直接收藏原文对照实践。

原文

5月17日

13:23

小互@imxiaohu

OpenAI 正在推进 Codex 的远程控制能力，从手机控制自己的电脑扩展到控制任意电脑。5 月 14 日，ChatGPT 手机 App 已支持远程查看 Mac 上 Codex 的运行状态、审批命令、切换模型和派发新任务，但要求 Mac 必须保持唤醒和解锁状态。目前 OpenAI 正在开发让 Computer Use 在 Mac 锁屏或睡眠时也能继续操作的能力，这样用户无需解锁电脑即可远程执行开发任务。这一改进将大幅提升远程开发的便利性和实用性。

AI产品 Codex 远程控制 Computer Use ChatGPT Mac

推荐理由：远程开发场景的痛点终于要被解决了——做 AI 编程或需要远程操控电脑的开发者，不用再为锁屏中断任务而烦恼，值得关注后续进展。

原文