Anthropic Computer Use 最佳实践:分辨率、指令顺序与性价比

Anthropic 出了一篇Computer Use的最佳实践,总结学习下,评论区有原文。 1. 原图分辨率太高,超 API 限制时,系统自动降采样,会导致画面和代码坐标系不匹配,就会点偏。 Cl...

精选理由

做 Computer Use 自动化或 GUI 操作开发的团队,这篇指南能帮你省下大量调试时间和 API 费用,建议直接收藏原文对照实践。

AI 摘要

Anthropic 发布了 Computer Use 的最佳实践指南,针对 API 调用中的常见问题给出优化建议。指南指出,高分辨率图片会被自动降采样导致坐标偏移,建议 Claude 4.6 系列使用 1280x720,Opus 4.7 使用 1080p。文本指令必须放在图片之前,以提升识别准确率。每张截图消耗约 1000-1800 token,200k 上下文易满。反常识发现:截图切块和坐标网格不提升精度;Low thinking 模式比不开更省 token;Max Thinking 性价比低,Medium 模式更优。

AI 翻译 · 中文

Anthropic 发布了 Computer Use 的最佳实践指南,针对 API 调用中的常见问题给出优化建议。指南指出,高分辨率图片会被自动降采样导致坐标偏移,建议 Claude 4.6 系列使用 1280x720,Opus 4.7 使用 1080p。文本指令必须放在图片之前,以提升识别准确率。每张截图消耗约 1000-1800 token,200k 上下文易满。反常识发现:截图切块和坐标网格不提升精度;Low thinking 模式比不开更省 token;Max Thinking 性价比低,Medium 模式更优。

向阳乔木Anthropic 出了一篇Computer Use的最佳实践,总结学习下,评论区有原文。 1. 原图分辨率太高,超 API 限制时,系统自动降采样,会导致画面和代码坐标系不匹配,就会点偏。 Claude 4.6 系列上限:最长边 1568 像素,总像素 1.15 mp。 Claude Opus 4.7 上限:最长边 2576 像素,总像素 3.75 mp。 最佳实践:4.6 系列推荐默认 1280x720;Opus 4.7 推荐默认