Anthropic Computer Use 最佳实践：分辨率、指令顺序与性价比

精选理由

做 Computer Use 自动化或 GUI 操作开发的团队，这篇指南能帮你省下大量调试时间和 API 费用，建议直接收藏原文对照实践。

AI 摘要

Anthropic 发布了 Computer Use 的最佳实践指南，针对 API 调用中的常见问题给出优化建议。指南指出，高分辨率图片会被自动降采样导致坐标偏移，建议 Claude 4.6 系列使用 1280x720，Opus 4.7 使用 1080p。文本指令必须放在图片之前，以提升识别准确率。每张截图消耗约 1000-1800 token，200k 上下文易满。反常识发现：截图切块和坐标网格不提升精度；Low thinking 模式比不开更省 token；Max Thinking 性价比低，Medium 模式更优。

AI 翻译 · 中文

向阳乔木Anthropic 出了一篇Computer Use的最佳实践，总结学习下，评论区有原文。 1. 原图分辨率太高，超 API 限制时，系统自动降采样，会导致画面和代码坐标系不匹配，就会点偏。 Claude 4.6 系列上限：最长边 1568 像素，总像素 1.15 mp。 Claude Opus 4.7 上限：最长边 2576 像素，总像素 3.75 mp。最佳实践：4.6 系列推荐默认 1280x720；Opus 4.7 推荐默认 …

Perplexity05-28 17:24原文
Claude05-28 16:57原文
Lovable05-28 17:03原文
Mike Krieger05-28 17:10原文
Cognition05-28 17:26原文
GitHub05-28 17:27原文
Genspark05-28 17:28原文
宝玉05-28 17:30原文
marktechpost05-28 22:12原文
Simon Willison’s Weblog05-28 23:54原文

查看原推