BrowserCode 在长期 Web 任务基准 Odysseys 上排名第一

BrowserCode is incredibly good at long-running tasks It orders pizza for us

精选理由

browser_use 的 BrowserCode 在 Odysseys 上排第一,能自动处理订披萨这种好几个小时的网页任务,比一般浏览器助手强多了。

AI 摘要

browser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流,涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力,例如自动订披萨。

AI 翻译 · 中文

browser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流,涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力,例如自动订披萨。

Browser UseBrowserCode is incredibly good at long-running tasks It orders pizza for us Your browser does not support the video tag. 🔗 View on Twitter Russ Salakhutdinov @rsalakhu Congrats to the @browser_use team for taking the #1