精选理由
想让你那个傻傻的屏幕操作AI学会重复干活不重来?PreAct把第一次成功步骤变成程序,后面直接快10倍,还不容易翻车。
PreAct 是一种让计算机使用代理(如屏幕点击、打字)在重复任务上更快的新方法。首次成功时,PreAct 将运行编译为小状态机程序,后续重放直接执行,无需逐步骤调用语言模型,速度提升8.5-13倍。重放时每步检查屏幕状态,若不一致则交回代理处理。在移动、桌面和Web基准上,存储时检查机制确保编译程序可靠,避免错误积累,平均多完成1.75-2.6个任务。
AI 翻译 · 中文
PreAct 是一种让计算机使用代理(如屏幕点击、打字)在重复任务上更快的新方法。首次成功时,PreAct 将运行编译为小状态机程序,后续重放直接执行,无需逐步骤调用语言模型,速度提升8.5-13倍。重放时每步检查屏幕状态,若不一致则交回代理处理。在移动、桌面和Web基准上,存储时检查机制确保编译程序可靠,避免错误积累,平均多完成1.75-2.6个任务。
Computer-using agents drive real software through the screen -- clicking and typing -- but they solve every task from scratch: asked to repeat a task, an agent re-reads the screen, re-reasons every tap, and pays the full…