近期,以 Perplexity 和微软为代表的科技公司加速推进计算机智能体(Computer Use)生态,将 AI 与桌面应用、浏览器和办公套件的深度集成推向新阶段。
Perplexity 推动 Computer 能力集成:Perplexity 公布其 Computer 功能已集成到 Microsoft Office 套件,用户可直接在 Excel、Word、PPT 和 Outlook 中调用 AI 完成数据操作、文档生成和邮件管理。同时,Claude Opus 4.8 上线 Perplexity Max,推荐在 Perplexity Computer 中使用,表明其将 AI 模型与桌面自动化场景深度绑定(Perplexity Computer 集成 MS Office,Claude Opus 4.8 上线 Perplexity)。Anthropic 也发布 Computer Use 最佳实践,强调分辨率、指令顺序和性价比对任务成功率的影响(Anthropic Computer Use 最佳实践)。
微软 Fara1.5 浏览器智能体模型发布:微软推出 Fara1.5 系列浏览器智能体,包含 4B、9B、27B 三个尺寸,在 Online-Mind2Web 基准上实现 72% 任务成功率,超越 OpenAI Operator 和 Gemini 2.5 Computer Use。该模型旨在让 AI 像人类一样操作浏览器,完成跨网站的任务流程(微软 Fara1.5 智能体发布)。
开发者工具与开源同步推进:Perplexity 还开源了 Bumblebee,一款只读供应链扫描器,面向 macOS/Linux 环境,嵌入企业安全流程。这表明在推动计算机自动化能力的同时,也注重安全与合规性(Perplexity 开源 Bumblebee)。此外,有开发者实测 2 个月后从 Claude Code 转向 Codex,强调闭环自测能力对编程任务的关键作用(AlexFinn 测试转向 Codex)。
当前焦点与未来观察:各方正在争夺计算机智能体的“入口”——从办公套件、浏览器到安全工具。关键挑战在于提升任务闭环成功率、降低延迟和成本,同时保证跨平台兼容性。未来值得关注:智能体如何从单体操作走向多步骤复杂任务,以及隐私与可控性如何平衡。