Gemini 3.5 Flash 新增计算机控制,能看并操作屏幕

Google bakes computer control directly into Gemini 3.5 Flash, letting the model see and operate your screen

精选理由

Google 把屏幕操控塞进了 Gemini 3.5 Flash,OSWorld 得分和 GPT-5.5 差不多。开发者直接用 API 就能做自动化,很实在。

AI 摘要

Google 将“Computer Use”能力直接集成到 Gemini 3.5 Flash,使模型可自主操作电脑、浏览器和移动设备。在 OSWorld 基准测试中,Gemini 3.5 Flash 得分 78.4,与 GPT-5.5 成绩相当。开发者可利用 Gemini API 构建用于软件测试或办公自动化的智能体。

AI 翻译 · 中文

Google 将“Computer Use”能力直接集成到 Gemini 3.5 Flash,使模型可自主操作电脑、浏览器和移动设备。在 OSWorld 基准测试中,Gemini 3.5 Flash 得分 78.4,与 GPT-5.5 成绩相当。开发者可利用 Gemini API 构建用于软件测试或办公自动化的智能体。

DecoderGoogle has integrated "Computer Use" directly into Gemini 3.5 Flash, letting the model operate computers, browsers, and mobile devices on its own. On the OSWorld benchmark, it scores 78.4, putting it on par with GPT-5.5.