全部 AI 动态 · AI 热点

6月20日

05:55

05:55

Browser Use@browser_use

GLM 5.2 在 BrowserCode 基准上达到接近 Opus 级别分数，单次任务成本仅 0.18 美元。Minimax M3 取得 Sonnet 级别分数，输入价格 0.30 美元，比 DeepSeek V4 Pro 更便宜。Kimi k2.7 相比 k2.6 提升 9%，但被 M3 超越。这些开源权重模型首次在浏览器智能体任务中追平甚至超过 GPT 5.5 等闭源模型。

AI模型 GLM 5.2 Minimax M3 Kimi k2.7 BrowserCode 智能体

推荐理由：智谱发了 GLM 5.2，Benchmark 接近 Opus，成本才一毛八，还有更便宜的 M3 和升级的 Kimi 2.7，做浏览器智能体有得选了。

05:54

05:54

Browser Use@browser_use

精选

GLM 5.2 模型现已可在 BrowserCode 中直接运行，BrowserCode 是一个开源的浏览器代理框架（GitHub 仓库 browser-use/browser-code）。用户可通过该框架在真实浏览器环境中调用 GLM 5.2 完成网页操控任务。目前该功能已上线，开发者可试用。

AI产品 GLM 5.2 BrowserCode 浏览器自动化智能体

推荐理由：想用 GLM 5.2 做浏览器自动化？现在 BrowserCode 可以直接跑，省去自己搭环境的麻烦。

6月17日

09:40

09:40

Browser Use@browser_use

browser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流，涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力，例如自动订披萨。

AI模型 BrowserCode browser_use Odysseys 智能体

推荐理由：browser_use 的 BrowserCode 在 Odysseys 上排第一，能自动处理订披萨这种好几个小时的网页任务，比一般浏览器助手强多了。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？