全部 AI 动态 · AI 热点

AITOP

6月29日

13:58

Ate-a-Pi@svpino

这个开源项目允许你录制浏览器操作，系统会自动清理录制内容，移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击，将其转化为可复用的技能。最后这些技能被组织成技能图谱，智能体可检索用于相关新任务。整个过程完全开源。

技巧开源浏览器自动化智能体技能图谱工作流

推荐理由：有个开源项目能录制你在浏览器里做的事，自动变成可复用的技能，还能让智能体直接调用，省去重复劳动。

原文

6月26日

21:12

Browser Use@browser_use

Browser Use v4 推出了 QA 技能，允许 AI 代理自动测试网页应用。用户提供 URL 后，可执行流程测试、捕获 bug、模拟用户点击并判断 UI。代理会根据反馈进行修复，形成闭环。该功能在真实页面（如 Twitter）上演示，相关推文获 2508 次浏览。

AI产品 Browser Use QA v4 浏览器自动化智能测试

推荐理由：Browser Use v4 新出的 QA 技能，给个网址就能让 AI 自动测流程、抓 bug 并修复，省人工。

原文

6月20日

05:54

Browser Use@browser_use

精选

GLM 5.2 模型现已可在 BrowserCode 中直接运行，BrowserCode 是一个开源的浏览器代理框架（GitHub 仓库 browser-use/browser-code）。用户可通过该框架在真实浏览器环境中调用 GLM 5.2 完成网页操控任务。目前该功能已上线，开发者可试用。

AI产品 GLM 5.2 BrowserCode 浏览器自动化智能体

推荐理由：想用 GLM 5.2 做浏览器自动化？现在 BrowserCode 可以直接跑，省去自己搭环境的麻烦。

原文

6月19日

16:26

berryxia@berryxia

精选

Browser Use开源了一个浏览器agent模板B，基于Vercel的Eve构建。该模板让任何agent都能使用真实云端浏览器，并通过browser-harness实时查看操作过程。它支持初始化skills和MCPs，可直接从GitHub克隆使用。相比模拟环境或黑箱运行，模板B实现了每一步可视化、可调试，将browser automation推向更实用阶段。

AI产品 Browser Use 智能体浏览器自动化 MCP/工具开源项目

推荐理由：Browser Use直接开源了模板B，让你的Agent能连上真实云浏览器，还能实时看到它操作页面。调试方便多了，GitHub上就能clone。

原文

6月17日

10:00

Browser Use@browser_use

browser_use 展示了其 v4 智能体在 powerline.io 游戏中的自主操作能力。Agent 分析了游戏状态和目标，并创建了一个子代理进行实时反应。目标是取得第一名，演示了智能体在动态环境中的决策与执行能力。

AI产品 browser_use v4 agent powerline.io 智能体浏览器自动化

推荐理由：browser_use 的 v4 智能体能自己玩在线游戏，分析局势、派子代理实时操作，看它能不能拿第一。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月14日

11:53

Browser Use@browser_use

Browser Use 宣布其插件已可在 Claude Code 中使用。用户可通过命令 `claude plugin marketplace add browser-use/plugins` 安装。该插件旨在增强 Claude Code 的浏览器自动化能力。该消息在 X 平台发布，获得 11 个点赞和 575 次查看。

AI产品 Browser Use Claude Code 插件浏览器自动化

推荐理由：Claude Code 能控制浏览器了

原文

6月13日

13:07

Browser Use@browser_use

Browser Use 推出 0.13.0 测试版，专为 SOTA 模型设计，支持长时间运行任务。新版本包含自定义 LLM 和浏览器 harness，基于 Rust 构建。新增 Browser Use Terminal 功能，一条命令即可启动。旧版基于 GPT-4，新版面向更先进的模型。

AI产品 Browser Use GPT-4 SOTA模型 Rust 浏览器自动化

推荐理由：让 AI 替你跑长任务，一条命令搞定

原文

6月12日

13:49

@OpenAIDevs@OpenAIDevs

OpenAI 在开发者平台推出了 Codex 的浏览器自动化功能，允许开发者通过自然语言指令控制浏览器执行任务。该功能基于 Codex 模型，能够理解用户意图并自动操作网页，例如填写表单、点击按钮、提取数据等。这为自动化测试、数据采集和工作流简化提供了新工具，开发者可以直接在 OpenAI 平台上体验。

AI产品 OpenAI Codex 浏览器自动化开发者工具自然语言控制

推荐理由：做自动化测试或数据采集的开发者终于有了更智能的浏览器控制方案——用自然语言就能驱动浏览器，比传统脚本灵活太多，建议直接上手试试。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

08:04

Browser Use@browser_use

精选76°

Browser Use 发布了 0.13.0 beta 版本，该版本用 Rust 从头重写了架构。旧版是为 GPT-4 设计的，而新版针对当前最先进的模型进行了优化。新架构包括自定义 LLM 和浏览器 harness、直接 CDP 控制、完整的浏览器动作空间以及自我故障恢复能力。核心变化是让模型拥有完整的浏览器控制权，而不是预定义的动作空间，从而大幅提升任务完成可靠性。

AI产品 Browser Use Rust 浏览器自动化 AI代理开源/仓库

推荐理由：Browser Use 用 Rust 重写后，解决了旧版预定义动作空间导致模型失败不知原因的痛点，做浏览器自动化或 AI 代理的开发者可以直接升级体验更可靠的执行。

原文

04:41

kimi_moonshot@kimi_moonshot

78°

Kimi Work 是一款桌面端本地 AI 智能体，支持最多 300 个 AI 代理并行运行。它通过 WebBridge 扩展可操控浏览器完成搜索、点击等任务，内置金融数据工具（Yahoo Finance、世界银行），无需复杂 API 配置。还具备记忆系统，能记录用户偏好和上下文，提升个性化体验。目前支持 macOS（Apple Silicon）和 Windows，可直接下载试用。

AI产品智能体本地部署金融工具浏览器自动化 Kimi

推荐理由：本地运行 300 个 AI 代理并行工作，解决了云端依赖和效率瓶颈，做自动化办公或金融分析的团队可以直接上手试试。

原文

6月6日

05:43

Browser Use@browser_use

browser_use 正在测试新的云浏览器接口 browser-wall，该接口允许一个 CDP URL 控制所有云浏览器，并在不到一秒内启动多个浏览器。所有浏览器都预加载了配置文件和代理，以绕过身份验证和反机器人机制。该工具旨在简化多浏览器自动化任务，如并行测试、数据采集等。目前正在测试阶段，邀请用户分享使用场景。

AI产品浏览器自动化云浏览器 browser_use CDP 代理

推荐理由：做浏览器自动化或爬虫的开发者可以关注，一个接口控制多个浏览器能大幅提升效率，建议试试这个新工具。

原文

6月2日

10:58

阿里通义 Qwen@Alibaba_Qwen

阿里巴巴 Qwen 团队在 Twitter 上发布了第三个演示 Demo3，展示其 Browser Agent 能力。该 Agent 能够自主操作浏览器，执行网页任务。视频演示了 Agent 如何理解用户指令并完成浏览器交互。这一进展表明 Qwen 在智能体领域持续推进，为自动化浏览器操作提供了新方案。目前该推文获得 32 个点赞和 8174 次查看。

AI产品 Qwen Browser Agent 智能体浏览器自动化演示

推荐理由：做浏览器自动化和智能体开发的团队值得关注——Qwen 的 Browser Agent 展示了端到端操作能力，可以直接参考其实现思路。

原文

10:04

Browser Use@browser_use

Minimax M3 模型在 BU Bench 基准测试中取得了显著进步，相比之前版本提升了 26%。该测试使用 browsercode 方法评估模型在浏览器自动化任务上的表现。目前 M3 的性能已与 Claude 4.6-sonnet 和 Gemini 3.5 flash 等主流模型持平。这一结果表明 Minimax 在浏览器智能体领域取得了重要突破，为未来进一步优化奠定了基础。

AI模型 Minimax M3 BU Bench 浏览器自动化智能体模型评测

推荐理由：做浏览器自动化或智能体开发的团队值得关注——Minimax M3 用 26% 的提升证明自己已跻身第一梯队，可以直接拿来对比测试。

原文

5月29日

18:16

Browser Use@browser_use

Browser Harness 推出新功能，支持 Claude Code 通过 Opus 4.8 模型直接操控浏览器。用户只需一条命令即可安装并开始自动化任何网站。该工具简化了浏览器自动化流程，降低了使用门槛，适合需要网页自动化的开发者和团队。

AI产品浏览器自动化 Claude Code Opus 4.8 工具自动化

推荐理由：做网页自动化的开发者终于有了更简单的方案——一条命令就能让 Claude Code 操控浏览器，建议试试看。

原文

18:15

Browser Use@browser_use

Browser Use 推出了 Terminal 版本，让用户可以直接从命令行运行浏览器自动化任务。该工具支持 CLI 操作、连接 Codex 认证，并能控制真实的 Chrome 浏览器。用户可以通过简单的命令让浏览器自动执行购物等复杂操作，无需编写代码或手动操作。这为开发者提供了一种更高效、更灵活的浏览器自动化方式，尤其适合需要批量处理网页任务的场景。

AI产品浏览器自动化 CLI工具智能体 Chrome控制开发者工具

推荐理由：做自动化脚本或需要批量处理网页任务的开发者，现在可以直接在终端里控制浏览器，省去写复杂代码的麻烦，值得一试。

原文

09:18

shao__meng@shao__meng

83°

Anthropic 在宣布 H 轮 650 亿美金融资当天，发布了 Claude Opus 4.8。该模型在编码、Agent 任务和知识工作方面显著提升，SWE-Bench Pro 达到 69.2%，Terminal-Bench 2.1 为 74.6%。关键改进包括更诚实的自我监控（误判减少 4 倍）、更稳定的 Agent 协作质量，以及计算机/浏览器 Agent 能力提升（OSWorld-Verified 83.4%）。同时引入 Claude Code Dynamic Workflows，支持从单 Agent 到规划、并行、验证的协作模式。定价不变，即日可用。

AI模型 Claude Opus 4.8 推理模型 Agent/智能体编程助手浏览器自动化

推荐理由：做复杂编码、Agent 和浏览器自动化的团队可以直接升级——Opus 4.8 在诚实度和任务完成率上都有实质提升，且价格不变，值得立即试用。

原文

5月27日

10:02

shao__meng@shao__meng

76°

微软开源了 Webwright，一个终端原生的 Web Agent 框架，核心设计是“代码即动作”——让 LLM 直接编写 Playwright 脚本，将网页操作转化为可运行的 Python 程序。该框架在 Online-Mind2Web 和 Odysseys 基准测试中达到 SOTA 水平，架构极简，仅约 1000 行代码，无隐藏编排层。Webwright 已集成 Claude Code 和 OpenAI Codex 插件，支持任务完成后自动渲染为 HTML 应用（Task2UI 模式）。其脚本可复用、可审计，适合需要稳定浏览器自动化的开发者和团队。

AI产品 Web Agent 浏览器自动化 Playwright 开源/仓库微软

推荐理由：Webwright 用代码即动作的思路解决了传统 Web Agent 每次依赖 LLM 判断的低效问题，做浏览器自动化或 RPA 的开发者可以直接用 Playwright 脚本复用成果，值得一试。

原文

5月24日

23:34

Geek@geekbb

78°

Browser-use 团队推出了一款基于 Rust 编写的终端 TUI 工具，用户只需用自然语言描述任务，工具即可自动控制浏览器完成操作。该工具自研了 LLM 引擎，并利用 Chrome 的 CDP 协议实现浏览器控制。支持三种运行模式：使用用户登录态的 Chrome、无头浏览器或 Browser Use 云端。这一工具大幅降低了浏览器自动化的门槛，让非技术人员也能通过简单指令完成网页操作。

AI产品 Browser-use Rust TUI 浏览器自动化自然语言控制

推荐理由：做网页自动化或 RPA 的开发者终于有了一个自然语言驱动的终端工具，不用写脚本就能控制浏览器，值得直接上手试试。

原文

5月23日

07:06

Browser Use@browser_use

Browser Use 团队发布了用 Rust 编写的终端 UI 和浏览器自动化工具 Browser Use Terminal。它直接通过 Chrome DevTools Protocol 控制浏览器，支持 GPT、Claude、Kimi、GLM、Qwen、DeepSeek 等多种 LLM。相比原 Browser Harness，速度提升 2 倍、成本降低一半，且完全开源。用户可以在终端中实时观察、暂停、恢复自动化任务，适合处理繁琐的网页操作。

AI产品浏览器自动化 Rust TUI 开源/仓库 LLM

推荐理由：如果你经常在浏览器里做重复性操作（填表、爬数据、管理权限），这个 Rust 写的 TUI 工具比同类方案快 2 倍还便宜一半，而且支持多种主流 LLM，值得直接上手试试。

原文

5月22日

07:27

Browser Use@browser_use

Browser Use 团队宣布正在开发全新的浏览器基础设施，旨在提升代理、爬虫和自动化任务的运行性能与成本效益。新基础设施包括 Chromium 分支、Firecracker 分支、自定义内核以及无头模式，目标是实现更快的速度和更好的性价比。团队表示，这些改进将很快惠及用户，并发布了性能对比图表。

AI产品浏览器自动化基础设施性能优化 Chromium Firecracker

推荐理由：做浏览器自动化、爬虫或 AI 代理的开发者，这次基础设施升级直接关系到你的任务速度和成本，值得关注即将到来的变化。

原文

5月21日

12:41

Browser Use@browser_use

Browser Skills 是一个开放的浏览器技能目录，旨在为所有 AI 智能体提供快速使用任意网站的能力。该目录支持社区贡献，技能会随着更多人参与而不断改进。用户可以通过 browser-harness 添加自己的技能，只需一个提示即可设置。该项目解决了智能体在浏览器中高效操作网站的痛点，让开发者可以复用和共享最佳实践。目前已在 X 上发布，获得初步关注。

AI产品智能体浏览器自动化开源/仓库社区贡献 Browser Skills

推荐理由：做 AI 智能体或自动化工具的开发者终于有了一个共享浏览器技能的开放目录，不用重复造轮子，直接调用社区优化的技能就能快速上手，值得一试。

原文

09:29

shao__meng@shao__meng

83°

Chrome DevTools for Agents 1.0 正式发布，为 AI Agent 提供在真实浏览器中观察行为、检查输出的能力。它支持 MCP server、CLI 和 Agent skills 三种接入方式，并开放了七个核心能力，包括自动化质量审计、真实用户环境模拟、Chrome 扩展调试、WebMCP 工具调试、内存泄漏检测、会话接管以及第三方工具状态暴露。该工具让 Agent 能“看见浏览器”，显著降低集成门槛，提升调试效率。对于开发 AI Agent 或需要自动化浏览器操作的团队，这是一个重要的基础设施更新。

AI产品 Chrome DevTools AI Agent MCP/工具浏览器自动化调试工具

推荐理由：做 Agent 开发或浏览器自动化的团队终于有了官方调试工具——Chrome DevTools 直接开放给 Agent，省去自己造轮子的麻烦，建议直接接入试试。

原文

5月12日

17:19

歸藏(guizang.ai)@op7418

AI编程助手Codex昨日更新，新增内置的谷歌浏览器插件，使其能够直接控制用户的Chrome或任何基于Chromium的浏览器执行任务。该插件支持后台跨浏览器页面并行工作，用户可以同时启动多个子Agent操作不同网页，且不影响正常浏览器使用。安装过程简单，只需在Codex插件库中找到Chrome插件并按照引导安装即可。该功能已在Mac和Windows上可用，极大提升了自动化任务处理的灵活性和效率。

AI产品 Codex 浏览器自动化并行任务 Chrome插件 AI编程助手

推荐理由：对于AI编程和自动化领域从业者，这一更新意味着Codex从代码辅助扩展到了浏览器自动化，增强了其在网页交互型任务中的应用潜力，值得关注其后续对工作流集成的影响。

原文