全部 AI 动态 · AI 热点

6月26日

07:54

elvis@omarsar0

精选71°

Meta 的研究提出了 AutoData 框架，将 AI agent 作为数据科学家自动构建训练和评估数据。其实现 Agentic Self-Instruct 扩展了经典 Self-Instruct，增加了 agent 规划和工具使用。在计算机科学、法律推理和数学对象推理等任务上，AutoData 超越了传统合成数据方法。通过元优化训练数据生成 agent，还能获得更大性能提升。

AI模型 Meta AutoData Agentic Self-Instruct 合成数据 AI agent

推荐理由：Meta 搞了个 AutoData，让 AI agent 当数据科学家自动造训练数据，比自己写死的流水线强不少，在多个推理任务上效果更好。

原文

6月25日

01:30

Figma@figma

Figma 在 Config 2026 大会上发布了生成式插件功能。用户只需描述所需的行为、控件和参数，Figma agent 即可自动生成匹配工作流的插件。该功能降低了插件开发门槛，让设计师无需编码也能定制工具。这是 Figma 首次将 AI agent 直接集成到插件创建流程中。

AI产品 Figma Generative plugins Config 2026 AI agent 设计工具

推荐理由：Figma 让你用自然语言描述需求，AI 自动生成插件，省去写代码的麻烦。设计流程定制化从此更简单。

原文

6月19日

22:26

Cloudflare Blog@Brendan Irvine-Broque

Cloudflare 为 Workers 平台推出 Temporary Accounts 功能。AI 代理只需运行 wrangler deploy --temporary 命令，即可在数秒内获得一个可访问的 Worker 实例。该账户无需注册或配置，专为自动化部署设计。目前该功能已向所有用户开放。

AI产品 Cloudflare Workers 临时账户部署 AI agent

推荐理由：Cloudflare 给 AI 代理开了个快速通道，几秒就能部署一个 Worker，不用走注册流程，挺省事的。

原文

6月18日

10:55

arXiv cs.LG@Hannah Le, Ramesh Ramasamy, Alex Urrutia, Mahsa Yazdani, Tim Proctor, Kenny Workman

TxBench-PP是一个用于评估AI agent在小分子临床前药理学中决策能力的基准，包含100个涉及作用机制、药效学等任务的评估。在16个模型配置（涉及11个模型和4800条轨迹）中，最佳配置Claude Opus 4.8 / Pi仅通过59.3%（178/300）的端点尝试，GPT-5.5 / Pi通过55.3%。结果表明，当前AI系统无法可靠复现临床前药理学决策。

AI模型 TxBench-PP Claude Opus 4.8 GPT-5.5 AI agent 药物发现

推荐理由：想看看AI在药物发现中到底行不行？这个基准测试用4800条轨迹告诉你，Claude Opus 4.8和GPT-5.5都还差得远，最高才59.3%的通过率。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

02:55

腾讯混元 Tencent Hunyuan@TencentCloud

精选

腾讯云开源Cube Sandbox一个月后，推出快照、克隆、回滚三项核心功能。该工具通过微虚拟机隔离运行AI agent，可在健康状态创建检查点，让agent自由操作后回滚到之前状态。回滚时间低于100毫秒，克隆支持秒级生成数十个完全隔离的副本。同时发布的Lobster WebUI可将检查点时间线和克隆操作图形化。下一步将加入内容感知网络控制和凭据保险库。

AI产品 Cube Sandbox 腾讯云 AI agent 沙盒隔离回滚

推荐理由：腾讯云给AI agent加了时间倒流，Cube Sandbox现在能快照、克隆、回滚，100毫秒回滚到出事前，还能秒级克隆一堆独立沙盒，自己就能部署。

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

22:51

Viking@vikingmute

针对 Codex GUI 性能差、容易卡顿的问题，有开发者分享了一个 skills 工具，核心思路是检查占用空间，将超大不用的 thread 归档，把旧 worktrees 移到 archive，并归档过大的日志。该工具可配置为定时任务，由 AI agent 自动执行检查和清理。用户反馈使用后 Codex 不再卡顿，保持可用状态。这个方案解决了 Codex 用户长期以来的性能痛点。

AI产品 Codex 性能优化自动清理 skills AI agent

推荐理由：Codex 重度用户被卡顿折磨的，这个 skills 能自动清理无用数据让 GUI 恢复流畅，值得一试。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月30日

00:43

Jerry Liu@jerryjliu0

精选

LlamaIndex推出LiteParse v2，声称这是全球最快的PDF解析器，速度比pymupdf、pypdf等开源方案更快，准确度也更高。团队将整个库用Rust重写，并适配为Python和Node的原生包。LiteParse v2支持50多种文档类型，可直接在AI agent中触发或安装使用。项目已在GitHub开源，博客文章介绍了详细用法。

AI产品 LiteParse LlamaIndex PDF解析 Rust AI agent

推荐理由：PDF解析比pymupdf快一倍，还支持50种文档

原文

5月29日

08:36

berryxia@berryxia

精选

Firecrawl 新推出 /monitor 功能，允许用户用自然语言描述监控目标（如“当有 ADHD 最新论文时提醒”），自动检测网页实质变化并通过 webhook 推送。相比传统全量抓取，它只摄取变动部分，最多节省 90% 的 LLM token。支持 API、CLI、MCP 或 dashboard 初始化，调度频率从 5 分钟到自定义。该功能解决了 AI agent 在监控任务中 token 浪费和噪声干扰的痛点，让 agent 专注于决策和执行。

AI产品 AI agent 网页监控 Firecrawl token节省 webhook

推荐理由：做生物或科研监控的 AI agent 开发者终于不用再为全量抓取烧 token 了——Firecrawl 的 /monitor 用自然语言定义目标，只抓变化部分，省 90% 成本，建议做信息聚合的团队直接集成。

原文

5月27日

23:26

berryxia@berryxia

Warp 终端推出 Cloud Handoff 功能，合上笔记本后 AI agent 对话自动无缝切换到云端，上下文完整保留，任务不中断。用户只需在设置中开启 Agents -> Warp Agent -> Cloud Handoff 即可。这解决了以往 agent 必须依赖本地持续运行或手动迁移的痛点，让 agentic workflow 真正成为随时可用的工具。

AI产品 Warp AI agent 云端切换终端自动化

推荐理由：Warp 这次更新解决了 AI agent 实用化的关键痛点——人离开电脑后任务还能继续。做自动化开发或依赖 agent 跑长任务的团队，可以直接开启 Cloud Handoff，体验真正的连续性生产力。

原文

5月26日

10:29

AI Will@FinanceYF5

93°

Google DeepMind 发布 AlphaProof Nexus，一个基于 Gemini 的 agentic 框架，用于形式化数学证明搜索。该 AI agent 自主解决了 9 个 Erdős 问题（其中两个已开放 56 年）、44 个 OEIS 问题、一个 15 年未解的代数几何问题和一个 7 年未解的 min-max 优化问题。整个推理成本仅几百美元，标志着 AI 从做练习题转向真正的数学研究。

AI模型 AI agent 数学证明 DeepMind Gemini 形式化验证

推荐理由：AI 用几百美元成本解决了人类数学家 56 年未解的问题，做数学研究或形式化验证的团队值得关注——这可能是数学研究自动化的转折点。

原文

10:28

AI Will@FinanceYF5

83°

Google DeepMind发布AlphaProof Nexus论文，展示了一个AI agent在353个开放数学问题中自主解决了9个Erdős难题，其中包括两个56年未解的问题，并证明了44个OEIS猜想。每道题的推理成本仅数百美元，标志着AI在数学推理领域取得了重大突破。这项工作展示了AI agent在解决长期悬而未决的数学难题方面的潜力，为数学研究提供了新的工具和方法。

AI模型数学推理 AI agent DeepMind Erdős难题 OEIS猜想

推荐理由：数学研究者和AI爱好者值得关注：AlphaProof Nexus以极低成本自主攻克了56年未解的难题，展示了AI在数学推理上的新高度，建议点开了解具体方法和成果。

原文

5月20日

08:20

berryxia@berryxia

NVIDIA CEO Jensen Huang 在演讲中指出，每个工程师未来都要管理和使用几百个AI agent，这并非未来时，而是现在进行时。普通人使用Claude只发挥了其10%的能力，真正的高手将Claude当作操作系统，通过建立工作流、链式输出、掌控上下文，让AI按照自己的思考方式工作。同一份订阅，同一款模型，使用方式不同导致结果天差地别。

行业 AI agent Claude 工作流 NVIDIA 工程师

推荐理由：Jensen Huang 这句话点醒了无数AI使用者——别再只把Claude当问答工具，做AI工作流的开发者/工程师可以直接用它重构效率，看完你会重新认识Claude。

原文

5月16日

22:46

AI Will@FinanceYF5

QVeris 推出 CLI 工具，将蜡烛图、RSI、布林带、公司基本面等金融数据和技术指标接入 Claude Code。用户无需编写复杂脚本，即可通过自然语言让 AI agent 调用这些工具进行金融分析。这降低了金融分析的技术门槛，可能成为 AI 投研栈的基础组件。该工具可在 60 秒内完成配置，直接通过 Claude Code 调用。

AI产品金融分析 Claude Code QVeris CLI 技术指标 AI agent

推荐理由：做量化分析或投研的团队，不用再写爬虫和计算脚本——QVeris CLI 让 Claude Code 直接调用蜡烛图、RSI、基本面等数据，60 秒配好就能用自然语言跑分析，值得试试。

原文

5月14日

09:25

berryxia@berryxia

NotionDevs 发布了一个 25 秒演示视频，展示了全新的 ntn CLI 工具。用户只需一行 curl 命令即可安装，并在终端中拥有完整的 Notion API 能力，包括登录工作区、新建 worker、查询数据库、用 Markdown 创建页面等。更重要的是，该 CLI 支持直接为 AI agents 添加 Notion skill，让它们在终端中顺滑操作整个工作空间。这标志着 Notion 正从笔记工具演变为 AI agent 的操作系统，代码可以直接在 Notion 中运行、测试和部署。

AI产品 Notion CLI AI agent 自动化 API

推荐理由：Notion 的 ntn CLI 让 AI agent 深度集成 Notion 变得极其简单，做自动化工作流或智能体开发的团队可以直接用一行命令让 agent 操作整个工作空间，省去大量折腾时间。

原文