07:54elvis@omarsar0精选71°Meta 的研究提出了 AutoData 框架,将 AI agent 作为数据科学家自动构建训练和评估数据。其实现 Agentic Self-Instruct 扩展了经典 Self-Instruct,增加了 agent 规划和工具使用。在计算机科学、法律推理和数学对象推理等任务上,AutoData 超越了传统合成数据方法。通过元优化训练数据生成 agent,还能获得更大性能提升。AI模型MetaAutoDataAgentic Self-Instruct合成数据AI agent1 个信源在谈推荐理由:Meta 搞了个 AutoData,让 AI agent 当数据科学家自动造训练数据,比自己写死的流水线强不少,在多个推理任务上效果更好。原文
01:30Figma@figmaFigma 在 Config 2026 大会上发布了生成式插件功能。用户只需描述所需的行为、控件和参数,Figma agent 即可自动生成匹配工作流的插件。该功能降低了插件开发门槛,让设计师无需编码也能定制工具。这是 Figma 首次将 AI agent 直接集成到插件创建流程中。AI产品FigmaGenerative pluginsConfig 2026AI agent设计工具5 个信源在谈推荐理由:Figma 让你用自然语言描述需求,AI 自动生成插件,省去写代码的麻烦。设计流程定制化从此更简单。原文
22:26Cloudflare Blog@Brendan Irvine-BroqueCloudflare 为 Workers 平台推出 Temporary Accounts 功能。AI 代理只需运行 wrangler deploy --temporary 命令,即可在数秒内获得一个可访问的 Worker 实例。该账户无需注册或配置,专为自动化部署设计。目前该功能已向所有用户开放。AI产品CloudflareWorkers临时账户部署AI agent推荐理由:Cloudflare 给 AI 代理开了个快速通道,几秒就能部署一个 Worker,不用走注册流程,挺省事的。原文
10:55arXiv cs.LG@Hannah Le, Ramesh Ramasamy, Alex Urrutia, Mahsa Yazdani, Tim Proctor, Kenny WorkmanTxBench-PP是一个用于评估AI agent在小分子临床前药理学中决策能力的基准,包含100个涉及作用机制、药效学等任务的评估。在16个模型配置(涉及11个模型和4800条轨迹)中,最佳配置Claude Opus 4.8 / Pi仅通过59.3%(178/300)的端点尝试,GPT-5.5 / Pi通过55.3%。结果表明,当前AI系统无法可靠复现临床前药理学决策。AI模型TxBench-PPClaude Opus 4.8GPT-5.5AI agent药物发现1 个信源在谈推荐理由:想看看AI在药物发现中到底行不行?这个基准测试用4800条轨迹告诉你,Claude Opus 4.8和GPT-5.5都还差得远,最高才59.3%的通过率。原文
02:55腾讯混元 Tencent Hunyuan@TencentCloud精选腾讯云开源Cube Sandbox一个月后,推出快照、克隆、回滚三项核心功能。该工具通过微虚拟机隔离运行AI agent,可在健康状态创建检查点,让agent自由操作后回滚到之前状态。回滚时间低于100毫秒,克隆支持秒级生成数十个完全隔离的副本。同时发布的Lobster WebUI可将检查点时间线和克隆操作图形化。下一步将加入内容感知网络控制和凭据保险库。AI产品Cube Sandbox腾讯云AI agent沙盒隔离回滚推荐理由:腾讯云给AI agent加了时间倒流,Cube Sandbox现在能快照、克隆、回滚,100毫秒回滚到出事前,还能秒级克隆一堆独立沙盒,自己就能部署。原文
22:51Viking@vikingmute针对 Codex GUI 性能差、容易卡顿的问题,有开发者分享了一个 skills 工具,核心思路是检查占用空间,将超大不用的 thread 归档,把旧 worktrees 移到 archive,并归档过大的日志。该工具可配置为定时任务,由 AI agent 自动执行检查和清理。用户反馈使用后 Codex 不再卡顿,保持可用状态。这个方案解决了 Codex 用户长期以来的性能痛点。AI产品Codex性能优化自动清理skillsAI agent推荐理由:Codex 重度用户被卡顿折磨的,这个 skills 能自动清理无用数据让 GUI 恢复流畅,值得一试。原文
00:43Jerry Liu@jerryjliu0精选LlamaIndex推出LiteParse v2,声称这是全球最快的PDF解析器,速度比pymupdf、pypdf等开源方案更快,准确度也更高。团队将整个库用Rust重写,并适配为Python和Node的原生包。LiteParse v2支持50多种文档类型,可直接在AI agent中触发或安装使用。项目已在GitHub开源,博客文章介绍了详细用法。AI产品LiteParseLlamaIndexPDF解析RustAI agent4 个信源在谈推荐理由:PDF解析比pymupdf快一倍,还支持50种文档原文
08:36berryxia@berryxia精选Firecrawl 新推出 /monitor 功能,允许用户用自然语言描述监控目标(如“当有 ADHD 最新论文时提醒”),自动检测网页实质变化并通过 webhook 推送。相比传统全量抓取,它只摄取变动部分,最多节省 90% 的 LLM token。支持 API、CLI、MCP 或 dashboard 初始化,调度频率从 5 分钟到自定义。该功能解决了 AI agent 在监控任务中 token 浪费和噪声干扰的痛点,让 agent 专注于决策和执行。AI产品AI agent网页监控Firecrawltoken节省webhook推荐理由:做生物或科研监控的 AI agent 开发者终于不用再为全量抓取烧 token 了——Firecrawl 的 /monitor 用自然语言定义目标,只抓变化部分,省 90% 成本,建议做信息聚合的团队直接集成。原文
23:26berryxia@berryxiaWarp 终端推出 Cloud Handoff 功能,合上笔记本后 AI agent 对话自动无缝切换到云端,上下文完整保留,任务不中断。用户只需在设置中开启 Agents -> Warp Agent -> Cloud Handoff 即可。这解决了以往 agent 必须依赖本地持续运行或手动迁移的痛点,让 agentic workflow 真正成为随时可用的工具。AI产品WarpAI agent云端切换终端自动化推荐理由:Warp 这次更新解决了 AI agent 实用化的关键痛点——人离开电脑后任务还能继续。做自动化开发或依赖 agent 跑长任务的团队,可以直接开启 Cloud Handoff,体验真正的连续性生产力。原文
10:29AI Will@FinanceYF593°Google DeepMind 发布 AlphaProof Nexus,一个基于 Gemini 的 agentic 框架,用于形式化数学证明搜索。该 AI agent 自主解决了 9 个 Erdős 问题(其中两个已开放 56 年)、44 个 OEIS 问题、一个 15 年未解的代数几何问题和一个 7 年未解的 min-max 优化问题。整个推理成本仅几百美元,标志着 AI 从做练习题转向真正的数学研究。AI模型AI agent数学证明DeepMindGemini形式化验证推荐理由:AI 用几百美元成本解决了人类数学家 56 年未解的问题,做数学研究或形式化验证的团队值得关注——这可能是数学研究自动化的转折点。原文
10:28AI Will@FinanceYF583°Google DeepMind发布AlphaProof Nexus论文,展示了一个AI agent在353个开放数学问题中自主解决了9个Erdős难题,其中包括两个56年未解的问题,并证明了44个OEIS猜想。每道题的推理成本仅数百美元,标志着AI在数学推理领域取得了重大突破。这项工作展示了AI agent在解决长期悬而未决的数学难题方面的潜力,为数学研究提供了新的工具和方法。AI模型数学推理AI agentDeepMindErdős难题OEIS猜想推荐理由:数学研究者和AI爱好者值得关注:AlphaProof Nexus以极低成本自主攻克了56年未解的难题,展示了AI在数学推理上的新高度,建议点开了解具体方法和成果。原文
08:20berryxia@berryxiaNVIDIA CEO Jensen Huang 在演讲中指出,每个工程师未来都要管理和使用几百个AI agent,这并非未来时,而是现在进行时。普通人使用Claude只发挥了其10%的能力,真正的高手将Claude当作操作系统,通过建立工作流、链式输出、掌控上下文,让AI按照自己的思考方式工作。同一份订阅,同一款模型,使用方式不同导致结果天差地别。行业AI agentClaude工作流NVIDIA工程师3 个信源在谈推荐理由:Jensen Huang 这句话点醒了无数AI使用者——别再只把Claude当问答工具,做AI工作流的开发者/工程师可以直接用它重构效率,看完你会重新认识Claude。原文
22:46AI Will@FinanceYF5QVeris 推出 CLI 工具,将蜡烛图、RSI、布林带、公司基本面等金融数据和技术指标接入 Claude Code。用户无需编写复杂脚本,即可通过自然语言让 AI agent 调用这些工具进行金融分析。这降低了金融分析的技术门槛,可能成为 AI 投研栈的基础组件。该工具可在 60 秒内完成配置,直接通过 Claude Code 调用。AI产品金融分析Claude CodeQVeris CLI技术指标AI agent推荐理由:做量化分析或投研的团队,不用再写爬虫和计算脚本——QVeris CLI 让 Claude Code 直接调用蜡烛图、RSI、基本面等数据,60 秒配好就能用自然语言跑分析,值得试试。原文
09:25berryxia@berryxiaNotionDevs 发布了一个 25 秒演示视频,展示了全新的 ntn CLI 工具。用户只需一行 curl 命令即可安装,并在终端中拥有完整的 Notion API 能力,包括登录工作区、新建 worker、查询数据库、用 Markdown 创建页面等。更重要的是,该 CLI 支持直接为 AI agents 添加 Notion skill,让它们在终端中顺滑操作整个工作空间。这标志着 Notion 正从笔记工具演变为 AI agent 的操作系统,代码可以直接在 Notion 中运行、测试和部署。AI产品NotionCLIAI agent自动化API1 个信源在谈推荐理由:Notion 的 ntn CLI 让 AI agent 深度集成 Notion 变得极其简单,做自动化工作流或智能体开发的团队可以直接用一行命令让 agent 操作整个工作空间,省去大量折腾时间。原文