全部 AI 动态 · AI 热点

6月23日

14:09

shao__meng@shao__meng

72°

字节跳动在火山引擎 FORCE 2026 原动力大会上发布 Seedream 5.0 Pro 图像生成模型和 Seedance 2.5 视频生成模型。OpenAI Sora 已关停，Google Veo 尚未更新，目前图像与视频生成赛道主要由中国厂商竞争，包括字节跳动、阿里巴巴、快手等。新模型在图像理解和视频生成能力上进一步升级。

推荐理由：字节跳动刚发了两个新模型，图像和视频生成都升级了，中国大厂继续内卷，可以看看

原文

14:08

Greg Brockman@gdb

精选72°

OpenAI 发布 Patch the Planet 项目，与 Trail of Bits、HackerOne 等安全研究机构合作。该项目利用 Codex Security 和前沿 AI 模型，帮助开源软件维护者将安全发现转化为合并修复。流程以人工审核为中心，旨在提升关键开源项目的安全性。

AI产品 OpenAI Codex Security 开源安全安全修复

推荐理由：OpenAI 找来 Trail of Bits 和 HackerOne 的安全研究员，用 Codex Security 帮开源项目修漏洞，还能自动生成合并修复，省心省力。

原文

14:07

AI Will@FinanceYF5

开发者利用DeepSeek API在魔兽世界私服中部署了1800个AI玩家。这些AI Bot不仅自动挂机，还能在游戏内互相聊天、执行任务并在公共频道讨论策略。其行为与真人玩家相似。作者表示没有DeepSeek API的帮助无法实现这一项目。

行业 DeepSeek API 魔兽世界 AI玩家 AI NPC 游戏AI

推荐理由：有人用DeepSeek API让1800个AI在魔兽私服里像真人一样聊天做任务，这玩法太有创意了！

原文

14:06

lmarena.ai@lmarena_ai

NVIDIA 的 Cosmos 3 Super 在 Text-to-Image Arena 开放模型排名中位列第8和第11（两个变体），整体排名第49和第54。其中 #8 的 Cosmos-3-Super-Text2Image 与 Flux-2-Klein-9B 和 Qwen Image Prompt Extend 持平。#11 的 Cosmos-3-Super-Text2Image (Agentic) 与 Qwen-Image 和 Ideogram-v3-Quality 等模型持平。这些排名体现了 NVIDIA 对开源生态的贡献。

AI模型 Cosmos-3-Super NVIDIA Text-to-Image Arena 文本到图像开源模型

推荐理由：NVIDIA 这个开源文生图模型在排行榜上跟 Flux、Qwen 差不多水平，想试试免费好用的生成工具可以关注它。

原文

14:04

OpenRouter@OpenRouterAI

精选73°

OpenRouter 宣布与 Coinbase 合作，将稳定币支付引入其平台。Coinbase 开发者平台宣布所有支付 API 已原生支持 agentic-enabled 模式。这意味着像 OpenRouter 这样的公司可以通过同一集成接口，同时接受来自人类用户和 AI agent 的稳定币付款。该功能无需额外开发，即开即用。

AI产品 OpenRouter Coinbase stablecoin 智能体支付

推荐理由：OpenRouter和Coinbase搞了个新支付方式，AI agent也能用稳定币付款了，挺有意思。

原文

14:03

OpenRouter@OpenRouterAI

GLM 5.2 自发布以来在 OpenRouter 平台上的 token 消耗占比迅速上升，与早先发布的 DeepSeek V4 形成竞争。OpenRouter 数据显示，GLM 5.2 的开源模型采纳速度超过多数同类产品。目前两者在 token 份额上差距缩小，但 DeepSeek V4 仍占一定优势。

行业 GLM 5.2 DeepSeek V4 OpenRouter 开源模型 token份额

推荐理由：OpenRouter晒出了GLM 5.2和DeepSeek V4的token份额对比，GLM 5.2涨得真快，开源模型里能跟DeepSeek掰手腕了。

原文

14:03

elvis@omarsar0

Sakana AI推出Fugu Ultra模型，这是一个可通过单个API调用的多智能体编排系统。Fugu Ultra在3D渲染任务上表现极佳，性能与Fable和Mythos相当，同时避免了出口管制风险。该模型展示了无需受限制即可获得前沿能力。

AI模型 Sakana AI Fugu Ultra Fable Mythos 多智能体

推荐理由：Sakana AI的Fugu Ultra多智能体系统，3D渲染强到离谱，性能比肩Fable和Mythos，还不用怕出口管制，快去试试。

原文

13:59

Marc Andreessen@pmarca

Mozilla在Firefox的1000万行代码库上测试了Claude Mythos，成功修复了400多个安全漏洞，包括潜伏超过十年的bug。Mozilla杰出工程师Brian Grins透露，效果50%来自模型、50%来自设置。他分享了使用目标/循环模式、用验证器消灭假阳性以及向agent说善意的谎言等技巧。他还表示任何人都可以在一个下午内复制类似的bug-finding harness。

技巧 Claude Mythos Mozilla Firefox AI安全智能体

推荐理由：Mozilla工程师手把手教你用AI agent在百万行代码里挖漏洞，不用一下午就能搭出同样工具，还能避免假阳性。

原文

13:57

Lenny Rachitsky@lennysan

Anthropic的Fiona Fung（领导Claude Code和Cowork团队）在接受Lenny Rachitsky访谈时指出，AI代理的抽象层次持续提升：从最初提示单个代理，到提示代理群体，再到代理自我提示。Fiona在Microsoft工作11年构建Visual Studio和TypeScript，后在Meta帮助构建首款VR/AR眼镜并启动Facebook Marketplace（年GMV超1000亿美元）。她分享了团队如何使用AI实现8倍代码产出，并讨论了工程师的上下文切换和孤独问题。访谈还涉及AI将如何改变产品团队的规划与角色。

行业 Claude Code Anthropic Agent 编程助手工程团队

推荐理由：Anthropic的Claude Code负责人分享AI如何让团队产出8倍代码，以及代理从提示到自我提示的进化，对编程效率提升有直接启发。

原文

13:55

Geek@geekbb

精选

百度开源了一个基于DeepSeek-OCR升级的视觉语言模型OCR项目，支持一次性解析超长文档。该模型提供两种推理模式：gundam模式用于处理单张图片中的密集文字，base模式适用于多页文档或PDF。项目代码已在GitHub上发布，允许开发者直接使用。

AI模型百度 DeepSeek-OCR 视觉语言模型 OCR 开源模型

推荐理由：百度开源的OCR模型，在DeepSeek-OCR上做了升级，能一次性处理超长文档和密集文字，两种模式很实用。

原文

13:54

@koltregaskes@koltregaskes

OpenAI的实时语音模式“Bidi 1”即将推出，目前已在UI中出现但处于隐藏状态。该功能预计在近期内开放给用户使用。消息来自X平台用户爆料。

AI产品 OpenAI Bidi 1 实时语音语音模式

推荐理由：OpenAI马上要出实时语音模式“Bidi 1”了，界面里已经藏着一个彩蛋，很快就能用上。

原文

12:55

AI Breakfast@AiBreakfast

Bland AI 宣布完成1亿美元C轮融资，用于继续训练其语音AI模型，使其能够处理长达45分钟的高风险企业电话对话。该模型旨在应对紧急、高风险的电话场景，而非仅仅优化短时客服通话。Bland AI 声称在这一领域处于领先地位。

行业 Bland 企业级语音AI 融资电话AI 语音模型

推荐理由：Bland AI 刚融了1亿美元，专门训练模型搞定45分钟高难度企业电话，不是那种两分钟客服小把戏。

原文

12:52

Ate-a-Pi@svpino

精选

作者指出现有基准往往在部署后失效，因为真实用户会使用你未测试过的表述。解决方案是分析推理日志和追踪，提取真实提示、响应、拒绝和格式错误。Nebius在Token Factory内推出Data Lab工作区，可将失败案例转化为评估和微调数据集。推荐循环：读日志→找失败→建数据集→评估→微调→部署→重复。

技巧 Nebius Data Lab Token Factory 模型评估微调

推荐理由：Nebius 出了个 Data Lab，能帮你从日志里挖出模型翻车的真实案例，直接做成数据集来微调和评估，比啥基准都管用。

原文

12:52

Ate-a-Pi@svpino

如果你还在人工审查全部AI生成的代码，那说明效率太低。代码审查已成为软件开发的最大瓶颈。Santiago Valdarrama（@svpino）分享了改进方法，核心是减少审查范围、使用自动化工具、建立信任机制。他建议只审查关键路径代码，利用AI辅助审查，并逐步放宽对低风险代码的审查比例。

技巧代码生成 AI编程代码审查开发效率工作流

推荐理由：Santiago Valdarrama说别傻了，100%审查AI代码拖慢整个团队。他给了具体改进策略：缩小审查范围、用工具自动化，让开发快起来。

原文

10:33

berryxia@berryxia

百度开源的 Unlimited OCR 模型采用 R-SWA 注意力机制，支持 32K 上下文窗口，一次前向推理即可完成几十页文档的转录。其核心卖点是 One-Shot Long-Horizon Parsing，无需分页处理，KV Cache 大小恒定。技术报告提到该模型融合了来自 DeepSeek-OCR 的高压缩编码器，且部分核心贡献者与 DeepSeek 有渊源。

AI模型 Unlimited OCR 百度 R-SWA OCR 开源模型

推荐理由：百度搞了个挺牛的 OCR 模型，能一口气读几十页，不像以前那样一页一页循环。开源了，谁都能试试。

原文

08:42

berryxia@berryxia

成峰开源的剪辑Skills已有2000+ GitHub Star，接入Anthropic的Codex后实现从口播素材到成片的自动化。Agent通过/剪口播命令生成带字幕视频，再通过/口播成片命令生成HTML分镜核对页，用户可直接反馈修改。Codex使用Computer Use自动调整时间线，最终由HyperFrames合成MP4。该流程将视频生产从手动执行转为流程编排。

技巧 Codex 剪辑Skills 智能体视频生成

推荐理由：用Codex加开源剪辑Skills，丢入口播素材和稿子，Agent直接帮你剪好带字幕的视频，还能自动做动画和分镜，省掉手动时间线操作。

原文

08:05

berryxia@berryxia

百度开源了Unlimited OCR模型，采用R-SWA（参考滑动窗口注意力）机制，一次前向推理即可处理32K上下文的文档，数十页PDF无需分块。与传统逐页处理的OCR不同，其KV Cache大小恒定，不随长度增长。模型灵感源于人类抄书行为，仅维护近128个状态。技术报告核心贡献者中，技术总监YY疑为DeepSeek前员工。

AI模型 Unlimited OCR 百度 DeepSeek R-SWA 文档理解

推荐理由：百度开源的Unlimited OCR能一口气读完几十页PDF，不用切块，快又准。技术总监YY可能是DeepSeek出走的，有意思。

原文

05:24

LangChain@LangChainAI

Patlytics 是一个专门为专利全生命周期设计的企业级法律AI平台。它使用LangSmith来编排从提示管理到工作流评估的端到端AI堆栈。该平台旨在提升专利流程的效率和质量。Patlytics 被LangSmith Spotlight 收录，展示了其在法律AI领域的应用。

AI产品 patlytics LangSmith LangChain 法律AI 专利生命周期

推荐理由：Patlytics 用 LangSmith 搭建了专利全流程 AI 平台，从提示到评估都管，法律行业可以看看。

原文

05:06

LangChain@LangChainAI

精选

Deep Agents v0.6 新增代码解释器，代理可在运行时调用工具。中间结果保留在模型上下文之外，仅传回相关输出。这减少了往返次数和 token 浪费。该版本由 LangChain 发布。

AI产品 Deep Agents LangChain 代码解释器智能体工具调用

推荐理由：Deep Agents v0.6 出代码解释器了！运行时调工具，中间结果不占上下文，省 token 还少跑几趟。看详情。

原文

05:03

Harrison Chase@hwchase17

精选

LangChain创始人hwchase17对比了模型路由（route to one best model）和模型合议制（pass to many models并聚合响应），认为前者主要为了成本，后者提升前沿性能。他引用@OpenRouter的Fusion和@SakanaAILabs的fugu作为合议制案例，并提到@nlarusstone将其用于棘手生物问题。作者对模型路由效果存疑，认为prompt caching和用户反馈缺失是问题，更倾向先实施成本控制（如LangChain的按模型设置支出上限）。Dax补充了用户需培养模型感知的观点。

行业 model routing model council OpenRouter SakanaAILabs 成本控制

推荐理由：hwchase17聊了模型路由和合议制的区别，吐槽路由被夸大，推荐先做成本控制。适合想了解多模型调度策略的人。

原文

04:27

Philipp Schmid@_philschmid

Google 更新了 Gemini API 文档，并发布了 GitHub 上的 Skill 示例。该示例展示了如何使用 Gemini API 构建自定义技能。文档和代码均在 ai.google.dev 和 github.com/google-gemini 上公开。开发者可以据此快速集成 Gemini 到工作流中。

技巧 Gemini API Google Skill Google Generative AI 教程

推荐理由：Google 刚放出了 Gemini API 的 Skill 示例代码，想自己动手接入 Gemini 的可以抄作业了。

原文

04:26

Lenny Rachitsky@lennysan

78°

Anthropic工程师一年内代码输出量增长8倍，验证成为最大挑战，团队采用“bad vs sad”追踪框架区分不可恢复错误与可恢复痛点。工程师因独立工作出现孤独感，团队引入配对编程午餐缓解。Anthropic构建了统计用户对Claude Code说脏话频率的仪表盘，作为体验评估代理指标。产品机会来源于非编码用户的潜在需求，如用Claude Code分析MRI或恢复婚礼照片。团队从半年规划转为月度规划，并赋予成员“杀死无效流程”的权限。

行业 Claude Code Anthropic 编程助手智能体工程实践

推荐理由：Anthropic的Claude Code团队负责人分享了他们如何让工程师效率提升8倍、用脏话计数衡量体验，还提到非程序员用Claude Code做MRI分析等趣事，全是实战干货。

原文

04:09

Philipp Schmid@_philschmid

Google Gemini 的 Interactions API 已正式发布（GA）。安装 Skill 后，编码代理能自动获得 Interactions API 的内置规则、正确 SDK 模式及当前模型版本。支持 Antigravity、Claude Code、Cursor 等代理。一条提示即可将现有应用迁移至新 API。迁移指南中的所有 API 变更由 Skill 自动应用。

技巧 Gemini Interactions API 编程助手 API迁移

推荐理由：Google 出了Gemini Interactions API 的官方 Skill，装上后你的编码代理一个提示就能自动迁移 API，支持 Claude Code、Cursor 等。

原文

03:57

Greg Brockman@gdb

精选73°

OpenAI推出了Codex Security插件，专为安全团队设计。该插件支持深度代码扫描、自动验证发现结果，并能够追踪攻击路径。它还可以构建威胁模型，生成针对代码库的特定补丁用于审查。此外，支持将分析结果导出到其他安全工具中。

AI产品 Codex OpenAI 安全代码扫描 AI安全

推荐理由：OpenAI给安全团队出了个Codex插件，能深度扫描代码、自动验证漏洞、画攻击路径，还生成专属补丁，省事儿不少。

原文

03:55

lmarena.ai@lmarena_ai

精选

技巧 Arena LMSYS 模型评测基准测试 Bradley-Terry

推荐理由：想了解AI模型评测怎么运作的？Arena团队亲自拆解从内测到上线的完整评估流程，还讲了Bradley-Terry分数如何保证公平，干货满满。

原文

03:54

Harrison Chase@hwchase17

精选

该建议指出，用于智能体工程的计划、研究等上下文文档应放在仓库外，而非版本控制系统中。原因包括：文档无需合并语义，线性历史即可满足99.9%场景；存入仓库将导致文档在不同分支间丢失。推荐系统通过FS工具访问、可发现、可持久化归档且支持协作。该讨论由LangChain创始人Harrison Chase转发，引发对智能体开发最佳实践的思考。

技巧 Agent工程文档管理版本控制上下文工程

推荐理由：LangChain创始人分享了一个文档管理的小技巧：把智能体工程文档放VCS外面，用FS工具访问，避免分支迷失。

原文

03:24

elvis@omarsar0

精选

Sakana AI推出Fugu Ultra多智能体编排系统，通过单一模型API即可调用。在程序化地形生成（Three.js）测试中，Fugu Ultra一次生成效果与Fable和Mythos相当。该模型规避了出口管制风险，属于前沿能力级别。

AI模型 Sakana Fugu Ultra 智能体程序化生成

推荐理由：Sakana AI悄悄上了个Fugu Ultra，多智能体编排直接一个API搞定，性能追上Fable和Mythos，还不用怕出口管制，值得试试。

原文

03:06

GitHub@github

Impeccable.ai在GitHub上获得超过40,000星标，以其在设计和质量方面的能力著称。GitHub将其作为内置技能集成到GitHub Copilot应用中，为所有创作者提供内置的设计与质量层。此举旨在提升AI辅助编码体验，降低门槛并提高输出质量。

AI产品 Impeccable.ai GitHub Copilot GitHub 编程助手

推荐理由：GitHub把超火的Impeccable.ai直接塞进了Copilot，以后写代码自动搞定设计和质量，不用再单独装插件了。

原文

03:03

LangChain@LangChainAI

LangChannel指出，随着智能体采用增长，团队需建立可重复的方法来安全、一致地构建多个生产级智能体。关键管理领域包括：成本与使用监控（✅ Cost and usage）、工具访问与审批（✅ Tool access and approvals）、人机协作工作流（✅ Human-in-the-loop workflows）、提示词/技能/上下文版本控制（✅ Prompt, skill, and context versioning）、跨团队可复用资产（✅ Reusable assets across teams）、以及生产智能体的监控与评估（✅ Monitoring and evals across production agents）。这些实践旨在解决规模部署时的一致性与可靠性问题。

技巧 LangChain 智能体 MCP/工具生产环境人机协作

推荐理由：LangChain总结了团队构建多个智能体的核心痛点：成本、权限、版本控制、监控等，全是实战干货，适合正在做 Agent 上线的团队参考。

原文

02:43

SiliconFlowAI@siliconflowai

GLM-5.2 在 Designarena 的 HTML Web Design 排行榜上取得第一，超越了此前长期占据榜首的 Claude Opus 4.6 和 4.7。该模型已通过 SiliconFlow API 提供使用。开发者可以立即调用 GLM-5.2 构建 HTML 网页设计项目。

AI模型 GLM-5.2 Claude Opus SiliconFlow Designarena 编程助手

推荐理由：HTML 设计排行榜上 GLM-5.2 干掉了 Claude，现在就能用 SiliconFlow 的 API 上手，写网页贼快。

原文

02:33

Logan Kilpatrick@OfficialLoganK

73°

Google AI Studio 发布 Interactions API 正式版（GA），该新 API 旨在让用户在同一界面内编排不同模型和智能体，已成为 AI Studio 新的默认 API。Interactions API 为智能体（Agents）新阶段奠定基础，开发者可更高效地构建跨模型工作流。

AI产品 Google AI Studio Interactions API MCP/工具智能体多模型协调

推荐理由：Google AI Studio 正式上线了 Interactions API，能让你在一个界面里调度不同模型和智能体，做复杂工作流更方便了

原文

02:26

LangChain@LangChainAI

LangChain 宣布其通用开发者工具 dcode 现已支持 GLM 5.2 模型。用户可直接在 dcode 中运行该开源模型，无需额外配置。dcode 是提供商无关的工具，也兼容其他最新的开源模型。详情可查阅 LangChain 文档。

AI模型 GLM 5.2 dcode LangChain 开源模型

推荐理由：LangChain 出了个叫 dcode 的工具，现在能跑 GLM 5.2 模型了，而且是开源的，想尝鲜直接上手。

原文

02:23

The Rundown AI@therundownai

72°

SpaceX通过出租Nvidia芯片给AI公司持续获利，最新交易是与Reflection AI在Colossus 2超级计算机上合作。其他大客户包括Anthropic每月支付12.5亿美元、Google每月9.2亿美元、Reflection AI每月1.5亿美元，以及被整体收购的Cursor（交易金额600亿美元）。这些订单显示了科技巨头对AI算力的巨大需求。

行业 SpaceX Nvidia Reflection AI Anthropic 算力租赁

推荐理由：SpaceX真是会赚钱，算力出租给Anthropic、Google都按月付上亿，新客户Reflection AI也签了1.5亿月租。

原文

02:09

Philipp Schmid@_philschmid

精选

Google 推出 Interactions API，提供单一 API 接口调用 Gemini 模型和智能体。该 API 包含隔离的远程 Linux 沙箱环境，支持异步后台运行的 background=True 参数。已集成图像生成 Nano Banana、音乐生成 Lyria 3，并预告未来支持视频生成 Omni。同时具备多模态工具调用与组合能力，以及专用编码技能。开发者可通过该 API 构建人类与智能体交互的应用。

AI产品 Interactions API Gemini Google 智能体多模态

推荐理由：Google 上线了 Interactions API，一个 API 就能调用 Gemini 模型和智能体，还有沙箱、图像音乐生成，异步运行很简单。

原文

02:06

Nous Research@NousResearch

Hermes Agent 现已集成 trycua，在 Windows 和 Linux 系统上支持计算机使用功能，此前该功能仅限 macOS。用户可以通过自然语言指令控制桌面操作。该更新由 NousResearch 发布，进一步扩大了代理的跨平台可用性。

AI产品 Hermes Agent trycua NousResearch 跨平台智能体

推荐理由：如果你用 Windows 或 Linux，现在也能用 Hermes Agent 控制电脑了，操作和 macOS 一样流畅。

原文

02:05

Nous Research@NousResearch

Nous Research 开发的智能体框架 Hermes Agent 在 GitHub 上获得 20 万颗星标。该项目基于开放权重模型构建可定制代理，支持多种工具调用和多步骤推理。里程碑反映出开发者社区对开源智能体框架的高度关注。

AI产品 Hermes Agent Nous Research 智能体 GitHub 开源项目

推荐理由：看看 Nous Research 搞的 Hermes Agent，GitHub 上 20 万星了，开源智能体框架里很猛的。

原文

02:03

Greg Brockman@gdb

精选

OpenAI 在 Daybreak 项目中推出新工具和模型，加速关键漏洞的发现和修补。其模型已能为 FreeBSD、Linux kernel、cURL、Go、Python、Sigstore、pyca/cryptography 等生成补丁。新发布的包括 Codex Security 插件（在 Codex 内修复漏洞）、GPT-5.5-Cyber 模型（专为防御者设计）、Cyber Partner Program（安全公司合作）以及 Patch the Planet（开源项目维护）。

AI产品 OpenAI GPT-5.5-Cyber Codex Security Daybreak AI安全

推荐理由：OpenAI 的 Daybreak 现在不仅能找漏洞，还能自动打补丁了，连 Linux 内核和 FreeBSD 都支持，安全团队可以试试 GPT-5.5-Cyber。

原文

01:23

Y Combinator@ycombinator

YCombinator于8月15日在YC总部举办活动，邀请学生与50多家YC投资公司的创始人和工程师交流。学生可在展区与创始人见面、收集周边，并观看初创公司路演。活动提供现场面试机会，可锁定2027年暑期实习或合作项目。

行业 Y Combinator YC AI初创公司实习学生招聘

推荐理由：YC直接组织线下活动，让你面对面和50多家AI初创公司创始人聊，现场面试拿实习，比投简历快多了。

原文

01:19

OpenAI@OpenAI

OpenAI 宣布启动 Daybreak Cyber Partner Program，与领先的安全软件和服务提供商合作。合作伙伴可在其安全产品和服务中使用 GPT-5.5 with Trusted Access for Cyber。客户能受益于该模型的防御能力，提升软件韧性，但直接模型访问权由合作伙伴控制。该计划旨在通过渠道模式推广 AI 安全能力。

行业 OpenAI GPT-5.5 Daybreak AI安全安全软件

推荐理由：OpenAI 联合安全厂商，让 GPT-5.5 直接嵌入安全产品，客户不用管理模型，就能享受更强的网络防御。

原文

01:19

OpenAI@OpenAI

OpenAI 宣布推出 Patch the Planet 项目，与 Trail of Bits、HackerOne 及多位安全研究员和开源维护者合作。该项目利用 Codex Security 和高级模型（如 GPT-4）协助将安全发现快速转化为合并修复。修复过程以人工审核为中心，确保补丁质量。目标是降低开源项目从漏洞披露到修复的时间门槛。

行业 OpenAI Codex Security Trail of Bits HackerOne AI安全

推荐理由：OpenAI 联手 Trail of Bits 和 HackerOne，用 Codex Security 帮开源项目快速修漏洞，人工把关，靠谱。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。