全部 AI 动态 · AI 热点

6月2日

10:50

宝玉@dotey

精选

开发者建议AI编程助手如Codex和Cursor向右侧Web视图开放API，使网页能直接向左侧聊天界面发送提示（含文本和图片）。例如，类似Claude Design的网页可添加输入框，用户输入后调用类似window.codex.sendPrompt的API将内容推送到聊天界面。这能实现代理与网页更深层次的交互，解锁更多可能性。

AI产品 Codex Cursor API AI编程助手 Web交互

推荐理由：这个想法解决了AI编程助手与网页交互的割裂问题，做AI工具或Web应用的开发者值得关注，可以尝试在项目中实现类似机制。

原文

10:50

@OpenAIDevs@OpenAIDevs

OpenAI Devs 举办的 Voice Hack Night 上，@isausmanov 的“Agentic OS for a Phone”项目获得人民选择奖。这是一个以语音为先的移动操作系统，用户只需说话，智能体就能理解并跨手机执行操作。团队赢得了价值 5 万美元的 API 额度。该项目展示了语音交互与智能体结合的新方向，让手机操作更自然、更高效。

AI产品语音交互智能体移动操作系统 OpenAI API

推荐理由：语音交互+智能体操作手机，这个方向对移动端开发者、语音产品团队和智能体应用开发者都很有启发，值得关注其后续开源或产品化进展。

原文

09:32

阿里通义 Qwen@Alibaba_Qwen

83°

阿里 Qwen 团队正式推出 Qwen3.7-Plus，这是一款将视觉与语言能力统一的多模态智能体模型。它支持多模态交互混合智能体，可同时处理 GUI 和 CLI 操作；具备全模态输入的编程助手与生产力工具能力；视觉方面涵盖感知、推理、定位和搜索增强问答。该模型在多种智能体框架上表现出跨框架泛化能力，现已通过阿里云 Model Studio API 开放使用。

AI模型多模态智能体 Qwen3.7-Plus 阿里云 API

推荐理由：做多模态应用或智能体开发的团队可以直接用 API 试——一个模型搞定看、想、写、做，省去多模型拼接的麻烦。

原文

6月1日

23:20

Philipp Schmid@_philschmid

精选

Google 在 Gemini API 中推出了 Managed Agents 功能，旨在简化 AI 智能体的构建。开发者只需一次 API 调用，即可创建一个能在托管 Linux 沙箱中推理、编写和运行代码、管理文件的智能体。该服务将循环和环境管理移至平台端，让开发者专注于产品构建而非基础设施。团队表示将快速迭代并欢迎反馈。

AI产品智能体 Gemini API 托管服务沙箱 API

推荐理由：做 AI 智能体开发的团队终于可以省去环境搭建的麻烦——单次 API 调用就能跑起一个完整智能体，建议直接试试。

原文

14:50

歸藏(guizang.ai)@op7418

精选76°

MiniMax 正式发布大版本模型升级 MiniMax M3，核心亮点包括标配 1M 超长上下文、采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构，以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20，大幅提升可落地性。API 价格同步更新，小于 512k 的 API 限时五折（7 天）。模型权重和技术报告将在约 10 天后开源。

AI模型 MiniMax M3 长上下文稀疏注意力多模态 API

推荐理由：MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里，而且计算效率大幅提升，做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试，价格也很友好。

原文

5月30日

12:14

Runway ML@runwayml

Runway 宣布其 API 持续新增模型和端点，方便开发者将生成式 AI 能力直接集成到应用、产品和平台中。新增模型包括 Seedance 2.0、GPT Image 2、HappyHorse 1.0、Nano Banana Pro 和 Magnific Precision Upscaler V2 等。Runway API 旨在提供一站式模型服务，降低开发者集成多种生成式 AI 功能的门槛。此举有助于加速 AI 应用开发，尤其适合需要快速部署图像、视频生成能力的团队。

AI产品 Runway API 生成式AI 模型集成开发者工具

推荐理由：Runway API 把多个热门生成模型整合到一起，做 AI 应用集成的开发者不用再四处对接不同 API，直接在一个地方调用 Seedance 2.0 和 GPT Image 2 等模型，值得试试。

原文

02:10

xAI@xai

83°

xAI 宣布 grok-build-0.1 模型通过 API 进入公开测试阶段。该模型与驱动 Grok Build CLI 的模型相同，专为智能体编程场景优化。定价为每百万输入 token 1 美元、每百万输出 token 2 美元，兼具高性价比、智能性和速度。这是 xAI 在 AI 编程助手领域的重要布局，为开发者提供了新的选择。

AI产品 xAI grok-build-0.1 智能体编程 API AI 编程助手

推荐理由：做智能体编程的开发者有了一个性价比极高的新选择——grok-build-0.1 定价仅为 $1/$2 每百万 token，且专为 agentic coding 优化，值得在项目中试试它的表现。

原文

01:31

OpenRouter@OpenRouterAI

OpenRouter 宣布支持 OpenAI 模型的增量 diff 流式输出，通过 delta 事件逐步传输差异，而其他模型则返回完整补丁。用户可通过 `engine` 参数（auto、native、openrouter）控制行为。该功能让应用接收干净的结构化补丁并应用，下一轮交互时报告结果。这提升了流式输出的效率和实时性，尤其适合需要持续更新内容的场景。

AI产品 OpenAI 流式输出增量 diff OpenRouter API

推荐理由：做实时协作或流式内容更新的开发者，现在可以用 OpenAI 模型获得增量 diff，减少带宽和延迟，建议试试 OpenRouter 的 engine 参数。

原文

00:57

宝玉@dotey

72°

Anthropic 在发布 Claude Opus 4.8 的同时，上线了 API 层面的新能力：mid-conversation system messages（对话中途系统消息）。该功能允许在对话过程中动态修改系统提示词，且不影响 Prompt Caching。对于 Agent 开发者来说，这解决了之前无法在对话中途覆盖原始系统指令的痛点，例如让一个被设定为只写文档的系统设计师角色转变为可以写代码的开发工程师。目前该功能仅支持 Claude Opus 4.8，且仅在 Anthropic 自家 API 和 AWS 上的 Claude Platform 可用。系统消息不能放在对话开头，也不能连续放置两条，必须跟在 user 消息后面。

AI产品 Claude Opus 4.8 Anthropic API Agent开发系统消息

推荐理由：做 Agent 开发的团队终于可以动态调整系统提示词了，不用再靠 hack 方式覆盖指令，建议直接试。

原文

5月29日

12:40

LlamaIndex@llama_index

精选

LlamaIndex 今日发布了 LlamaParse Opus 4.8 版本，并公布了 ParseBench 评测结果。新版本在表格解析、语义格式和布局方面有轻微提升，但在图表解析和内容忠实度上出现小幅退步。同时，每页价格略有上涨。团队表示，在教 LLM 像人类一样阅读文档方面仍有大量优化空间。LlamaParse 依然是 AI 智能体最佳的文档摄取 API。

AI产品 LlamaParse 文档解析 ParseBench AI智能体 API

推荐理由：做文档解析或构建 AI 智能体的开发者，可以看看 ParseBench 的详细数据，评估是否值得升级。

原文

04:44

rohanpaul_ai@rohanpaul_ai

大多数 AI 团队仍像从单一供应商买软件一样购买推理服务：选一个模型、接受固定价格、持续付费，即使更便宜的模型也能完成相同工作。The Grid AI 采用不同方法：用户只需选择任务等级（标准、高级、最大），系统自动将请求路由到符合该等级的最便宜供应商。这意味着应用使用同一 API，但背后的模型可随价格和质量变化。作者在 Ubuntu 上测试了 Hermes Agent 与 The Grid 的集成，用于读取支持工单、应用策略文件并编写分类报告。

AI产品推理路由成本优化 The Grid AI 模型选择 API

推荐理由：做 AI 推理的团队终于有了按需降本的方法——不用改代码就能自动切换更便宜的模型，适合处理大量相似任务的开发者直接试试。

原文

02:01

Claude@claudeai

76°

Anthropic 宣布为 Opus 4.8 模型推出 Fast 模式，在保持相同模型质量的前提下，推理速度提升约 2.5 倍，同时价格降至原来的三分之一。用户可在 Claude Code 中通过 /fast 命令启用该模式。API 用户需联系客户经理申请访问或加入等待列表。这一更新显著降低了使用成本并提升了响应速度，适合对延迟敏感或高频调用的场景。

AI产品 Opus 4.8 Fast 模式 Claude Code API 速度提升

推荐理由：Opus 4.8 的 Fast 模式让重度 Claude 用户直接省下三分之二的 API 费用，同时响应更快，做自动化脚本或实时交互的开发者值得立刻试试 /fast 命令。

原文

00:35

LangChain@LangChainAI

LangChain 宣布其 API 新增多项功能，包括创建智能体、更新配置、创建线程以及从产品工作流中流式运行。这些能力让开发者能更灵活地将 LangChain 集成到自己的平台中，实现自动化智能体管理。该更新降低了构建复杂 AI 工作流的门槛，尤其适合需要定制化智能体编排的团队。

AI产品 LangChain 智能体 API 工作流集成

推荐理由：LangChain API 新增的智能体创建和流式运行能力，让做 AI 工作流编排的开发者可以直接在自己的产品中集成，省去自建编排层的麻烦，值得一试。

原文

5月28日

09:48

Greg Brockman@gdb

精选76°

OpenAI 宣布支持企业将 MCP 服务器部署在私有网络内，ChatGPT、Codex 和 Responses API 可通过出站 HTTPS 安全连接。这解决了企业数据隐私与 AI 工具集成之间的核心矛盾，让团队在不暴露内部服务的前提下使用 OpenAI 产品。开发者可以保持 MCP 服务器在内部网络，同时享受 OpenAI 的 AI 能力，无需担心数据外泄。该功能现已开放，适合需要安全 AI 集成的企业团队。

AI产品 MCP/工具 OpenAI 企业安全私有部署 API

推荐理由：企业终于能安全地让 ChatGPT 和 Codex 连接内部数据了——做 AI 集成或数据安全的团队可以直接用，无需担心隐私泄露。

原文

06:14

rohanpaul_ai@rohanpaul_ai

The Grid 是一个智能推理路由层，它根据任务复杂度自动选择最合适的模型，并按实时市场价格计费，而非固定费率。用户只需定义任务等级（标准、高级、最大），The Grid 会在多个供应商中动态选择最便宜的可用模型。这避免了为简单任务支付高端模型费用，也摆脱了对单一供应商的依赖。新用户可免费使用前 2 亿 token。作者演示了如何将 Hermes Agent 与 The Grid 集成，在本地运行代理但通过 The Grid 调用 AI。

AI产品推理成本模型路由供应商管理 Hermes Agent API

推荐理由：做 AI 应用开发的团队，如果还在为推理成本头疼，The Grid 的思路值得一试——它用市场机制替代了固定定价，简单任务不再花冤枉钱。

原文

03:07

@OpenAIDevs@OpenAIDevs

OpenAI 宣布在 API 平台中引入 Workload Identity Federation，允许团队通过 IAM 工作流管理访问权限，减少在服务间分发永久 API 密钥的需求。这一更新使企业用户能够利用云身份认证（如 AWS、Azure、GCP）来访问 OpenAI API，提升安全性和管理效率。开发者可以更安全地集成 OpenAI 服务，无需担心密钥泄露风险。

AI产品 OpenAI API 身份认证 IAM 云安全

推荐理由：企业团队终于可以告别 API 密钥满天飞的安全隐患了——用云 IAM 管理 OpenAI 访问，做云原生集成的开发者值得试试。

原文

03:07

@OpenAIDevs@OpenAIDevs

76°

OpenAI 宣布其产品（ChatGPT、Codex、Responses API）现在支持通过出站 HTTPS 连接私有 MCP 服务器。这意味着团队可以将 MCP 服务器保留在内部网络中，同时让 OpenAI 产品安全地访问这些服务器。这一更新解决了企业使用 AI 工具时数据安全与隐私的核心痛点，使得在保持数据不外泄的前提下，AI 助手能够调用内部工具和数据源。开发者可以通过 OpenAI 的 API 文档了解具体配置方法。

AI产品 OpenAI MCP/工具私有部署数据安全 API

推荐理由：企业团队终于可以在不暴露内部网络的情况下，让 ChatGPT 和 Codex 安全调用私有 MCP 服务器——做 AI 集成和数据安全的开发者可以直接参考文档配置。

原文

5月27日

19:26

Skywork@Skywork_ai

Skywork AI 宣布其 SkyClaw-v1.0 模型自上线以来访问量激增，导致服务拥堵。为保障整体服务稳定，平台临时实施限流措施。但 Skywork Agent 上的 SkyClaw-v1.0 使用不受影响。团队感谢用户理解与支持。

AI产品 SkyClaw-v1.0 Skywork AI 限流 API 国产模型

推荐理由：SkyClaw-v1.0 的火爆说明其能力受认可，但限流可能影响直接 API 调用者。如果你在用 Skywork Agent 或关注国产模型进展，这条值得留意——Agent 端仍可正常使用。

原文

5月24日

14:34

Geek@geekbb

一个名为 tokei 的开源工具可在 macOS 菜单栏实时显示 Claude Code 和 Codex CLI 的 API 使用率和速率限制。该工具基于 GitHub 仓库 otoha1119/tokei 开发，支持监控 API 调用次数和限制阈值。用户无需打开终端即可查看当前使用状态，避免因超出速率限制导致服务中断。

AI产品开源/仓库 Claude Codex CLI API macOS

推荐理由：监控 API 用量，避免超限

原文

5月22日

23:05

Philipp Schmid@_philschmid

精选83°

Google I/O 上，Phil Schmid 展示了 Gemini Managed Agents 的新 Interactions API，允许开发者通过一次 API 调用为 AI 提供一个安全托管的 Linux 沙箱环境。这个沙箱让 AI 可以执行代码、管理自己的内存，相当于拥有了一个独立的“电脑”。这大大简化了构建复杂智能体的流程，降低了开发门槛。对于需要让 AI 自主操作环境的场景，这是一个重要的基础设施更新。

AI产品智能体 Gemini API 沙箱 Google I/O

推荐理由：做智能体开发的团队终于可以省去自己搭建沙箱的麻烦——一次 API 调用就能给 AI 一个安全 Linux 环境，建议直接看演示。

原文

13:52

Ate-a-Pi@svpino

开发者Santiago Valdarrama发布了一个从零开始构建语音智能体的分步视频教程。他使用Claude Code编写代码，并利用AssemblyAI新推出的Voice Agent API，该API整合了语音识别、自然语言处理和语音合成等12个组件，简化了开发流程。教程展示了如何快速搭建一个功能完整的语音智能体，无需手动编写大量代码或拼接多个服务。

AI产品语音智能体 Claude Code AssemblyAI API 教程

推荐理由：想快速上手语音智能体开发的开发者，这个教程直接给你一条捷径——用Claude Code和AssemblyAI的API，省去拼接12个组件的麻烦，建议跟着视频实操一遍。

原文

5月21日

15:20

AI Will@FinanceYF5

Google 发布了全新模型 Gemini Omni，能够根据任意输入（如文本、图像、音频）生成任意输出内容，首先支持视频生成。该功能将集成到 Gemini App、Flow 和 YouTube 中，API 支持即将推出。Omni 被视为“Nano Banana”的视频版，标志着多模态生成能力的重大突破。这一进展将极大简化内容创作流程，尤其对视频创作者和开发者意义重大。

AI产品 Gemini Omni 多模态生成视频生成 Google API

推荐理由：多模态生成从文本扩展到视频，做内容创作或视频开发的团队可以直接在 Gemini App 和 YouTube 中体验，建议第一时间试用。

原文

08:00

Replicate@replicate

72°

Google 的 Gemini 3.5 Flash 模型已通过 Replicate 平台提供 API 访问。该模型被官方称为目前最快、最高效的模型，擅长处理日常任务和多步骤创意项目，能应对真实世界的复杂性。开发者现在可以通过 Replicate 的 API 直接调用，无需自行部署。这为需要快速集成 AI 能力的团队提供了便捷选择。

AI产品 Gemini 3.5 Flash Replicate API 高效模型 AI 部署

推荐理由：对于需要快速集成高效 AI 模型的开发者，Gemini 3.5 Flash 通过 Replicate API 直接可用，省去部署成本，值得一试。

原文

08:00

HeyGen@HeyGen_Official

83°

HeyGen 发布了其最高质量的 AI 虚拟形象模型 Avatar V API，定价为每秒 0.05 美元。该模型在跨场景说话头像生成任务中，与 Veo 3.1、Kling O3 Pro、OmniHuman 1.5 和 Seedance 2.0 进行了基准测试，并在所有类别中胜出。HeyGen 同时发布了研究论文和 API 接口，供开发者直接使用。这标志着 AI 虚拟形象生成在质量和成本上迈出了重要一步，尤其适合需要高保真数字人视频的应用场景。

AI产品虚拟形象 API 数字人视频生成 HeyGen

推荐理由：HeyGen 的 Avatar V 在跨场景说话头像生成上全面领先竞品，做数字人、虚拟主播或视频生成的开发者可以直接用 API 接入，成本可控且效果顶级。

原文

08:00

Philipp Schmid@_philschmid

Google 正式推出 Gemini 3.5 模型，并同步发布了开发者指南和 AI Studio 平台。开发者指南提供了详细的 API 文档和集成示例，帮助快速上手。AI Studio 则是一个在线实验环境，支持直接测试模型能力。这一更新意味着开发者可以更便捷地利用 Gemini 3.5 构建应用，尤其适合需要多模态理解或长上下文处理的场景。

AI产品 Gemini 3.5 开发者指南 AI Studio API 多模态

推荐理由：做 AI 应用开发的团队可以直接用 Gemini 3.5 的 API 和 AI Studio 快速验证想法，省去本地部署的麻烦，值得点开看看文档和示例。

原文

08:00

HeyGen@HeyGen_Official

HeyGen宣布降低其API栈的定价，同时声称在逼真度、唇形同步、动作质量和身份一致性方面仍优于竞争对手。此举旨在让AI视频生成更易于规模化，降低开发者与企业使用成本。降价后，用户能以更低价格获得高质量AI视频输出。这对于需要大量生成视频内容的团队来说是一个重要利好。

AI产品 HeyGen AI视频生成 API 降价规模化

推荐理由：做AI视频生成或内容制作的团队，现在可以用更低成本获得HeyGen的高质量输出，值得关注并尝试接入API。

原文

08:00

Sam Altman@sama

OpenAI 宣布推出 Guaranteed Capacity 服务，允许客户通过 1-3 年承诺获得折扣算力，并确保长期稳定的计算资源访问。Sam Altman 表示，随着模型能力提升，全球算力将长期受限，此举既帮助客户规划关键工作负载，也帮助 OpenAI 优化基础设施投资。该服务面向需要确定性算力的大客户，旨在实现双赢。

AI产品 OpenAI 算力保障企业服务 API 基础设施

推荐理由：算力不确定性是当前 AI 部署的最大瓶颈之一，OpenAI 用长期承诺和折扣解决了这个问题——做大模型应用或依赖 API 的团队，现在可以锁定成本并规划生产环境，值得关注。

原文

07:59

AI Will@FinanceYF5

72°

Anthropic 于 5 月 18 日宣布收购 Stainless，这家公司虽不为人熟知，但几乎所有使用 Claude API 的开发者都依赖其生成的 SDK。Stainless 专注于自动生成高质量、多语言的 API 客户端库，收购后有望提升 Claude API 的开发者体验和生态兼容性。此举表明 Anthropic 正在加强基础设施层，以吸引更多开发者并加速企业级应用落地。

行业 Anthropic Stainless SDK API 收购

推荐理由：Stainless 的 SDK 生成能力直接关系到 Claude API 的易用性和集成效率，做 AI 应用开发的团队值得关注——未来调用 Claude 可能更丝滑，建议点开了解收购背后的生态布局。

原文

07:59

Google AI Developers@googleaidevs

Google 在 Gemini API 中推出了托管智能体（Managed Agents）功能，开发者只需一次 API 调用即可构建生产级智能体。该功能降低了智能体开发的门槛，无需管理底层基础设施。Google 通过 Twitter 线程详细介绍了其用法和优势，旨在让更多开发者快速上手并部署智能体应用。

AI产品智能体 Gemini API 托管智能体 Google API

推荐理由：Google 把智能体部署简化到一次 API 调用，做 AI 应用开发的团队可以大幅降低运维成本，值得立即上手体验。

原文

00:44

Philipp Schmid@_philschmid

76°

Google AI Studio 为 Gemini 推出了一个独立的 Linux 沙盒环境，允许模型在一个 API 调用中完成推理、运行代码、浏览网页和管理文件。用户可以通过 Markdown 定义自定义行为、添加技能、挂载仓库和提供凭证。目前处于早期预览阶段，沙盒计算资源免费。这一功能大幅简化了 AI 代理的构建流程，开发者无需再手动编排多个工具。

AI产品 Gemini 沙盒 API AI 代理 Google AI Studio

推荐理由：做 AI 代理和自动化流程的开发者终于可以一个 API 搞定推理+执行+文件管理，省去繁琐的工具链编排，建议直接去 AI Studio 体验免费沙盒。

原文

5月20日

09:34

rohanpaul_ai@rohanpaul_ai

72°

Google 发布了 Gemini 3.5 Flash 模型，在多项基准测试中超越了 Gemini 3.1 Pro，成为同级别中的最强模型。该模型具备智能体能力，每秒 token 处理速度提升 4 倍。AI/ML API 平台已集成该模型，并提供 24 小时免费使用。开发者可快速体验其强大性能。

AI模型 Gemini 3.5 Flash 推理模型智能体 API 免费

推荐理由：Gemini 3.5 Flash 以更小体量超越 Pro 级模型，做智能体或高吞吐应用的开发者值得立即体验，尤其是 API 限免窗口仅 24 小时。

原文

03:20

Google DeepMind@GoogleDeepMind

78°

Google DeepMind 宣布将 3.5 Flash 模型全面推向 GeminiApp 和 Google 搜索的 AI 模式。开发者可通过 Antigravity 和 Gemini API 在 Google AI Studio 中开始构建。这是 Google I/O 期间的重要更新，意味着更快速、更高效的 AI 能力将直接服务于用户和开发者。3.5 Flash 模型在推理速度和成本上进行了优化，适合实时交互场景。

AI产品 3.5 Flash GeminiApp Google 搜索 AI 模式 API

推荐理由：Google 把 3.5 Flash 直接塞进搜索和 GeminiApp，做 AI 应用或搜索增强的开发者可以立刻在 API 里试，用户也能在搜索中体验更快的 AI 回复。

原文

5月18日

12:15

向阳乔木@vista8

Hermes 用户可通过订阅或 API 配置国内外主流模型，包括 OpenAI Codex 的 gpt-5.5、xAI Premium 的 grok-4.3、谷歌 Gemini 的 gemini-3.1-pro-preview 和 gemini-3-flash-preview、DeepSeek 的 deepseek-v4-pro 和 deepseek-v4-flash、智谱的 glm-5.1 和 glm-5-turbo、Kimi 的 kimi-k2.6 以及小米的 mimo-v2.5-pro。配置后可通过 /model 指令在机器人对话中切换模型。该指南为 Hermes 用户提供了清晰的模型接入路径，覆盖了从订阅到 API 的多种方式，适合需要灵活调用不同 AI 模型的开发者和重度用户。

AI产品 Hermes 模型配置 API 多模型切换 AI 工具

推荐理由：Hermes 用户终于有了清晰的模型配置清单，覆盖 OpenAI、xAI、谷歌、DeepSeek、智谱、Kimi、小米等主流模型，做多模型切换的开发者可以直接按指令配置，省去摸索时间。

原文

5月16日

22:22

a16z@a16z

Salesforce 上月宣布开放 API 并推出无头产品，押注在智能体时代其价值在于数据层而非用户界面。a16z 的 Seema Amble 以此为契机，探讨了一个更关键的问题：当剥离 UI、暴露数据库后，企业还剩下什么？她分析了在智能体时代，软件公司的防御力将从界面转向数据、工作流和集成。文章为 SaaS 企业如何适应新范式提供了战略思考。

行业 Salesforce 智能体数据层 API SaaS

推荐理由：Salesforce 的转向是智能体时代软件架构变革的信号，做 SaaS 产品和企业级应用的团队值得关注——数据层成为新护城河，你的产品准备好了吗？

原文

5月14日

13:37

深度求索 DeepSeek@deepseek_ai

78°

DeepSeek 正式发布 V3.2 和 V3.2-Speciale 两个新模型。V3.2 是 V3.2-Exp 的正式继任者，已在 App、Web 和 API 上线；V3.2-Speciale 则专注于极致推理能力，目前仅通过 API 提供。这两个模型以推理优先为设计理念，旨在更好地支持智能体（agent）场景。技术报告已同步公开。

AI模型 DeepSeek 推理模型智能体模型发布 API

推荐理由：做智能体开发或需要强推理能力的团队，DeepSeek 这次直接给了两个新选择——V3.2 可立即上手，Speciale 适合追求极致推理的 API 用户，值得关注技术报告里的细节。

原文

13:36

xAI@xai

xAI 宣布 Grok Voice API 正式上线语音克隆功能，支持生成带有丰富自然情感的语音。该功能允许用户通过 API 调用克隆人类声音，并用于各种应用场景。xAI 还发布了一段音频测试，让听众分辨人类和 AI 克隆的声音。这一进展展示了 AI 语音合成技术的成熟度提升，可能对语音助手、内容创作和客户服务等领域产生重要影响。

AI产品语音克隆 Grok API 情感合成 xAI

推荐理由：语音克隆技术终于有了自然情感，做语音应用或内容创作的开发者可以直接用 Grok Voice API 试试，效果可能超出预期。

原文

13:36

xAI@xai

xAI 发布了 Grok 4.3 模型，已在其 API 上可用。该模型在代理工具调用和指令遵循方面领先 @ArtificialAnlys 排行榜，并在 @ValsAI 的企业领域（如判例法和公司金融）中排名第一。Grok 4.3 支持 100 万 token 上下文窗口，输入价格为每百万 token 1.25 美元，输出价格为 2.50 美元。开发者可以立即创建 API 密钥开始使用。

AI模型 Grok 4.3 xAI 推理模型 API 企业应用

推荐理由：Grok 4.3 在代理工具调用和企业场景（如法律、金融）中表现突出，做智能体或企业级应用的开发者可以直接用 API 体验，性价比也不错。

原文

13:36

xAI@xai

xAI 宣布其 API 上线了图像生成质量模式（Image Generation Quality Mode），该模型已在 Grok 上驱动超过 3 亿张图像的生成。新模式提升了图像的真实感、文本渲染能力以及创意控制，特别面向商业专业人士。这意味着开发者现在可以通过 API 调用更高质量的图像生成能力，用于营销、设计等场景。

AI产品 xAI 图像生成 API 质量模式商业应用

推荐理由：xAI 把 Grok 上验证过的图像生成能力开放给 API 用户，做商业设计或内容生成的团队可以直接集成，提升出图质量和可控性。

原文

13:27

shao__meng@shao__meng

精选

LandingAI 发布了一个名为“解析前”的页面级分类 API，能在昂贵的文档解析之前对 PDF 逐页打标签。它解决企业文档混杂的问题：如 50 页房贷 PDF 中混有工资单、银行流水等，直接解析会浪费算力并导致抽取幻觉。API 支持自定义类别列表、并发逐页评估、返回标签及推理说明，还能处理未知页面并建议类别。企业可根据标签丢弃无关页或分流到不同流水线，调用方式为简单的 curl POST 请求。

AI产品文档解析页面分类 API LandingAI 企业AI

推荐理由：做文档处理或企业 RAG 的团队，终于有个低成本方案在解析前先做“分诊”，避免为噪音付 OCR 和 LLM 的冤枉钱，值得直接试。

原文

09:25

berryxia@berryxia

NotionDevs 发布了一个 25 秒演示视频，展示了全新的 ntn CLI 工具。用户只需一行 curl 命令即可安装，并在终端中拥有完整的 Notion API 能力，包括登录工作区、新建 worker、查询数据库、用 Markdown 创建页面等。更重要的是，该 CLI 支持直接为 AI agents 添加 Notion skill，让它们在终端中顺滑操作整个工作空间。这标志着 Notion 正从笔记工具演变为 AI agent 的操作系统，代码可以直接在 Notion 中运行、测试和部署。

AI产品 Notion CLI AI agent 自动化 API

推荐理由：Notion 的 ntn CLI 让 AI agent 深度集成 Notion 变得极其简单，做自动化工作流或智能体开发的团队可以直接用一行命令让 agent 操作整个工作空间，省去大量折腾时间。

原文