Fast · AI 话题观测

§ 01综述

Fast 在AI领域通常指代模型推理速度或产品名称（如GLM 5.2 Fast），近期多个进展聚焦于加速AI模型的吞吐量和生成效率。从视频生成到药物发现，业界正通过模型优化和专用工具包实现更快的推理速度。

Fast 近期进展

Vercel AI Gateway 上线 GLM 5.2 Fast，吞吐量翻倍：Vercel 的 AI Gateway 集成了 GLM 5.2 Fast 模型，其吞吐量较此前版本提升一倍，进一步降低了延迟。该模型专注于提升推理速度，适用于实时场景。原文标题

Grok Imagine Video 1.5 模型正式上线：生成 6 秒 720P 视频仅需 25 秒：xAI 推出 Imagine Video 1.5，将消费者版视频生成速度提升至 25 秒，比前代快约 50%。该模型在 API 中同步上线，强调速度与画质的平衡。原文标题

字节跳动推出 Seedance 2.0 Mini 视频生成模型，成本砍半：Seedance 2.0 Mini 在保持画质的同时，将推理成本减少一半，生成速度显著提升，旨在降低视频生成的门槛。原文标题

NVIDIA BioNeMo Agent Toolkit 将生物分子模型转为AI代理可调用技能：该工具包允许AI代理快速调用生物分子模型，通过优化推理链路实现更快的药物发现周期。原文标题

当前焦点与观察点

当前“Fast”相关进展的焦点在于：一是模型层面的推理加速，如 GLM 5.2 Fast 和视频生成模型的吞吐量提升；二是应用层面的效率优化，如 NVIDIA 工具包和字节跳动的成本削减。这些趋势显示，业界不再单纯追求模型参数量，而是更加重视实际部署中的速度与可及性。未来，Fast 可能成为模型标配，并推动更多实时AI应用的落地。此外，Notion AI 负责人入选 Fast Company 榜单，也侧面反映了“快”理念在商业生态中的认可度。

§ 02相关报道10 条在档

§ 03邻近话题