Together AI

§ 01综述

Together AI 是一家专注于开放模型推理基础设施的 AI 公司，在开源模型生态中扮演关键角色，通过提供高性能、低成本的推理服务推动 AI 栈模块化。近期，Together AI 在推理速度、成本优化和模型多样性上取得显著进展，成为开放模型生产采用的重要推动者。

Together AI 近期进展

推理市场竞争转向速度与成本：Together AI 强调开放模型不仅是定价故事，更是 AI 栈模块化。其推理层旨在降低每次迭代成本，例如 GLM-5.2 每次迭代成本仅几美分，推动模型选择成为产品策略的核心。原文标题

打造全球最快语音转文本堆栈 Parakeet：Together AI 推出 Parakeet 堆栈，声称实现全球最快语音转文本推理，进一步拓展开放模型的应用场景，从文本生成扩展到语音处理领域。原文标题

开放模型采用量突破 400T tokens：Together AI 宣布其平台处理的 token 总数已达 400 万亿，证明开放模型在生产环境中的广泛采用，同时与 5C 合作部署 NVIDIA GB300 NVL72 用于大规模推理，强化基础设施能力。原文标题

推动 Agentic Coding 与科学发现：Together AI 举办 Agentic Coding 推理引擎 Workshop，并分享 James Zou 在 EinsteinArena 和 DSGym 上的研究，探索 AI 智能体在协作科学发现中的评估与应用。原文标题

当前焦点与观察点

Together AI 当前焦点在于通过低成本、高性能的推理服务加速开放模型的商业化，同时推动 AI 栈模块化以降低用户迁移成本。其竞争策略不再单纯依赖模型性能，而是转向推理速度、吞吐量和总拥有成本。争议点在于开放模型是否能在安全性、可控性上与闭源模型抗衡，但 Together AI 通过生态合作（如 GLM-5.2）和基础设施投资（如 GB300 部署）试图证明开放路线的可行性。此外，随着 token 用量激增，模型选择成为产品差异化关键，Together AI 的推理层作为中间层可能重塑开发者的部署决策。

§ 02相关报道10 条在档

§ 03邻近话题