Together

§ 01综述

Together AI 是一家专注于开源模型推理的 AI 基础设施公司，致力于通过优化推理速度和降低成本，推动开放模型的广泛采用。近期，该公司在推理市场转向速度与成本、模型选择产品化以及 AI 栈模块化等方面取得显著进展。

Together AI 近期进展

开源模型变强，推理市场竞争转向速度与成本：Together AI 强调，随着开源模型能力提升，推理服务的竞争焦点已从单纯定价转向速度和成本综合优势，其平台通过高效调度实现了低延迟和高吞吐。原文标题

Token 用量激增，模型选择成产品策略：Together AI 推出推理层，帮助用户根据任务特性选择最优模型，以应对 Token 消耗快速增长的挑战，并降低整体推理成本。原文标题

开放模型不仅是定价故事，更是 AI 栈模块化：Together AI 主张开放模型的核心价值在于模块化和可组合性，使用户能灵活构建定制化 AI 应用，而非仅关注价格竞争。原文标题

构建全球最快语音转文本堆栈 Parakeet：Together AI 发布了号称最快的语音转文本堆栈 Parakeet，凭借其推理引擎优化，在高并发场景下实现极低延迟。原文标题

当前焦点与观察点

Together AI 当前的核心策略是围绕开放模型构建全面、高效的推理基础设施，其进展反映了行业对推理速度和成本的重视正在攀升。一方面，Token 用量激增促使企业更精细地选择模型，Together 的推理层通过路由和动态批处理降低成本；另一方面，其模块化 AI 栈理念与开源社区形成协同，吸引开发者构建智能体等高级应用。不过，随着更多玩家加入，竞争焦点是否会从技术性能转移到商业生态构建，仍有待观察。Together AI 的 400T tokens 处理量表明开放模型在生产环境中的可信度已大幅提升，但如何持续保持成本优势并拓展企业级功能，将是其未来关键挑战。

§ 02相关报道10 条在档

§ 03邻近话题