togetherai·general

Together AI

别名
首次出现
2026-05-22
最近出现
2026-06-12
累计提及
31
§ 01综述

Together AI 近期在 AI 推理效率、多模态模型和开源基础设施方面动作密集。其战略核心是通过系统层优化降低大模型部署成本,同时快速集成市场热门模型。

最显著的进展是推理性能的突破。Together AI 开源了 OSCAR,一种注意力感知的 2-bit KV 缓存量化系统,可在不显著降低质量的情况下将长上下文 LLM 推理速度提升 3 倍(Together AI 开源 OSCAR)。其自研推理引擎在 API 调用中实现了比 Claude Opus 低 76% 的成本(Together AI 推理引擎),并详细公布了背后的系统层优化(详解 LLM 推理引擎)。

在多模态与语音领域,Together AI 快速上线了 NVIDIA Parakeet-TDT 0.6B 语音转文字模型,宣称是速度最快的方案(上线 Parakeet-TDT),并新增 600+ 声音、集成 MiniMax Speech 2.8 Turbo(新增声音)。其 STT 模型在语音转写速度榜单上占据前两名(STT 模型榜首)。

生态整合方面,Together AI 积极引入新模型:如 Gemma-4-31B-it-Pearl 以低于 25% 的价格提供推理(Gemma-4 登录);同时支持 Cursor Composer 2.5 等编程工具(Cursor Composer 2.5)。此外,Violin 项目可直接安装为 Claude Code skill,拓展了与 Anthropic 生态的协作(Violin 项目)。

当前焦点在于 Together AI 能否将成本与速度优势转化为持续的开发者粘性,以及 OSCAR 等开源技术是否会成为行业标准。未来需观察其长上下文推理的实用性和多模态模型的竞争力。

§ 02相关报道10 条在档
  1. 01
    Untied Ulysses 让 Llama 3B 在单节点训练 3M 上下文
    Together AI
  2. 02
    Cursor 与 Together AI 合作实现实时推理,提升 AI 编程体验
    Together AI
  3. 03
    Together AI 获得 ISO 27001:2022 认证
    Together AI
  4. 04
    DeepCogito用Together AI实现500ms首令牌延迟
    Together AI
  5. 05
    Together AI 与 Pax8 合作,为中小企业提供开源 AI 基础设施
    Together AI
  6. 06
    Ideogram 4 发布:开源图像模型,支持2K生成与文字渲染
    Together AI
  7. 07
    Together AI 上线两款 NVIDIA Nemotron 模型
    Together AI
  8. 08
    MiniMax M3 上线,Together AI 提供推理支持
    Together AI
  9. 09
    Together AI 高管在 GTC 挑战辣翅问答
    Together AI
  10. 10
    Together AI 上线最快语音转文字模型 NVIDIA Parakeet-TDT 0.6B
    Together AI
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/Together%20AI