13:51Together AI@togethercomputeTogether AI 构建了基于 Parakeet 的语音转文本堆栈,每秒可处理约 302 秒音频,这是 Artificial Analysis 报告中最高速度因子。该堆栈在 Together 平台上运行,通过系统级优化实现低延迟转录。文章由 @FeelTheBeurn 详细拆解了背后的工程工作。AI模型ParakeetTogether AI语音识别推理优化速度基准推荐理由:Together AI 把 Parakeet 优化到每秒转写 302 秒音频,比别的服务快一大截,想搞语音识别的可以看看这篇系统调优拆解。原文
13:51Together AI@togethercompute精选Together AI 在 X 上演示语音智能体利用屏幕交互的功能。该方案整合了语音转文本(STT)、语音合成和推理,具体使用 Parakeet 进行 STT,MiniMax Speech 2.8 处理语音,MiniMax M3 进行推理。实时系统要求堆叠每一层保持低延迟。演示展示了完整循环在 Together AI 平台上运行。AI产品Together AIParakeetMiniMax Speech 2.8MiniMax M3语音智能体3 个信源在谈推荐理由:Together AI 搞了个语音智能体 demo,能边看屏幕边说话,用了 Parakeet、MiniMax Speech 2.8 和 M3,实时性很强。原文