AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:文本转语音×
6月19日
01:29
01:29xAI@xai
精选
Vapi 的 Humanness Index 盲测显示,xAI 的 Grok TTS 模型以 96 分(满分 100)位居榜首,仅比人类真实语音低 4 分。该测试将同一段语音用不同模型克隆后,让听众盲评打分。Grok TTS 在多家主要语音模型中表现最接近真人。
AI模型Grok TTSxAI语音合成Humanness Index文本转语音

推荐理由:xAI 的 Grok TTS 在语音盲测中拿了 96 分,离真人只差 4 分,想听最像人说话的 AI 可以试试。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月5日
18:33
18:33Geek@geekbb
MisoLabsAI 开源了一个 80 亿参数的情感丰富文本转语音模型,专注于高质量对话语音生成。该模型目前仅支持英语,但能生成带有情感色彩的语音,适合对话场景。项目上线三天即获得 1.7K GitHub Star,引发社区关注。这标志着开源 TTS 在情感表达和对话质量上迈出了重要一步。
AI模型文本转语音情感模型开源/仓库对话生成MisoLabsAI

推荐理由:做语音交互或对话式 AI 的开发者,这个开源模型能直接提升语音的自然度和情感表现力,值得立刻试一下。
原文
6月4日
02:55
02:55elvis@omarsar0
78°
Miso One 是一个 8B 参数的开源文本转语音模型,具备真实情感范围,能表达温暖、犹豫和兴奋等情绪,告别机械感。它专为短视频、播客和教育内容等配音场景设计,推理延迟仅 110 毫秒,快于人类反应时间。模型权重完全开源,支持自托管、微调和数据隐私保护,适合将语音集成到工具和产品的开发者。
AI模型Miso One文本转语音情感语音开源/仓库配音

推荐理由:做语音合成或配音工具的开发者终于有了一个情感丰富且开源的 TTS 模型——Miso One 的 8B 参数和 110ms 延迟让实时配音成为可能,建议直接克隆仓库试试。
原文
6月3日
04:44
04:44OpenRouter@OpenRouterAI
微软发布MAI-Voice-2,一款支持15种语言的情感可控文本转语音模型,可表达兴奋、尴尬、耳语等情绪,并在长文本中保持稳定的说话人身份。该模型与MAI-Transcribe-1.5语音识别模型搭配使用,已在OpenRouter上线。这为多语言内容创作、有声读物、语音助手等场景提供了更自然、富有表现力的语音合成能力。
AI模型微软MAI-Voice-2文本转语音情感控制多语言

推荐理由:做多语言内容或语音应用的团队终于有了一个能控制情绪、长文本不跑调的TTS模型,直接上OpenRouter就能用,值得试试。
原文
6月2日
23:59
23:59ElevenLabs@elevenlabsio
精选
ElevenLabs在华沙Summit上预览了设备端文本转语音(on-device TTS)新模型架构,能在有限硬件上离线实现人类级质量。该模型不需要互联网连接,直接在设备上运行。具体硬件要求和延迟数据未在原文中透露。
AI产品ElevenLabs文本转语音离线语音合成

推荐理由:离线语音合成,质量媲美真人
原文
5月15日
07:06
07:06Together AI@togethercompute
Together AI 宣布在其平台上推出 Rime Mist v3,这是一系列面向生产环境的文本转语音(TTS)模型。该模型专注于确定性发音和可控语音输出,解决了语音合成中常见的不一致问题。AI 原生开发者现在可以在 Together AI 的专用基础设施上部署 Mist v3,用于需要大规模一致语音输出的企业级语音代理。这为构建可靠、可定制的语音交互系统提供了新的选择。
AI产品文本转语音TTS语音代理Together AIRime Mist v3

推荐理由:做语音代理和 TTS 应用的团队终于有了一个能保证发音一致性的生产级模型,直接在 Together AI 上就能部署,省去自己调教的麻烦,值得试试。
原文
精选全部日报登录