全部 AI 动态 · AI 热点

6月19日

01:29

01:29

xAI@xai

精选

Vapi 的 Humanness Index 盲测显示，xAI 的 Grok TTS 模型以 96 分（满分 100）位居榜首，仅比人类真实语音低 4 分。该测试将同一段语音用不同模型克隆后，让听众盲评打分。Grok TTS 在多家主要语音模型中表现最接近真人。

AI模型 Grok TTS xAI 语音合成 Humanness Index 文本转语音

推荐理由：xAI 的 Grok TTS 在语音盲测中拿了 96 分，离真人只差 4 分，想听最像人说话的 AI 可以试试。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月5日

18:33

18:33

Geek@geekbb

MisoLabsAI 开源了一个 80 亿参数的情感丰富文本转语音模型，专注于高质量对话语音生成。该模型目前仅支持英语，但能生成带有情感色彩的语音，适合对话场景。项目上线三天即获得 1.7K GitHub Star，引发社区关注。这标志着开源 TTS 在情感表达和对话质量上迈出了重要一步。

AI模型文本转语音情感模型开源/仓库对话生成 MisoLabsAI

推荐理由：做语音交互或对话式 AI 的开发者，这个开源模型能直接提升语音的自然度和情感表现力，值得立刻试一下。

6月4日

02:55

02:55

elvis@omarsar0

78°

Miso One 是一个 8B 参数的开源文本转语音模型，具备真实情感范围，能表达温暖、犹豫和兴奋等情绪，告别机械感。它专为短视频、播客和教育内容等配音场景设计，推理延迟仅 110 毫秒，快于人类反应时间。模型权重完全开源，支持自托管、微调和数据隐私保护，适合将语音集成到工具和产品的开发者。

AI模型 Miso One 文本转语音情感语音开源/仓库配音

推荐理由：做语音合成或配音工具的开发者终于有了一个情感丰富且开源的 TTS 模型——Miso One 的 8B 参数和 110ms 延迟让实时配音成为可能，建议直接克隆仓库试试。

6月3日

04:44

04:44

OpenRouter@OpenRouterAI

微软发布MAI-Voice-2，一款支持15种语言的情感可控文本转语音模型，可表达兴奋、尴尬、耳语等情绪，并在长文本中保持稳定的说话人身份。该模型与MAI-Transcribe-1.5语音识别模型搭配使用，已在OpenRouter上线。这为多语言内容创作、有声读物、语音助手等场景提供了更自然、富有表现力的语音合成能力。

AI模型微软 MAI-Voice-2 文本转语音情感控制多语言

推荐理由：做多语言内容或语音应用的团队终于有了一个能控制情绪、长文本不跑调的TTS模型，直接上OpenRouter就能用，值得试试。

6月2日

23:59

23:59

ElevenLabs@elevenlabsio

精选

ElevenLabs在华沙Summit上预览了设备端文本转语音（on-device TTS）新模型架构，能在有限硬件上离线实现人类级质量。该模型不需要互联网连接，直接在设备上运行。具体硬件要求和延迟数据未在原文中透露。

AI产品 ElevenLabs 文本转语音离线语音合成

推荐理由：离线语音合成，质量媲美真人

5月15日

07:06

07:06

Together AI@togethercompute

Together AI 宣布在其平台上推出 Rime Mist v3，这是一系列面向生产环境的文本转语音（TTS）模型。该模型专注于确定性发音和可控语音输出，解决了语音合成中常见的不一致问题。AI 原生开发者现在可以在 Together AI 的专用基础设施上部署 Mist v3，用于需要大规模一致语音输出的企业级语音代理。这为构建可靠、可定制的语音交互系统提供了新的选择。

AI产品文本转语音 TTS 语音代理 Together AI Rime Mist v3

推荐理由：做语音代理和 TTS 应用的团队终于有了一个能保证发音一致性的生产级模型，直接在 Together AI 上就能部署，省去自己调教的麻烦，值得试试。