精选理由
想给TTS模型随时纠正陌生名词发音?FlowEdit用Hopfield网络存记忆,错误率直降92.7%,不用重训练。
流匹配TTS在部署后无法纠正专有名词的发音错误。FlowEdit通过潜在条件编辑而非权重更新来实现终身适应,并用现代Hopfield网络存储纠正。在涵盖18个语系、312个多语言专有名词的基准上,FlowEdit将目标词音素错误率相对降低92.7%,且通用语音质量不变。每次纠正仅需约15秒(单GPU)。
AI 翻译 · 中文
流匹配TTS在部署后无法纠正专有名词的发音错误。FlowEdit通过潜在条件编辑而非权重更新来实现终身适应,并用现代Hopfield网络存储纠正。在涵盖18个语系、312个多语言专有名词的基准上,FlowEdit将目标词音素错误率相对降低92.7%,且通用语音质量不变。每次纠正仅需约15秒(单GPU)。
Flow-matching text-to-speech systems achieve remarkable zero-shot quality but remain static after deployment: pronunciation errors on out-of-vocabulary proper nouns persist unless the model is retrained. We introduce Flo…