精选理由
豆包发了 Seed Audio 1.0,不光能念稿,还能生成音乐和音效,像声音版的 DALL·E,值得听听。
豆包音频生成模型 Seed Audio 1.0 发布,可根据想象生成人声、音乐、音效和环境音。与传统的 TTS(仅文本转语音)不同,它能捕捉声音中的微妙细节。这是首次将智能赋予声音的模型,类似图像领域的 Seedance 时刻。
AI 翻译 · 中文
豆包音频生成模型 Seed Audio 1.0 发布,可根据想象生成人声、音乐、音效和环境音。与传统的 TTS(仅文本转语音)不同,它能捕捉声音中的微妙细节。这是首次将智能赋予声音的模型,类似图像领域的 Seedance 时刻。
声音模型的 Seedance 时刻,终于来了 今天我体验到一个全新的声音模型,跟以前所有的声音模型都不一样。 以前的声音模型一般叫 TTS(文本转语音),它们只能根据你给的文本来合成语音,它更像是一个朗读机器,而非智能声音模型。 但这个新模型,可以根据你的想象,生成一切你所需要的声音,包括人声、音乐、音效、环境音,以及这些声音里所富含的那些不可言说的微妙细节。 它的名字名字叫:豆包音频生成模型 Seed Audio 1.0。 在我看来,…