AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:音频生成×
6月23日
15:02
15:02orange.ai@oran_ge
ListenHub 创始人宣布即将接入字节跳动的 Seed Audio 模型。该模型能够用声音智能创造有趣且有用的内容。团队在去年创建 ListenHub 时就期待这样的能力。接入后用户可在 ListenHub 上获得全新的音频内容制作体验。官网 listenhub.ai 已发布上线信息。
AI产品Seed AudioListenHub音频生成智能音频字节跳动

推荐理由:做音频内容的朋友注意了,ListenHub 要接入字节的 Seed Audio 了,以后做播客、配音这些会方便很多。
原文
14:48
14:48orange.ai@oran_ge
豆包音频生成模型 Seed Audio 1.0 发布,可根据想象生成人声、音乐、音效和环境音。与传统的 TTS(仅文本转语音)不同,它能捕捉声音中的微妙细节。这是首次将智能赋予声音的模型,类似图像领域的 Seedance 时刻。
AI产品豆包Seed Audio 1.0音频生成多模态声音模型

推荐理由:豆包发了 Seed Audio 1.0,不光能念稿,还能生成音乐和音效,像声音版的 DALL·E,值得听听。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月21日
13:27
13:27Stability AI@StabilityAI
Stability AI 推出了 Stable Audio 3.0,这是一个开源权重模型系列,专为艺术实验设计。新版本支持最长六分钟的变长音频生成,并能在便携设备上完成完整歌曲创作,无需 GPU。模型基于完全许可的数据集训练,用户可商用输出,年收入不超过 100 万美元。首次支持 LoRa 训练,允许用户用自己的音频库定制模型。Stability AI 邀请开发者参与实验,认为最佳创新仍在等待被构建。
AI模型Stable Audio 3.0开源/仓库音频生成LoRa训练Stability AI

推荐理由:音乐创作者和 AI 音频开发者终于有了一个可商用、可定制的开源音频模型——Stable Audio 3.0 支持六分钟生成和 LoRa 微调,做音乐生成或声音设计的团队可以直接上手实验。
原文
精选全部日报登录