全部 AI 动态 · AI 热点

6月23日

15:02

15:02

orange.ai@oran_ge

ListenHub 创始人宣布即将接入字节跳动的 Seed Audio 模型。该模型能够用声音智能创造有趣且有用的内容。团队在去年创建 ListenHub 时就期待这样的能力。接入后用户可在 ListenHub 上获得全新的音频内容制作体验。官网 listenhub.ai 已发布上线信息。

AI产品 Seed Audio ListenHub 音频生成智能音频字节跳动

推荐理由：做音频内容的朋友注意了，ListenHub 要接入字节的 Seed Audio 了，以后做播客、配音这些会方便很多。

14:48

14:48

orange.ai@oran_ge

豆包音频生成模型 Seed Audio 1.0 发布，可根据想象生成人声、音乐、音效和环境音。与传统的 TTS（仅文本转语音）不同，它能捕捉声音中的微妙细节。这是首次将智能赋予声音的模型，类似图像领域的 Seedance 时刻。

AI产品豆包 Seed Audio 1.0 音频生成多模态声音模型

推荐理由：豆包发了 Seed Audio 1.0，不光能念稿，还能生成音乐和音效，像声音版的 DALL·E，值得听听。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月21日

13:27

13:27

Stability AI@StabilityAI

Stability AI 推出了 Stable Audio 3.0，这是一个开源权重模型系列，专为艺术实验设计。新版本支持最长六分钟的变长音频生成，并能在便携设备上完成完整歌曲创作，无需 GPU。模型基于完全许可的数据集训练，用户可商用输出，年收入不超过 100 万美元。首次支持 LoRa 训练，允许用户用自己的音频库定制模型。Stability AI 邀请开发者参与实验，认为最佳创新仍在等待被构建。

AI模型 Stable Audio 3.0 开源/仓库音频生成 LoRa训练 Stability AI

推荐理由：音乐创作者和 AI 音频开发者终于有了一个可商用、可定制的开源音频模型——Stable Audio 3.0 支持六分钟生成和 LoRa 微调，做音乐生成或声音设计的团队可以直接上手实验。