06:32marktechpost@Asif Razzaq76°Stability AI 发布了 Stable Audio 3,一个用于乐器音乐和音效生成的潜在扩散模型家族。该版本包含小型和中等变体的开源权重。小型模型可在 MacBook Pro M4 CPU 上运行,中等模型适配 8GB VRAM 的消费级 GPU。两者均通过三阶段训练流程(流匹配、蒸馏预热、对抗后训练)生成 44.1 kHz 立体声音频。在 BBC 音效基准测试中,SA3 中等模型在 5 秒片段上取得 FAD 0.369 的分数,低于论文中评估的所有开源基线。AI模型Stable Audio 3音频生成潜在扩散模型开源权重Stability AI推荐理由:Stable Audio 3 让音频生成门槛大幅降低——小型模型在普通笔记本上就能跑,做游戏音效、短视频配乐的创作者可以直接上手试试。原文
23:47IT之家(博客/媒体)76°Stability AI 发布全新音频生成模型家族 Stability Audio 3.0,包含四款不同参数规模的模型,其中大型版可生成长达 6 分 20 秒的完整乐曲,相比 2.0 版翻倍。小型模型专注于设备端运行,可本地生成两分钟以内的声音与音乐。Stability AI 已将小型 SFX、小型及中型模型开源,大型模型仅通过 API 和付费托管服务提供。该公司已与华纳音乐集团、环球音乐集团达成合作,确保训练数据合法授权,并正为专业音乐人打造新产品线。AI产品音频生成开源/仓库Stability AI音乐创作模型推荐理由:音乐创作者和音频开发者终于有了能生成完整歌曲的开源模型——Stability Audio 3.0 的中型版已开源,长度翻倍且结构可控,做音乐生成或音频工具的建议直接下载试试。原文