10:19berryxia@berryxia78°OpenMOSS团队发布开源模型MOSS-Audio,首次将语音、音乐和环境音统一建模,实现音频语言统一。该模型能同时转录语音、识别环境音、理解音乐情绪,并生成文本描述或执行下游任务。它登顶Hugging Face Trending第一,代码和模型权重完全开源可商用。这颠覆了音频AI作为视觉/文本附属品的认知,让普通开发者能本地搭建音频Agent。开源社区在音频多模态领域的速度和开放度已领先闭源方案。AI模型开源/仓库音频模型多模态MOSS-Audio智能体推荐理由:做音频Agent或播客工具的开发者终于不用在闭源高价和割裂方案间纠结——MOSS-Audio一个模型搞定语音+声音+音乐,直接本地跑,建议立刻拉下来试试。原文