20:33Decoder@Matthias Bastian微软声称其MAI模型训练数据是“企业级、干净且商业授权”的,但实际部分数据来自Common Crawl等未授权网络来源。与其他AI公司一样,微软依赖“合理使用”原则,并将阻止爬虫的责任推给网站所有者。这一发现揭示了微软在数据合规性上的双重标准,可能影响其企业客户的信任。事件凸显了AI行业在训练数据版权问题上的普遍争议。行业微软MAI模型数据合规版权争议Common Crawl推荐理由:微软的企业客户一直以为MAI模型用的是干净数据,现在发现和别家没区别——做合规采购的团队建议点开,看完再决定要不要签合同。原文
10:43IT之家(博客/媒体)OpenAI 于今年早些时候低调收购了 AI 声音克隆初创公司 Weights.gg,获得其全部知识产权及约六人团队。Weights.gg 平台曾提供免费声音克隆应用 Replay,其语音模型库包含大量未经授权的名人声音,如泰勒·斯威夫特、坎耶·维斯特等,引发版权争议。OpenAI 自身拥有 Voice Engine 技术,仅需 15 秒音频即可生成逼真语音,但出于滥用担忧尚未公开。此次收购将帮助 OpenAI 整合语音技术,同时应对版权问题,其已向开发者开放语音 API,并集成至苹果 CarPlay。行业OpenAI声音克隆版权争议Weights.gg语音技术推荐理由:OpenAI 通过收购 Weights.gg 加速语音技术布局,同时直面声音克隆的版权雷区,做 AI 语音产品、内容创作或版权合规的团队值得关注,看看巨头如何平衡创新与风险。原文