12:39IT之家(博客/媒体)精选科技媒体 The Decoder 报道,微软最新发布的 MAI 系列 AI 模型部分使用了 Common Crawl 等开放网络数据训练,与其此前宣称的“完全基于干净、商业授权数据”存在出入。微软技术论文显示,训练数据是“公开可得数据”与“授权人类生成数据”的混合,而非纯商业授权。微软称其爬虫遵守 robots.txt 协议,但媒体指出未屏蔽内容默认可抓取的逻辑存在争议。这一发现可能影响企业用户对微软 AI 模型数据合规性的信任。行业微软MAI训练数据数据合规Common Crawl推荐理由:微软 MAI 模型的数据来源争议直接关系到企业级 AI 部署的合规风险,做数据治理或采购 AI 服务的团队值得关注,建议点开了解具体细节。原文
08:37Fireworks AI@FireworksAI_HQ微软 MAI 模型即将在 Fireworks 平台上架,提供可控的智能和可追溯的端到端数据链。企业用户可针对自身任务对 MAI 推理模型进行微调,使用自己的数据构建定制化模型。这标志着微软将企业级 AI 能力进一步开放给开发者,Fireworks 作为高性能推理平台,将加速 MAI 模型的落地应用。AI产品微软MAIFireworks企业微调推理模型推荐理由:企业 AI 团队终于有了可定制的推理模型——MAI 支持端到端数据溯源和私有微调,做企业级 AI 应用的开发者可以直接在 Fireworks 上尝试,省去自建基础设施的麻烦。原文