17:02IT之家(博客/媒体)Meta 已完成与 AI 智能体公司 Manus 的运营分离,自本月初起禁止 Manus 访问其内部数据系统,Meta 员工也无法再使用 Manus 工具。此前 Meta 曾以约 20 亿美元收购 Manus 母公司蝴蝶效应,但中国国家发改委以“洗澡式出海”不合规为由禁止该交易。Manus 在 2025 年 3 月爆火后,将总部迁至新加坡并裁减国内团队,引发争议。目前 Manus 创始人正考虑融资约 10 亿美元回购公司。行业MetaManus收购数据合规AI 智能体推荐理由:这起收购被叫停后的运营切割,揭示了 AI 企业跨境合规的敏感点——做全球化 AI 产品的团队,尤其是涉及数据共享的,值得关注监管红线。原文
19:45Decoder@Matthias Bastian72°据报道,马斯克的 xAI 使用 Anthropic 的 Claude 模型输出来训练自己的编程模型,持续了数月。在 Anthropic 切断访问后,xAI 仍通过私人账户和 Blackbox AI 服务继续使用。与此同时,xAI 的预训练团队缩减至不到五人,多名负责人离职。马斯克购买的算力现在被租给 Anthropic 和 Google,而非用于自己的模型训练。这一事件揭示了 AI 行业在模型训练数据使用上的灰色地带和竞争紧张关系。行业xAIClaude模型训练数据合规AI 竞争10 个信源在谈推荐理由:这件事暴露了 AI 大模型训练中数据来源的灰色操作,做模型训练的团队和关注 AI 伦理的读者值得一看——它直接关系到训练数据的合规性和行业竞争规则。原文
12:39IT之家(博客/媒体)精选科技媒体 The Decoder 报道,微软最新发布的 MAI 系列 AI 模型部分使用了 Common Crawl 等开放网络数据训练,与其此前宣称的“完全基于干净、商业授权数据”存在出入。微软技术论文显示,训练数据是“公开可得数据”与“授权人类生成数据”的混合,而非纯商业授权。微软称其爬虫遵守 robots.txt 协议,但媒体指出未屏蔽内容默认可抓取的逻辑存在争议。这一发现可能影响企业用户对微软 AI 模型数据合规性的信任。行业微软MAI训练数据数据合规Common Crawl推荐理由:微软 MAI 模型的数据来源争议直接关系到企业级 AI 部署的合规风险,做数据治理或采购 AI 服务的团队值得关注,建议点开了解具体细节。原文
20:33Decoder@Matthias Bastian微软声称其MAI模型训练数据是“企业级、干净且商业授权”的,但实际部分数据来自Common Crawl等未授权网络来源。与其他AI公司一样,微软依赖“合理使用”原则,并将阻止爬虫的责任推给网站所有者。这一发现揭示了微软在数据合规性上的双重标准,可能影响其企业客户的信任。事件凸显了AI行业在训练数据版权问题上的普遍争议。行业微软MAI模型数据合规版权争议Common Crawl推荐理由:微软的企业客户一直以为MAI模型用的是干净数据,现在发现和别家没区别——做合规采购的团队建议点开,看完再决定要不要签合同。原文
17:17IT之家(博客/媒体)市场监管总局宣布开展反不正当竞争专项执法,聚焦平台经济、民生和科技创新领域。重点规制利用数据和算法、技术、平台规则实施的网络不正当竞争行为,保护经营者、消费者和平台参与方权益。同时强化商业秘密保护,完善规则体系,防范泄密风险。此举旨在破除市场壁垒,推动形成优质优价、良性竞争的市场秩序。行业算法监管平台经济反不正当竞争市场监管数据合规推荐理由:算法和平台规则滥用是AI从业者和平台运营者的痛点,这次专项执法直接针对数据与算法的不正当竞争,做AI产品、运营平台或依赖算法分发的团队需要关注合规红线,建议点开了解具体监管方向。原文