23:31IT之家(博客/媒体)71°开发者@0x0SojalSec 绕过苹果M4神经网络引擎的软件限制,通过逆向工程使用自定义MIL(模型中间语言)直接与芯片通信,没有调用Core ML、Metal或GPU。训练数据全程放在RAM中运行,不写入NAND闪存,速度更快。解锁后M4在iPad或Mac上可达到15.8TFLOPS的AI处理性能,用于训练模型。目前自定义MIL能否用于更新的Apple Silicon尚不明确。技巧M4Apple Silicon神经网络引擎模型训练逆向工程推荐理由:有个开发者自己写了一套代码,把M4芯片的AI训练能力全开出来了,不用苹果官方工具,跑到了15.8TFLOPS。想用iPad或Mac训练模型的人可以看看。原文
19:45Decoder@Matthias Bastian72°据报道,马斯克的 xAI 使用 Anthropic 的 Claude 模型输出来训练自己的编程模型,持续了数月。在 Anthropic 切断访问后,xAI 仍通过私人账户和 Blackbox AI 服务继续使用。与此同时,xAI 的预训练团队缩减至不到五人,多名负责人离职。马斯克购买的算力现在被租给 Anthropic 和 Google,而非用于自己的模型训练。这一事件揭示了 AI 行业在模型训练数据使用上的灰色地带和竞争紧张关系。行业xAIClaude模型训练数据合规AI 竞争10 个信源在谈推荐理由:这件事暴露了 AI 大模型训练中数据来源的灰色操作,做模型训练的团队和关注 AI 伦理的读者值得一看——它直接关系到训练数据的合规性和行业竞争规则。原文
10:45IT之家(博客/媒体)精选76°深圳河套学院联合哈工大、华为等团队,依托华为昇腾910C国产AI算力集群,成功完成1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。这是全球第三方机构首次在国产算力平台上完成如此规模的模型训练,模型算力利用率超过30%,关键训练算子效率提升14%,达到工业级运行标准。该成果证明国产AI芯片已能支撑世界级超大参数模型训练,为国产算力生态积累了重要经验。AI模型华为昇腾910C国产算力万亿参数大模型DeepSeek-V4-Pro模型训练推荐理由:国产芯片终于能跑万亿参数大模型了,做AI基础设施和模型训练的团队值得关注——这证明昇腾910C已具备工业级训练能力,后续国产替代路径更清晰。原文
17:15IT之家(博客/媒体)72°北京大学数学科学学院2007级校友、宾夕法尼亚大学沃顿商学院副教授苏炜杰在社交平台宣布正式加入OpenAI,目前处于沃顿休学期间,将参与AI模型训练。苏炜杰是统计学界最高荣誉COPSS会长奖(被誉为“统计学诺奖”)的2026年得主,也是14年来首位获此奖项的华人学者。他的研究方向涵盖机器学习、差分隐私数据保护和高维统计,其差分隐私工作已成功应用于2020年美国人口普查。今年以来,已有陈立杰、庞若鸣、张鹏川等多位华裔顶尖AI学者加盟OpenAI。行业OpenAI苏炜杰统计学诺奖差分隐私模型训练10 个信源在谈推荐理由:苏炜杰是统计学界顶级奖项得主,他的加入意味着OpenAI在模型训练和隐私保护方向持续加码,做AI基础研究和数据安全的从业者值得关注这位新成员的动向。原文
00:33Google Developers Blog(博客/媒体)Google在Orbax和MaxText中引入了持续检查点功能,旨在平衡模型训练的可靠性与性能。传统固定频率检查点要么牺牲可靠性,要么成为性能瓶颈。持续检查点通过异步方式,仅在上一次保存成功后启动新保存操作,最大化I/O带宽并降低故障风险。基准测试显示,该方法显著减少检查点间隔,在大规模训练中(平均故障间隔短)能大幅节约资源。AI模型模型训练可靠性检查点OrbaxMaxText推荐理由:对于大规模训练任务,持续检查点能有效提升资源利用率和系统稳定性,是应对硬件故障、优化训练吞吐量的实用方案。原文