05:49@koltregaskes@koltregaskes72°据x平台用户确认,Grok 2T运行已开始训练,计划七月完成,八月正式发布。此前有传言称下一代训练规模为3T,但该消息被指为猜测。马斯克作为xAI及特斯拉CEO,其公开预测需更加谨慎,以免影响投资者信心。AI模型GrokxAI模型训练发布时间推荐理由:x平台爆料Grok 2T开始训练,预计8月上线,比之前传的3T规模小一点。想蹲新模型的话可以关注这个时间点。原文
13:51Jasper AI@heyjasperaiJasper将Hugging Face基础设施用于其MONET系统的数据创建和存储。该方法针对随时间更新的大型训练数据集进行了优化。Jasper团队通过HF实现了更高效的数据管道管理。这一案例展示了HF在训练数据工作流中的实际应用。技巧JasperHugging FaceMONET数据管道模型训练推荐理由:看看Jasper怎么用Hugging Face当MONET的数据后台,对做大模型训练数据管道的团队很有启发。原文
13:49Microsoft AI@MicrosoftAI微软AI在推文中介绍了构建编码模型的全流程,包括训练阶段的优化策略、评估方法、性能调优、安全性考量以及收集真实开发者反馈。文章深入展示了从模型设计到部署的每个环节,帮助理解如何让编码模型适配开发者的实际工作场景。AI模型微软AI编码模型模型训练AI安全编程助手推荐理由:微软AI分享了他们训练编码模型的实战细节,从评估到安全都有,做编程助手的人值得看看。原文
13:48岚叔@lufzzliz推文作者表达了对xAI下一代模型Grok 4.5的强烈期待。作者认为xAI可能拥有过多计算资源用于Grok 4.5的训练。希望Grok 4.5能训练得更出色并支持SpaceX。行业Grok 4.5xAISpaceX模型训练4 个信源在谈推荐理由:这位网友对Grok 4.5很有信心,还调侃xAI显卡太多不如自己用。看看民间对xAI新模型的态度。原文
07:11OpenAI@OpenAIOpenAI通过少量训练数据使模型在53项独立评估中的44项上取得改进,涵盖欺骗、奖励黑客、安全、健康、心理健康等领域。该表现优于计算匹配的基线模型。评估涉及多种领域、任务格式和评分方案。论文OpenAI对齐AI安全模型训练10 个信源在谈推荐理由:OpenAI发现用一点额外数据就能让模型在超多对齐测试里变好,覆盖欺骗、安全、健康等方面,挺牛的。原文
07:10OpenAI@OpenAIOpenAI在真实对话中训练模型,通过强化学习强化诚实、谦逊、开放纠正、公平和关怀人类福祉等特质。该训练覆盖健康、科学、教育等12个领域,旨在提升模型的对齐与安全性。方法基于RLHF改进,专注对话场景中的具体行为。AI模型OpenAI强化学习AI安全对齐模型训练10 个信源在谈推荐理由:OpenAI训练模型时不止看能力,还用强化学习专门教它诚实、谦逊、愿意接受批评,覆盖12个领域,对AI安全性很有意义。原文
09:34Fireworks AI@FireworksAI_HQKimi 2.7 现已完全在 Fireworks 上可训练,支持 SFT、DPO、RL 等训练方式。用户可以使用自己的数据微调模型,构建比前沿模型成本更低的护城河。Fireworks 提供托管点击或原始 API,支持大上下文和巨大 LoRA 秩。AI产品Kimi 2.7Fireworks微调模型训练推荐理由:Fireworks 让你拿 Kimi 2.7 自己训练,便宜还能干翻前沿模型,想定制模型的赶紧试试。原文
00:07Cursor@cursor_ai83°SpaceX以全股票交易收购Cursor AI,旨在构建全球最有用的AI模型。过去几个月,SpaceXAI与Cursor已联合训练一个模型。该模型将发布在Cursor和Grok Build中。合作将推动Cursor能力显著提升。行业SpaceXCursor收购Grok模型训练10 个信源在谈推荐理由:SpaceX收购了Cursor,以后编程时能用上SpaceX训练的模型,效率可能会大幅提升。原文
23:31IT之家(博客/媒体)71°开发者@0x0SojalSec 绕过苹果M4神经网络引擎的软件限制,通过逆向工程使用自定义MIL(模型中间语言)直接与芯片通信,没有调用Core ML、Metal或GPU。训练数据全程放在RAM中运行,不写入NAND闪存,速度更快。解锁后M4在iPad或Mac上可达到15.8TFLOPS的AI处理性能,用于训练模型。目前自定义MIL能否用于更新的Apple Silicon尚不明确。技巧M4Apple Silicon神经网络引擎模型训练逆向工程推荐理由:有个开发者自己写了一套代码,把M4芯片的AI训练能力全开出来了,不用苹果官方工具,跑到了15.8TFLOPS。想用iPad或Mac训练模型的人可以看看。原文
13:34Thinking Machines Lab@thinkymachines83°Think Machines 宣布与 NVIDIA 合作,利用其硬件和平台来训练前沿模型,并提供可定制的 AI 解决方案。这一合作将加速模型训练效率,降低开发门槛,使企业能够更灵活地部署定制化 AI。NVIDIA 的算力支持将帮助 Think Machines 在竞争激烈的 AI 市场中提升模型性能。行业NVIDIAThink Machines模型训练AI 定制合作10 个信源在谈推荐理由:NVIDIA 与 Think Machines 的合作意味着更强大的算力支持,做模型训练和定制 AI 的团队可以关注这一进展,看看能否利用其平台加速自己的项目。原文
01:36Clement Delangue@ClementDelangue精选Hugging Face 宣布其存储平台已成为私有和公开模型及数据集的最佳选择,支持中间和最终版本。以 @heyjasperai 为例,他们使用 HF 存储桶存储 Monet 数据集并直接在其上训练模型。这展示了 HF 在 AI 存储和训练工作流中的一体化能力。对于需要管理大型模型和数据集的团队,HF 提供了便捷的存储和训练集成方案。AI产品Hugging Face存储平台数据集模型训练AI 基础设施推荐理由:Hugging Face 将存储与训练无缝集成,管理模型和数据集的团队可以直接在平台上完成从存储到训练的全流程,省去多平台切换的麻烦。原文
12:27rohanpaul_ai@rohanpaul_ai来自斯坦福、MIT、哈佛和 Anthropic 的联合研究揭示了大型语言模型能学会小模型无法掌握的技能的根本原因:大模型在训练过程中更不容易遗忘稀有技能。其额外容量能保护弱学习信号,而小模型的有限神经元会被常见任务占据,导致稀有任务在学习信号出现足够多次之前就被覆盖。研究通过控制实验和 OLMo 模型(4M 到 4B 参数)验证了这一结论,发现大模型在低频任务上表现更好,能保留更多任务特征,且梯度干扰更小。该论文为模型规模与能力涌现之间的关系提供了清晰的训练层面解释。论文大模型模型训练涌现能力稀有任务scaling law5 个信源在谈推荐理由:做模型训练或理解 scaling law 的团队值得一读——这篇论文把大模型涌现能力的机制讲清楚了,不是玄学而是容量与干扰的数学问题。原文
19:45Decoder@Matthias Bastian72°据报道,马斯克的 xAI 使用 Anthropic 的 Claude 模型输出来训练自己的编程模型,持续了数月。在 Anthropic 切断访问后,xAI 仍通过私人账户和 Blackbox AI 服务继续使用。与此同时,xAI 的预训练团队缩减至不到五人,多名负责人离职。马斯克购买的算力现在被租给 Anthropic 和 Google,而非用于自己的模型训练。这一事件揭示了 AI 行业在模型训练数据使用上的灰色地带和竞争紧张关系。行业xAIClaude模型训练数据合规AI 竞争10 个信源在谈推荐理由:这件事暴露了 AI 大模型训练中数据来源的灰色操作,做模型训练的团队和关注 AI 伦理的读者值得一看——它直接关系到训练数据的合规性和行业竞争规则。原文
10:45IT之家(博客/媒体)精选76°深圳河套学院联合哈工大、华为等团队,依托华为昇腾910C国产AI算力集群,成功完成1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。这是全球第三方机构首次在国产算力平台上完成如此规模的模型训练,模型算力利用率超过30%,关键训练算子效率提升14%,达到工业级运行标准。该成果证明国产AI芯片已能支撑世界级超大参数模型训练,为国产算力生态积累了重要经验。AI模型华为昇腾910C国产算力万亿参数大模型DeepSeek-V4-Pro模型训练推荐理由:国产芯片终于能跑万亿参数大模型了,做AI基础设施和模型训练的团队值得关注——这证明昇腾910C已具备工业级训练能力,后续国产替代路径更清晰。原文
16:51向阳乔木@vista8Laten Space 访谈了 Ethan He,分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度,质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注,GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层,在脑机接口普及前,最自然的交互方式是用户说话、AI 用生成式画面回应。行业模型训练迭代速度GPT Image扩散模型人机交互推荐理由:Ethan He 把模型训练和交互设计的底层逻辑讲透了,做模型训练或产品设计的开发者看完会有启发,特别是关于迭代速度和交互未来的观点值得反复琢磨。原文
17:15IT之家(博客/媒体)72°北京大学数学科学学院2007级校友、宾夕法尼亚大学沃顿商学院副教授苏炜杰在社交平台宣布正式加入OpenAI,目前处于沃顿休学期间,将参与AI模型训练。苏炜杰是统计学界最高荣誉COPSS会长奖(被誉为“统计学诺奖”)的2026年得主,也是14年来首位获此奖项的华人学者。他的研究方向涵盖机器学习、差分隐私数据保护和高维统计,其差分隐私工作已成功应用于2020年美国人口普查。今年以来,已有陈立杰、庞若鸣、张鹏川等多位华裔顶尖AI学者加盟OpenAI。行业OpenAI苏炜杰统计学诺奖差分隐私模型训练10 个信源在谈推荐理由:苏炜杰是统计学界顶级奖项得主,他的加入意味着OpenAI在模型训练和隐私保护方向持续加码,做AI基础研究和数据安全的从业者值得关注这位新成员的动向。原文
16:11Fireworks AI@FireworksAI_HQ76°Cursor 团队没有通过提示工程优化 Composer 2.5,而是直接训练了模型。他们与 Fireworks 合作,在 Fireworks 上运行大规模强化学习(RL)滚动,同时进行生产推理。Fireworks 强调,到 2027 年,训练自己的模型是维持竞争护城河的唯一方式。这一做法展示了从提示工程到模型训练的转变趋势。AI产品CursorComposer 2.5强化学习模型训练Fireworks10 个信源在谈推荐理由:Cursor 用 RL 训练模型而非提示工程,给 AI 产品团队一个关键信号:2027 年后,训练自己的模型才是护城河。做 AI 应用开发的建议点开,看看他们怎么和 Fireworks 合作跑 RL 滚动。原文
00:38TestingCatalog@testingcatalog78°SPACEXAI 宣布基于 1.5T V9 基础模型的新版 Grok 已完成训练,预计今年夏季推出重大升级。团队还计划在补充训练中加入 Cursor 数据,进一步提升模型性能。这一进展意味着 Grok 将在对话、推理等能力上迎来显著提升,值得关注。AI模型GrokSPACEXAI1.5T V9模型训练夏季升级4 个信源在谈推荐理由:Grok 的 1.5T 参数模型完成训练,AI 对话和推理能力将迎来飞跃,关注大模型进展的开发者可以提前关注今夏的发布。原文
01:10AlphaSignal@AlphaSignalAI70°Hugging Face 开源了一个 CLI 智能体,能自动执行机器学习工程师的完整研究循环:从阅读论文、追踪引用,到拉取数据集、编写训练脚本,再到启动 GPU 任务并迭代优化。在科学推理任务中,它训练 Qwen3-1.7B 将 GPQA 得分从 10% 提升至 32%,超越 Claude Code 的 22.99%。在医疗领域,它因公开数据集质量不足,自动生成 1100 个合成样本并上采样 50 倍,在 HealthBench 上比 Codex 高出 60%。该智能体还具备自主诊断失败评估、恢复训练的能力,以 CLI 和 Web 应用形式提供,甚至可在手机上运行。AI产品Hugging FaceCLI 智能体开源/仓库自动化研究模型训练推荐理由:Hugging Face 这个开源智能体把 ML 研究全流程自动化了,做实验的团队可以直接用它跑论文复现和模型训练,省掉大量手动调参和写脚本的时间。原文
00:33Google Developers Blog(博客/媒体)Google在Orbax和MaxText中引入了持续检查点功能,旨在平衡模型训练的可靠性与性能。传统固定频率检查点要么牺牲可靠性,要么成为性能瓶颈。持续检查点通过异步方式,仅在上一次保存成功后启动新保存操作,最大化I/O带宽并降低故障风险。基准测试显示,该方法显著减少检查点间隔,在大规模训练中(平均故障间隔短)能大幅节约资源。AI模型模型训练可靠性检查点OrbaxMaxText推荐理由:对于大规模训练任务,持续检查点能有效提升资源利用率和系统稳定性,是应对硬件故障、优化训练吞吐量的实用方案。原文
21:55Together AI@togethercomputeTogether AI在X平台发布了一款新的开源工具包,旨在简化AI模型的训练和部署流程。该工具包支持多种主流模型架构,并提供了优化后的分布式训练功能。这一发布有助于降低中小团队使用大模型的门槛,推动AI技术的普及。AI产品开源/仓库模型训练Together AI推荐理由:对于AI开发者和研究团队,该工具包提供了实用功能,可提升模型开发效率,值得关注其后续更新。原文