全部 AI 动态 · AI 热点

6月27日

11:39

11:39

marktechpost@Sana Hassan

精选

本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集，无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。

技巧 NVIDIA Open-SWE-Traces Hugging Face 微调编程助手

推荐理由：想自己动手做代码智能体微调数据？这教程手把手教你解析NVIDIA开源的Open-SWE-Traces，连Token预算和工具使用指标都算好了。

6月25日

00:51

00:51Hugging Face: Blog（博客/媒体）

精选

NVIDIA 发布 NeMo AutoModel，通过自动化模型并行、混合精度训练和梯度检查点，简化 Transformer 模型微调流程。该工具可自动检测硬件配置，支持多 GPU 分布式训练，无需手动调整参数。在微调 BERT-base 模型时，相比标准 PyTorch 实现，NeMo AutoModel 将训练时间缩短约 40%，并保持相同精度。

技巧 NVIDIA NeMo AutoModel Transformer 微调

推荐理由：NVIDIA 搞了个 NeMo AutoModel，能自动帮你加速微调 Transformer 模型，省去手动调参的麻烦，速度还快很多，适合想快速出结果的人。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

22:32

22:32Hugging Face: Blog（博客/媒体）

NVIDIA 发布了 Nemotron 3.5 ASR 模型的微调指南，帮助开发者将通用语音识别模型适配到特定语言、专业领域或口音。该模型基于 Whisper 架构优化，支持低资源语言和噪声环境。指南提供了从数据准备、训练配置到部署的完整流程，并强调使用 LoRA 等高效微调方法降低计算成本。这对于需要高精度语音识别的垂直场景（如医疗、金融、客服）尤其有价值。

AI模型语音识别 ASR Nemotron 微调 NVIDIA

推荐理由：NVIDIA 把 ASR 微调的门槛降下来了，做语音应用的团队（尤其是非英语场景或专业领域）可以直接参考这套流程，省去大量试错成本。

6月3日

08:51

08:51

marktechpost@Sana Hassan

精选

本教程详细介绍了在Google Colab上使用QLoRA和DPO微调LFM2模型的完整步骤。步骤包括使用TRL库进行监督微调（SFT），然后应用DPO算法优化，最后合并适配器。教程提供了可运行的代码和详细解释，适合有基础的用户实践。所有操作在免费的Colab环境下完成。

技巧 LFM2 QLoRA DPO Google Colab TRL PEFT 微调

推荐理由：手把手教你微调LFM2，用Colab免费跑