精选 AI 资讯 · AI 热点

7月1日

01:23

NVIDIA AI@NVIDIAAI

精选

NVIDIA TAO 7 允许用户用自然语言向编码代理描述需求，自动执行模型调优。其 Agent 技能可接入编码代理并提升准确率，AutoML 自动搜索超参数，LLM 引导调优比传统方法快 2 倍。支持在本地 NVIDIA GPU 上微调任何 Hugging Face 的 CV 或 VLM 模型，数据增强微调能帮助代理识别失败原因并修复。

AI产品 NVIDIA TAO AutoML 微调编码代理 Hugging Face

推荐理由：NVIDIA 发布了 TAO 7，你只需用大白话告诉编码代理要啥，它就能自己调模型，比手动调参快两倍，还能本地跑 Hugging Face 模型。

原文

6月30日

03:05

@koltregaskes@koltregaskes

精选

前沿模型成本上升、令牌使用量攀升以及近期禁令，使企业自建AI变得更加必要。通过下载Llama或Qwen等开源模型，使用LoRA在自有数据上微调，部署在自有基础设施，可一次性计算成本取代按席收费。Hugging Face和LoRA已降低技术门槛，关键在于管理层是否将其视为基础设施投资而非普通软件开支。

行业 Llama Qwen LoRA Hugging Face 微调

推荐理由：前沿模型越来越贵还被禁，自己微调Llama或Qwen更可控，一次性投入省月费，数据也安全。

原文

6月29日

00:01

Clement Delangue@ClementDelangue

精选

Hugging Face CEO Clement Delangue认为，当前最危险的AI系统是闭源前沿API模型（如通过编程助手分发的LLM），它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级：易于分析、能力较弱、传播更可控，且保护者与攻击者平等获取。监管前沿API只需针对少数巨头，成本低且容易执行；监管开源则会伤害小企业、研究者、大学等群体，并降低透明度。

行业 Hugging Face 开源模型 AI监管前沿模型

推荐理由：Hugging Face CEO直言政府该管闭源API而不是开源模型，点出了监管争论中被忽略的黑箱风险。

原文

6月27日

11:39

marktechpost@Sana Hassan

精选

本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集，无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。

技巧 NVIDIA Open-SWE-Traces Hugging Face 微调编程助手

推荐理由：想自己动手做代码智能体微调数据？这教程手把手教你解析NVIDIA开源的Open-SWE-Traces，连Token预算和工具使用指标都算好了。

原文

6月26日

16:55

Geek@geekbb

精选

NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本，命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供，限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。

AI模型 nvidia/GLM-5.2-NVFP4 智谱 NVIDIA Hugging Face 推理模型

推荐理由：NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度，放 Hugging Face 上免费调，还能白嫖，日常推理够用了。

原文

6月24日

02:03

Clement Delangue@ClementDelangue

精选

Hugging Face 的数据存储能力正在快速扩张，公共机器人数据集从 2025 年初的 1,000 个增长到了 60,000 个，私有数据集数量是公共的两倍。单个机器人以 140 MB/s 持续记录数据，全天不休。通过从 Hub 直接流式传输并使用预缓存，GPU 吞吐量可从闲置时的 0 MB/s 跃升至约 1,326 MB/s。LeRobot 配合 Hugging Face Storage Buckets 实现了这一优化方案。

AI产品 Hugging Face LeRobot 存储桶机器人数据 GPU流式传输

推荐理由：Hugging Face 悄悄把存储和流式传输做到极致，机器人数据从1千到6万，GPU跑满1326 MB/s，不闲置了。

原文

6月23日

16:51

16:51Hugging Face: Blog（博客/媒体）

精选

Hugging Face将huggingface_hub库的发布频率从每两个月一次提升至每周一次。流程中利用GPT-4自动生成发布说明，通过GitHub Actions运行超过2000项测试，并由人类维护者进行最终审核。该方案使版本迭代速度提升8倍，同时保持稳定性。

技巧 huggingface_hub Hugging Face GPT-4 GitHub Actions 自动发布

推荐理由：Hugging Face分享了他们如何用GPT-4和GitHub Actions把库发布从两个月一次提速到每周一次，还保留了人工把关，挺实用的经验。

原文

6月19日

04:25

Clement Delangue@ClementDelangue

精选

AI模型 Poolside Laguna M.1 Hugging Face 开源模型长上下文

推荐理由：Poolside 把最强的 Laguna M.1 模型完全开放了，256K 上下文，Apache 2.0 许可，直接去 Hugging Face 下载权重用。

原文

6月17日

13:28

Geek@geekbb

精选

介绍了一个工具，可在Apple Silicon Mac上通过MLX框架本地运行大语言模型。用户能从Hugging Face搜索并下载模型，用MLX进行离线推理，并启动一个OpenAI兼容的API服务。这样就能用curl或OpenAI客户端库调用本地模型。

技巧 MLX Hugging Face OpenAI兼容API 本地推理教程

推荐理由：想在Mac上本地跑大模型、不用联网？这个工具能从Hugging Face下模型，用MLX推理，还直接开个OpenAI API，当本地服务使。

原文

6月12日

01:36

Clement Delangue@ClementDelangue

精选

Hugging Face 宣布其存储平台已成为私有和公开模型及数据集的最佳选择，支持中间和最终版本。以 @heyjasperai 为例，他们使用 HF 存储桶存储 Monet 数据集并直接在其上训练模型。这展示了 HF 在 AI 存储和训练工作流中的一体化能力。对于需要管理大型模型和数据集的团队，HF 提供了便捷的存储和训练集成方案。

AI产品 Hugging Face 存储平台数据集模型训练 AI 基础设施

推荐理由：Hugging Face 将存储与训练无缝集成，管理模型和数据集的团队可以直接在平台上完成从存储到训练的全流程，省去多平台切换的麻烦。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

01:42

Thomas Wolf@Thom_Wolf

精选72°

Hugging Face 与 Mecado 合作推出 CADGenBench，一个用于评估 AI 生成和编辑 CAD 模型的基准测试。该基准测试包含两个任务：从工程图纸生成有效的 3D CAD 模型，以及根据变更请求编辑 STEP 文件。它不依赖特定工具，支持 Fusion、Onshape、build123d、SolidWorks 等多种 CAD 软件，提交格式统一为 STEP 文件。评分维度包括几何精度、拓扑正确性、接口兼容性和 CAD 有效性。基准测试已开源，排行榜实时更新，旨在推动 AI 在工程领域的精确应用。

AI产品 CAD 基准测试工程图纸 3D模型 Hugging Face

推荐理由：AI 终于开始认真对待工程图纸了——CADGenBench 为评估 AI 生成精确 3D 零件提供了标准化工具，做 CAD 开发或工程自动化的团队可以直接用这个基准测试来验证自己的模型。

原文

6月8日

22:52

Philipp Schmid@_philschmid

精选72°

Google 发布了新的 Gemma 4 QAT（量化感知训练）检查点，在保持相似性能的同时，将内存占用降低约 4 倍。该版本引入了一种新的移动端量化格式，将 Gemma 4 E2B 的内存占用降至仅 1GB。QAT 通过在训练过程中模拟低精度运算，实现无损量化，从而得到更小、更快的模型。这些检查点已在 Hugging Face 上提供，可直接运行。

AI模型 Gemma 4 QAT 量化移动端部署 Hugging Face

推荐理由：做移动端或边缘部署的开发者终于可以跑 Gemma 4 了——内存降到 1GB 意味着手机和 IoT 设备也能用，建议直接去 Hugging Face 拉下来试试。

原文

6月2日

10:35

Julien Chaumond@julien_c

精选

Hugging Face 发布了新的文档页面，支持在 Hub 上渲染 Agent Traces（智能体追踪）。这意味着开发者可以更直观地查看和分析 AI 智能体的运行轨迹、决策过程与中间结果。该功能有助于调试和优化智能体行为，提升开发效率。文档页已上线，可直接访问使用。

AI产品智能体 Hugging Face Agent Traces 调试工具文档

推荐理由：做智能体开发和调试的团队，终于能在 Hub 上可视化 Agent Traces 了，省去自己搭日志系统的麻烦，值得直接去试试。

原文

10:20

Clement Delangue@ClementDelangue

精选

Hugging Face 联合创始人 Clement Delangue 在 X 上分享，他仅用不到 1 分钟就将一个 68TB 的数据集克隆到自己的私有训练存储桶中，而本地磁盘只有 4TB。这得益于 Hugging Face 的基础设施优化和 xet 去重技术。该功能让用户无需下载完整数据集即可直接使用，大幅节省时间和存储空间。对于需要大规模数据集的 AI 训练团队来说，这是一个效率提升的利器。

AI产品 Hugging Face 数据集克隆去重基础设施

推荐理由：做大规模 AI 训练的团队终于可以告别下载整个数据集的痛苦——68TB 数据集 1 分钟克隆到私有存储，建议所有需要管理海量数据的开发者点开看看。

原文

6月1日

15:07

NVIDIA AI@NVIDIAAI

精选

NVIDIA 宣布其 Cosmos 3 模型完全开源，包括模型权重和训练配方。该模型已在 Hugging Face 上发布，供开发者自由使用。此举延续了 NVIDIA 在 AI 领域开放生态的策略，旨在推动更多创新应用。Cosmos 3 的开放将加速研究者和工程师在视觉、语言等多模态任务上的探索。

AI模型开源/仓库多模态模型 NVIDIA Cosmos 3 Hugging Face

推荐理由：NVIDIA 把 Cosmos 3 的权重和训练配方全开源了，做多模态研究的团队可以直接下载使用，省去从头训练的算力成本，值得点开看看。

原文

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

5月28日

22:05

Clement Delangue@ClementDelangue

精选83°

Hugging Face 科学团队在 TRL 库中实现了一种新的异步强化学习权重同步方法，将每次同步的带宽成本降低约 100 倍。核心洞察是：在 RL 步骤之间，约 99% 的 bf16 权重是比特相同的，只有极少部分发生变化。他们只将变化的元素编码为稀疏 safetensors 文件，通过 Hugging Face Bucket 传输，而不是传输整个权重文件。以 Qwen3-0.6B 为例，每次步骤的传输量从 1.2 GB 降至 20-35 MB。这意味着不再需要共享集群、RDMA、VPN 或跨云 NCCL，只需一个 GPU 和一个 Hugging Face 账号即可进行真正的分离式 RL 训练。

AI产品强化学习权重同步 Hugging Face TRL 分布式训练

推荐理由：做分布式 RL 训练的团队终于可以告别昂贵的带宽和复杂的基础设施——只需 HTTPS 和一个 Bucket，就能实现跨区域的推理集群同步，建议搞 RL 的开发者直接看原文。

原文

5月27日

10:59

10:59IT之家（博客/媒体）

精选

Hugging Face 于 5 月 21 日发布 LeRobot Humanoid 双足机器人项目，面向机器人开发者和研究人员，起步价 2500 美元。该项目非成品，需自行组装，旨在提供可理解、可维修、可加装传感器的开源平台。硬件部分大量使用 3D 打印件和现成元件，软件部分提供校准、控制工具并支持仿真。团队鼓励先在仿真中训练动作，再在真实机体上测试，数据可反哺仿真环境。后续计划加入上半身集成和更高级行为。

AI产品机器人开源/仓库 3D 打印仿真 Hugging Face

推荐理由：Hugging Face 把双足机器人的门槛从几十万降到 2500 美元，做机器人研究的团队和学生可以直接用开源方案动手组装和训练，省去从零搭建的麻烦。

原文

5月20日

21:51

berryxia@berryxia

精选

PaddleOCR 3.5 正式发布，支持 Transformers 作为推理后端，PP-OCRv5 和 PaddleOCR-VL 1.5 模型可直接在 Hugging Face 生态中运行。此前将 PaddleOCR 集成到 RAG 或 Document AI 项目需要额外搭建服务栈，现在流程大幅简化。Hugging Face 团队参与了合作，使得 OCR 工具与主流 Transformer 生态无缝对接。输出结果更精准可靠，无需依赖 LLM 来补充。

AI产品 PaddleOCR Hugging Face OCR Transformers 文档智能

推荐理由：做文档智能或 RAG 的团队终于不用在 OCR 和 Transformer 之间搭桥了，PaddleOCR 3.5 直接跑在 Hugging Face 上，省掉一堆服务栈，建议做 Document AI 的开发者点开试试。

原文

5月18日

22:29

22:29Hugging Face: Blog（博客/媒体）

精选76°

IBM Research 在 Hugging Face 上推出了 Open Agent Leaderboard，这是一个用于评估 AI 智能体性能的公开排行榜。该排行榜通过一系列标准化任务测试智能体的规划、工具使用和推理能力，旨在为开发者提供可复现的基准。目前已有多个主流模型参与评测，包括 GPT-4、Claude 等。这一举措有助于推动智能体领域的透明化和标准化，让开发者能更直观地比较不同智能体的实际表现。

行业智能体排行榜 IBM Hugging Face 评估基准

推荐理由：智能体评估一直缺乏统一标准，IBM 这个排行榜让开发者能直接对比不同模型的规划与工具使用能力，做智能体应用的团队值得关注。

原文

5月16日

19:14

AI Engineer@aiDotEngineer

精选73°

开源模型 GLM 5.1 在 Artificial Analysis 智能指数上超越闭源模型，差距持续缩小。权重开放意味着可以在不离开基础设施的情况下进行量化、微调和边缘部署。Hugging Face 生态已为智能体工作构建：推理提供商支持工具路由、按 SWE bench 分数过滤的基准数据集、存储智能体会话的追踪仓库类型，以及可插入编码智能体的技能。现场演示中，Claude Code 被要求微调一个视觉语言模型，智能体自动计算 VRAM 需求、选择实例并启动任务，将过去需要一天的手工计算变为一个提示。

AI模型 GLM 5.1 开源模型智能体 Hugging Face 微调

推荐理由：开源模型首次在权威指数上超越闭源模型，做模型部署和微调的团队可以直接利用权重优势，而 Hugging Face 的智能体生态让训练任务自动化成为现实——建议点开看 Claude Code 如何一键微调模型。

原文