01:23NVIDIA AI@NVIDIAAI精选NVIDIA TAO 7 允许用户用自然语言向编码代理描述需求,自动执行模型调优。其 Agent 技能可接入编码代理并提升准确率,AutoML 自动搜索超参数,LLM 引导调优比传统方法快 2 倍。支持在本地 NVIDIA GPU 上微调任何 Hugging Face 的 CV 或 VLM 模型,数据增强微调能帮助代理识别失败原因并修复。AI产品NVIDIA TAOAutoML微调编码代理Hugging Face4 个信源在谈推荐理由:NVIDIA 发布了 TAO 7,你只需用大白话告诉编码代理要啥,它就能自己调模型,比手动调参快两倍,还能本地跑 Hugging Face 模型。原文
03:05@koltregaskes@koltregaskes精选前沿模型成本上升、令牌使用量攀升以及近期禁令,使企业自建AI变得更加必要。通过下载Llama或Qwen等开源模型,使用LoRA在自有数据上微调,部署在自有基础设施,可一次性计算成本取代按席收费。Hugging Face和LoRA已降低技术门槛,关键在于管理层是否将其视为基础设施投资而非普通软件开支。行业LlamaQwenLoRAHugging Face微调推荐理由:前沿模型越来越贵还被禁,自己微调Llama或Qwen更可控,一次性投入省月费,数据也安全。原文
00:01Clement Delangue@ClementDelangue精选Hugging Face CEO Clement Delangue认为,当前最危险的AI系统是闭源前沿API模型(如通过编程助手分发的LLM),它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级:易于分析、能力较弱、传播更可控,且保护者与攻击者平等获取。监管前沿API只需针对少数巨头,成本低且容易执行;监管开源则会伤害小企业、研究者、大学等群体,并降低透明度。行业Hugging Face开源模型AI监管前沿模型推荐理由:Hugging Face CEO直言政府该管闭源API而不是开源模型,点出了监管争论中被忽略的黑箱风险。原文
11:39marktechpost@Sana Hassan精选本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集,无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。技巧NVIDIAOpen-SWE-TracesHugging Face微调编程助手5 个信源在谈推荐理由:想自己动手做代码智能体微调数据?这教程手把手教你解析NVIDIA开源的Open-SWE-Traces,连Token预算和工具使用指标都算好了。原文
16:55Geek@geekbb精选NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本,命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供,限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。AI模型nvidia/GLM-5.2-NVFP4智谱NVIDIAHugging Face推理模型4 个信源在谈推荐理由:NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度,放 Hugging Face 上免费调,还能白嫖,日常推理够用了。原文
02:03Clement Delangue@ClementDelangue精选Hugging Face 的数据存储能力正在快速扩张,公共机器人数据集从 2025 年初的 1,000 个增长到了 60,000 个,私有数据集数量是公共的两倍。单个机器人以 140 MB/s 持续记录数据,全天不休。通过从 Hub 直接流式传输并使用预缓存,GPU 吞吐量可从闲置时的 0 MB/s 跃升至约 1,326 MB/s。LeRobot 配合 Hugging Face Storage Buckets 实现了这一优化方案。AI产品Hugging FaceLeRobot存储桶机器人数据GPU流式传输推荐理由:Hugging Face 悄悄把存储和流式传输做到极致,机器人数据从1千到6万,GPU跑满1326 MB/s,不闲置了。原文
16:51Hugging Face: Blog(博客/媒体)精选Hugging Face将huggingface_hub库的发布频率从每两个月一次提升至每周一次。流程中利用GPT-4自动生成发布说明,通过GitHub Actions运行超过2000项测试,并由人类维护者进行最终审核。该方案使版本迭代速度提升8倍,同时保持稳定性。技巧huggingface_hubHugging FaceGPT-4GitHub Actions自动发布推荐理由:Hugging Face分享了他们如何用GPT-4和GitHub Actions把库发布从两个月一次提速到每周一次,还保留了人工把关,挺实用的经验。原文
04:25Clement Delangue@ClementDelangue精选Poolside 发布了其最新模型 Laguna M.1,拥有 256K 上下文长度。该模型采用 Apache 2.0 许可,权重已开放至 Hugging Face。包括基础版和微调版检查点可供下载。AI模型PoolsideLaguna M.1Hugging Face开源模型长上下文2 个信源在谈推荐理由:Poolside 把最强的 Laguna M.1 模型完全开放了,256K 上下文,Apache 2.0 许可,直接去 Hugging Face 下载权重用。原文
13:28Geek@geekbb精选介绍了一个工具,可在Apple Silicon Mac上通过MLX框架本地运行大语言模型。用户能从Hugging Face搜索并下载模型,用MLX进行离线推理,并启动一个OpenAI兼容的API服务。这样就能用curl或OpenAI客户端库调用本地模型。技巧MLXHugging FaceOpenAI兼容API本地推理教程3 个信源在谈推荐理由:想在Mac上本地跑大模型、不用联网?这个工具能从Hugging Face下模型,用MLX推理,还直接开个OpenAI API,当本地服务使。原文
01:36Clement Delangue@ClementDelangue精选Hugging Face 宣布其存储平台已成为私有和公开模型及数据集的最佳选择,支持中间和最终版本。以 @heyjasperai 为例,他们使用 HF 存储桶存储 Monet 数据集并直接在其上训练模型。这展示了 HF 在 AI 存储和训练工作流中的一体化能力。对于需要管理大型模型和数据集的团队,HF 提供了便捷的存储和训练集成方案。AI产品Hugging Face存储平台数据集模型训练AI 基础设施推荐理由:Hugging Face 将存储与训练无缝集成,管理模型和数据集的团队可以直接在平台上完成从存储到训练的全流程,省去多平台切换的麻烦。原文
01:42Thomas Wolf@Thom_Wolf精选72°Hugging Face 与 Mecado 合作推出 CADGenBench,一个用于评估 AI 生成和编辑 CAD 模型的基准测试。该基准测试包含两个任务:从工程图纸生成有效的 3D CAD 模型,以及根据变更请求编辑 STEP 文件。它不依赖特定工具,支持 Fusion、Onshape、build123d、SolidWorks 等多种 CAD 软件,提交格式统一为 STEP 文件。评分维度包括几何精度、拓扑正确性、接口兼容性和 CAD 有效性。基准测试已开源,排行榜实时更新,旨在推动 AI 在工程领域的精确应用。AI产品CAD基准测试工程图纸3D模型Hugging Face推荐理由:AI 终于开始认真对待工程图纸了——CADGenBench 为评估 AI 生成精确 3D 零件提供了标准化工具,做 CAD 开发或工程自动化的团队可以直接用这个基准测试来验证自己的模型。原文
22:52Philipp Schmid@_philschmid精选72°Google 发布了新的 Gemma 4 QAT(量化感知训练)检查点,在保持相似性能的同时,将内存占用降低约 4 倍。该版本引入了一种新的移动端量化格式,将 Gemma 4 E2B 的内存占用降至仅 1GB。QAT 通过在训练过程中模拟低精度运算,实现无损量化,从而得到更小、更快的模型。这些检查点已在 Hugging Face 上提供,可直接运行。AI模型Gemma 4QAT量化移动端部署Hugging Face1 个信源在谈推荐理由:做移动端或边缘部署的开发者终于可以跑 Gemma 4 了——内存降到 1GB 意味着手机和 IoT 设备也能用,建议直接去 Hugging Face 拉下来试试。原文
10:35Julien Chaumond@julien_c精选Hugging Face 发布了新的文档页面,支持在 Hub 上渲染 Agent Traces(智能体追踪)。这意味着开发者可以更直观地查看和分析 AI 智能体的运行轨迹、决策过程与中间结果。该功能有助于调试和优化智能体行为,提升开发效率。文档页已上线,可直接访问使用。AI产品智能体Hugging FaceAgent Traces调试工具文档推荐理由:做智能体开发和调试的团队,终于能在 Hub 上可视化 Agent Traces 了,省去自己搭日志系统的麻烦,值得直接去试试。原文
10:20Clement Delangue@ClementDelangue精选Hugging Face 联合创始人 Clement Delangue 在 X 上分享,他仅用不到 1 分钟就将一个 68TB 的数据集克隆到自己的私有训练存储桶中,而本地磁盘只有 4TB。这得益于 Hugging Face 的基础设施优化和 xet 去重技术。该功能让用户无需下载完整数据集即可直接使用,大幅节省时间和存储空间。对于需要大规模数据集的 AI 训练团队来说,这是一个效率提升的利器。AI产品Hugging Face数据集克隆去重基础设施推荐理由:做大规模 AI 训练的团队终于可以告别下载整个数据集的痛苦——68TB 数据集 1 分钟克隆到私有存储,建议所有需要管理海量数据的开发者点开看看。原文
15:07NVIDIA AI@NVIDIAAI精选NVIDIA 宣布其 Cosmos 3 模型完全开源,包括模型权重和训练配方。该模型已在 Hugging Face 上发布,供开发者自由使用。此举延续了 NVIDIA 在 AI 领域开放生态的策略,旨在推动更多创新应用。Cosmos 3 的开放将加速研究者和工程师在视觉、语言等多模态任务上的探索。AI模型开源/仓库多模态模型NVIDIACosmos 3Hugging Face9 个信源在谈推荐理由:NVIDIA 把 Cosmos 3 的权重和训练配方全开源了,做多模态研究的团队可以直接下载使用,省去从头训练的算力成本,值得点开看看。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……
22:05Clement Delangue@ClementDelangue精选83°Hugging Face 科学团队在 TRL 库中实现了一种新的异步强化学习权重同步方法,将每次同步的带宽成本降低约 100 倍。核心洞察是:在 RL 步骤之间,约 99% 的 bf16 权重是比特相同的,只有极少部分发生变化。他们只将变化的元素编码为稀疏 safetensors 文件,通过 Hugging Face Bucket 传输,而不是传输整个权重文件。以 Qwen3-0.6B 为例,每次步骤的传输量从 1.2 GB 降至 20-35 MB。这意味着不再需要共享集群、RDMA、VPN 或跨云 NCCL,只需一个 GPU 和一个 Hugging Face 账号即可进行真正的分离式 RL 训练。AI产品强化学习权重同步Hugging FaceTRL分布式训练推荐理由:做分布式 RL 训练的团队终于可以告别昂贵的带宽和复杂的基础设施——只需 HTTPS 和一个 Bucket,就能实现跨区域的推理集群同步,建议搞 RL 的开发者直接看原文。原文
10:59IT之家(博客/媒体)精选Hugging Face 于 5 月 21 日发布 LeRobot Humanoid 双足机器人项目,面向机器人开发者和研究人员,起步价 2500 美元。该项目非成品,需自行组装,旨在提供可理解、可维修、可加装传感器的开源平台。硬件部分大量使用 3D 打印件和现成元件,软件部分提供校准、控制工具并支持仿真。团队鼓励先在仿真中训练动作,再在真实机体上测试,数据可反哺仿真环境。后续计划加入上半身集成和更高级行为。AI产品机器人开源/仓库3D 打印仿真Hugging Face推荐理由:Hugging Face 把双足机器人的门槛从几十万降到 2500 美元,做机器人研究的团队和学生可以直接用开源方案动手组装和训练,省去从零搭建的麻烦。原文
21:51berryxia@berryxia精选PaddleOCR 3.5 正式发布,支持 Transformers 作为推理后端,PP-OCRv5 和 PaddleOCR-VL 1.5 模型可直接在 Hugging Face 生态中运行。此前将 PaddleOCR 集成到 RAG 或 Document AI 项目需要额外搭建服务栈,现在流程大幅简化。Hugging Face 团队参与了合作,使得 OCR 工具与主流 Transformer 生态无缝对接。输出结果更精准可靠,无需依赖 LLM 来补充。AI产品PaddleOCRHugging FaceOCRTransformers文档智能推荐理由:做文档智能或 RAG 的团队终于不用在 OCR 和 Transformer 之间搭桥了,PaddleOCR 3.5 直接跑在 Hugging Face 上,省掉一堆服务栈,建议做 Document AI 的开发者点开试试。原文
22:29Hugging Face: Blog(博客/媒体)精选76°IBM Research 在 Hugging Face 上推出了 Open Agent Leaderboard,这是一个用于评估 AI 智能体性能的公开排行榜。该排行榜通过一系列标准化任务测试智能体的规划、工具使用和推理能力,旨在为开发者提供可复现的基准。目前已有多个主流模型参与评测,包括 GPT-4、Claude 等。这一举措有助于推动智能体领域的透明化和标准化,让开发者能更直观地比较不同智能体的实际表现。行业智能体排行榜IBMHugging Face评估基准推荐理由:智能体评估一直缺乏统一标准,IBM 这个排行榜让开发者能直接对比不同模型的规划与工具使用能力,做智能体应用的团队值得关注。原文
19:14AI Engineer@aiDotEngineer精选73°开源模型 GLM 5.1 在 Artificial Analysis 智能指数上超越闭源模型,差距持续缩小。权重开放意味着可以在不离开基础设施的情况下进行量化、微调和边缘部署。Hugging Face 生态已为智能体工作构建:推理提供商支持工具路由、按 SWE bench 分数过滤的基准数据集、存储智能体会话的追踪仓库类型,以及可插入编码智能体的技能。现场演示中,Claude Code 被要求微调一个视觉语言模型,智能体自动计算 VRAM 需求、选择实例并启动任务,将过去需要一天的手工计算变为一个提示。AI模型GLM 5.1开源模型智能体Hugging Face微调推荐理由:开源模型首次在权威指数上超越闭源模型,做模型部署和微调的团队可以直接利用权重优势,而 Hugging Face 的智能体生态让训练任务自动化成为现实——建议点开看 Claude Code 如何一键微调模型。原文