22:09NVIDIA AI@NVIDIAAI76°NVIDIA 宣布完全开源 Nemotron 3 Ultra 模型,包括模型权重、合成数据和后训练配方。该模型已在 Hugging Face 上架,开发者可自由获取和使用。此举延续了 NVIDIA 在 AI 开源领域的承诺,为研究人员和开发者提供了完整的模型复现与定制能力。Nemotron 3 Ultra 的开放有助于推动大模型生态的透明度和可复现性。AI模型开源/仓库Nemotron 3 UltraNVIDIAHugging Face训练配方10 个信源在谈推荐理由:NVIDIA 把 Nemotron 3 Ultra 的权重、数据和训练配方全部开源,做模型复现或定制训练的团队可以直接下载使用,省去从头训练的昂贵成本。原文
21:28Julien Chaumond@julien_cJulien C 发布新项目 SynthTraces,这是一个最小化代码库,用于生成合成编程智能体会话轨迹。它让一个开放模型(通过 Hugging Face Inference Providers 服务)扮演编程智能体,另一个小模型(llama.cpp)扮演人类用户,在真实开源代码库(HuggingFace OSS 项目)上进行交互。最终生成了超过 2000 条 Pi 会话轨迹,可用于训练或微调 LLM,并针对 Pi 进行优化。所有数据已发布在 Hugging Face 上。AI产品编程智能体合成数据PiHugging Face开源/仓库推荐理由:做智能体训练或微调的开发者终于有了大规模合成轨迹数据源——SynthTraces 用双模型对话自动生成 2000+ 条真实代码库交互轨迹,比手动标注高效太多,做 LLM 对齐或 Pi 优化的团队可以直接用。原文
06:44Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在 X 上发帖调侃,认为现在即使把开源模型命名为“0pus 4.8”或“GPT 5.S”放进应用,用户也会大量使用而不抱怨。他指出这是“前沿”营销的力量——品牌和命名比实际技术更能吸引用户。这条推文引发了关于 AI 行业品牌效应与真实技术差距的讨论。行业开源模型品牌营销前沿模型用户认知Hugging Face推荐理由:做 AI 应用或营销的团队值得看看——品牌命名对用户认知的影响可能远超技术本身,别让“前沿”标签蒙蔽了你的判断。原文
01:19Ideogram@ideogram_aiIdeogram 4.0 现已通过多个合作伙伴平台开放使用,包括 Hugging Face、ComfyUI、Fal、Runware、Magnific、Krea AI、Leonardo AI、Picsart、Cloudflare、Replicate、Gamma App、Flora AI 和 Kittl Design。这一更新意味着用户可以在熟悉的工具和平台上直接使用 Ideogram 的最新图像生成模型,无需切换环境。对于依赖这些平台进行创意工作的设计师和开发者来说,这大大降低了使用门槛,提升了工作流效率。AI产品Ideogram 4.0图像生成平台集成Hugging FaceComfyUI4 个信源在谈推荐理由:Ideogram 4.0 覆盖了主流 AI 图像平台,做设计或内容创作的团队可以直接在常用工具里体验最新模型,省去切换麻烦。原文
13:43Cohere@cohereCohere 宣布赞助一场由 Hugging Face 和 Gradio 主办的黑客马拉松,主题是“缩小规模”。活动鼓励开发者构建足够小、运行成本低,但又能真正改变他人生活的 AI 应用。参与者可以创造古怪有趣的 AI 作品,或为身边人解决实际问题。这反映了行业对轻量、实用 AI 模型的关注趋势。行业黑客马拉松CohereHugging FaceGradio轻量模型推荐理由:想用低成本模型做出真正有用的东西?这场黑客马拉松就是为你准备的——Cohere 赞助、Hugging Face 和 Gradio 主办,直接上手做点小而美的 AI 应用,建议关注。原文
08:17Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在 X 上发文,呼吁社区更多关注 Arcee 这家美国开源 AI 模型公司。他指出,美国优秀的开源 AI 模型公司并不多,而 Arcee 是其中之一。Arcee 在 Hugging Face 上发布了多个开源模型,其模型在特定任务上表现优异,且完全开源可商用。这一呼吁引发了社区对 Arcee 及其模型的重新关注,也反映了开源 AI 生态中美国公司的稀缺性。AI模型开源/仓库ArceeHugging FaceAI模型美国推荐理由:美国开源 AI 模型公司稀缺,Arcee 是少数值得关注的玩家。做开源模型研究或寻找可商用模型的开发者,建议去 Hugging Face 看看他们的模型仓库。原文
10:45NVIDIA AI@NVIDIAAINVIDIA 在 Hugging Face 上开源仓库总数突破 1000 个(含 820 个模型、249 个数据集和 57 个 Spaces),粉丝接近 60,000。其 LocateAnything 模型成为 Hugging Face 当前第一热门模型,PiD 排名第五。NVIDIA 宣布采用 Linux 基金会的 OpenMDW 框架,并发布了 Cosmos 3(物理 AI 全模态世界模型)和 Alphamayo 2 Super(自动驾驶开源模型)。此外,Nemotron 3 即将发布,Nemotron 4 也在研发中。Hugging Face CEO Clement Delangue 称 NVIDIA 为“美国开源 AI 之王”,肯定了其对生态的贡献。行业NVIDIA开源/仓库Hugging Face物理 AI自动驾驶10 个信源在谈推荐理由:NVIDIA 在 Hugging Face 上开源仓库破千,模型霸榜,做 AI 开发或模型选型的团队值得关注——这代表开源生态里又多了一个强力玩家,可以直接拿来用的资源又多了。原文
10:35Julien Chaumond@julien_c精选Hugging Face 发布了新的文档页面,支持在 Hub 上渲染 Agent Traces(智能体追踪)。这意味着开发者可以更直观地查看和分析 AI 智能体的运行轨迹、决策过程与中间结果。该功能有助于调试和优化智能体行为,提升开发效率。文档页已上线,可直接访问使用。AI产品智能体Hugging FaceAgent Traces调试工具文档推荐理由:做智能体开发和调试的团队,终于能在 Hub 上可视化 Agent Traces 了,省去自己搭日志系统的麻烦,值得直接去试试。原文
10:20Clement Delangue@ClementDelangue精选Hugging Face 联合创始人 Clement Delangue 在 X 上分享,他仅用不到 1 分钟就将一个 68TB 的数据集克隆到自己的私有训练存储桶中,而本地磁盘只有 4TB。这得益于 Hugging Face 的基础设施优化和 xet 去重技术。该功能让用户无需下载完整数据集即可直接使用,大幅节省时间和存储空间。对于需要大规模数据集的 AI 训练团队来说,这是一个效率提升的利器。AI产品Hugging Face数据集克隆去重基础设施推荐理由:做大规模 AI 训练的团队终于可以告别下载整个数据集的痛苦——68TB 数据集 1 分钟克隆到私有存储,建议所有需要管理海量数据的开发者点开看看。原文
10:10Clement Delangue@ClementDelangueHugging Face联合创始人Clement Delangue在X上表示,其官方博客(hf.co/blog)已成为AI社区学习和获取新闻的主要来源。他列举了来自OpenClaw、NVIDIA、JetBrains、IBM Research等机构的最新内容、重大公告和教程。Delangue呼吁更多人参与创作,强调AI需要更公开、开放和协作。这条推文获得了1149次浏览和14个点赞,反映了社区对HF博客的认可。行业Hugging FaceAI社区博客开放协作教程10 个信源在谈推荐理由:Hugging Face博客正在成为AI从业者获取前沿教程和行业动态的核心渠道,做AI开发或研究的团队值得关注并贡献内容。原文
02:53Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 发推称赞 NVIDIA 是“美国开源 AI 之王”,指出 NVIDIA 在 Hugging Face 上已拥有超过 1000 个公开仓库(820 个模型、249 个数据集、57 个空间),粉丝近 6 万。当前 HF 上排名第一的热门模型是 LocateAnything,排名第五的是 PiD。NVIDIA 宣布采用 Linux 基金会的 OpenMDW 框架,并发布了 Cosmos 3(用于物理 AI 的全模态世界模型)、Alphamayo 2 Super(自动驾驶开源模型),以及即将推出 Nemotron 3 和正在开发中的 Nemotron 4。这些成果展示了 NVIDIA 在开源 AI 生态中的持续投入和领导力。行业NVIDIA开源模型Hugging Face自动驾驶物理AI10 个信源在谈推荐理由:NVIDIA 在开源 AI 上的投入远超多数人想象——1000 个公开仓库、多个前沿模型,做 AI 研究或开发的团队值得关注这些新资源,尤其是 Cosmos 3 和 Nemotron 系列。原文
01:50Hugging Face@huggingfaceHugging Face CEO Clement Delangue 发推称赞 Nvidia 是“美国开源 AI 之王”,并列举其近期成就:在 Hugging Face 上累计超过 1000 个公开仓库(820 个模型、249 个数据集、57 个 Spaces),粉丝近 6 万;当前 HF 热门模型榜上,LocateAnything 排名第一,PiD 排名第五;宣布采用 Linux 基金会 OpenMDW 框架;发布了 Cosmos 3(物理 AI 全模态世界模型)、Alphamayo 2 Super(自动驾驶开源模型),并预告 Nemotron 3 和 Nemotron 4 即将发布。这些动作表明 Nvidia 正加速从硬件巨头向开源 AI 生态核心贡献者转型。行业Nvidia开源/仓库Hugging Face自动驾驶物理 AI10 个信源在谈推荐理由:Nvidia 在开源 AI 上的投入已经形成规模效应——1000 个仓库覆盖模型、数据集、工具链,做 AI 研究或工程落地的团队值得关注其最新模型和框架,尤其是自动驾驶和物理 AI 方向的开放成果。原文
15:07NVIDIA AI@NVIDIAAI精选NVIDIA 宣布其 Cosmos 3 模型完全开源,包括模型权重和训练配方。该模型已在 Hugging Face 上发布,供开发者自由使用。此举延续了 NVIDIA 在 AI 领域开放生态的策略,旨在推动更多创新应用。Cosmos 3 的开放将加速研究者和工程师在视觉、语言等多模态任务上的探索。AI模型开源/仓库多模态模型NVIDIACosmos 3Hugging Face9 个信源在谈推荐理由:NVIDIA 把 Cosmos 3 的权重和训练配方全开源了,做多模态研究的团队可以直接下载使用,省去从头训练的算力成本,值得点开看看。原文
01:42Clement Delangue@ClementDelangueAI安全研究所(AISecurityInst)在Hugging Face上公开发布了其评估工具、数据集和模型,旨在促进AI安全研究的透明度和可复现性。这一举措允许全球研究人员审查、复现并基于这些资源进行开发,打破了AI安全研究封闭进行的传统。开源这些关键资源有助于加速AI安全领域的进展,并增强公众对AI系统的信任。AI产品AI安全开源/仓库评估工具数据集Hugging Face推荐理由:AI安全研究终于走向开放,做AI安全评估和模型审计的团队可以直接复用这些资源,建议点开看看具体有哪些工具和数据集。原文
23:39Clement Delangue@ClementDelangueHugging Face 联合创始人 Clement Delangue 透露,平台上 50% 的模型和数据集是私有的,且这一比例随着其 S3 替代方案 buckets 的推出而持续增长。这表明越来越多企业选择在内部使用 Hugging Face 进行 AI 构建和协作,而非完全依赖外部 API。私有存储功能让企业能更高效、安全地共享 AI 资产,推动内部创新。Delangue 预计未来几个月这一趋势将更加明显。行业Hugging Face私有模型企业AI数据协作S3替代推荐理由:企业 AI 团队终于有了更安全的内部协作方式——Hugging Face 的私有存储让模型和数据管理不再依赖公开分享,做内部 AI 平台或数据治理的开发者值得关注。原文
00:51Julien Chaumond@julien_cHugging Face 的 Julien Chaumond 在 X 上宣布,团队对数据基础设施业务持乐观态度。他演示了仅用 1 分 55 秒就克隆了 68TB 数据到 Hugging Face 训练存储桶,而本地磁盘只有 4TB。这得益于 Xet 去重技术和基础设施优化。用户可以在 Hugging Face 上托管数据处理管道,利用这些优化。该技术大幅提升了大规模数据处理的效率。AI产品数据基础设施Hugging FaceXet去重大规模数据处理优化推荐理由:Hugging Face 把 68TB 数据克隆时间压缩到 2 分钟以内,做大规模数据处理的团队可以直接用上这些优化,省时又省成本。原文
22:11Julien Chaumond@julien_cJasper AI 发布了 MONET 数据集,包含 1.05 亿个经过去重和重新标注的图像-文本对,采用 Apache 2.0 开源许可,是目前最大的开放许可文生图数据集之一。该数据集托管在 Hugging Face 上,旨在推动可复现的文生图研究。同时,Jasper 还开源了 Nano T2I 代码库,帮助开发者训练自己的文生图模型。这一发布解决了开源文生图领域缺乏大规模、高质量、可复现数据集的问题。AI产品文生图数据集开源/仓库Hugging FaceJasper推荐理由:做文生图研究的团队终于有了一个大规模、去重、重新标注的开源数据集,可以直接用于训练和复现实验,建议点开看看数据集和代码库。原文
22:05Clement Delangue@ClementDelangue精选83°Hugging Face 科学团队在 TRL 库中实现了一种新的异步强化学习权重同步方法,将每次同步的带宽成本降低约 100 倍。核心洞察是:在 RL 步骤之间,约 99% 的 bf16 权重是比特相同的,只有极少部分发生变化。他们只将变化的元素编码为稀疏 safetensors 文件,通过 Hugging Face Bucket 传输,而不是传输整个权重文件。以 Qwen3-0.6B 为例,每次步骤的传输量从 1.2 GB 降至 20-35 MB。这意味着不再需要共享集群、RDMA、VPN 或跨云 NCCL,只需一个 GPU 和一个 Hugging Face 账号即可进行真正的分离式 RL 训练。AI产品强化学习权重同步Hugging FaceTRL分布式训练推荐理由:做分布式 RL 训练的团队终于可以告别昂贵的带宽和复杂的基础设施——只需 HTTPS 和一个 Bucket,就能实现跨区域的推理集群同步,建议搞 RL 的开发者直接看原文。原文
10:59IT之家(博客/媒体)精选Hugging Face 于 5 月 21 日发布 LeRobot Humanoid 双足机器人项目,面向机器人开发者和研究人员,起步价 2500 美元。该项目非成品,需自行组装,旨在提供可理解、可维修、可加装传感器的开源平台。硬件部分大量使用 3D 打印件和现成元件,软件部分提供校准、控制工具并支持仿真。团队鼓励先在仿真中训练动作,再在真实机体上测试,数据可反哺仿真环境。后续计划加入上半身集成和更高级行为。AI产品机器人开源/仓库3D 打印仿真Hugging Face推荐理由:Hugging Face 把双足机器人的门槛从几十万降到 2500 美元,做机器人研究的团队和学生可以直接用开源方案动手组装和训练,省去从零搭建的麻烦。原文
10:50Hunyuan@TXhunyuan精选腾讯混元发布Hy-MT2系列翻译模型,包含Hy-MT2-1.8B和Hy-MT2-30B-A3B两个版本。Hy-MT2-1.8B在Hugging Face开源模型趋势排行榜位列第1,Hy-MT2-30B-A3B位列第4,两者合计下载量已超7000次。同时基于Hy-MT2推出腾讯Hy翻译微信小程序,支持语音输入、离线翻译以及自定义翻译风格与指令。AI模型Hy-MT2Tencent Hunyuan翻译模型开源模型Hugging Face推荐理由:腾讯翻译模型冲上榜首原文
07:37Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 正在研究编程助手如何提及 Hugging Face 产品。他采用简单方法:运行大量查询,并用 Submarine.ai 分析回答。他公开了数据集,并询问社区是否有更好方法。这反映了 AI 工具对开发者生态的影响,以及公司如何追踪自身在 AI 助手中的存在感。行业编程助手Hugging FaceSubmarine.ai开发者生态产品分析推荐理由:做开发者关系或产品推广的团队,可以通过这个案例了解如何量化 AI 助手对自家产品的提及率,值得参考其数据和分析思路。原文
12:09Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue宣布,已有30万AI开发者在该平台填写了硬件配置档案,并公开了统计结果。数据显示了AI开发者当前使用的GPU、CPU、内存等硬件分布情况,尤其反映了本地AI部署的快速增长趋势。这一数据为硬件厂商和AI从业者提供了宝贵的市场洞察,也预示着本地AI应用的爆发。行业Hugging Face硬件配置本地AI开发者数据行业洞察推荐理由:想知道同行都在用什么硬件跑AI?Hugging Face的30万开发者数据直接告诉你答案,做本地AI部署或硬件选型的开发者值得一看。原文
22:53Clement Delangue@ClementDelangueCommonCrawl 公开推荐并使用 Hugging Face Buckets 来管理大型且不断演变的训练数据集。Hugging Face Buckets 是一种存储解决方案,专为处理私有模型或数据集而设计。该工具旨在简化大规模数据管理流程,提升效率。Hugging Face 创始人呼吁用户尝试并反馈意见。AI产品数据集存储CommonCrawlHugging Face训练数据推荐理由:CommonCrawl 的背书说明 Hugging Face Buckets 在大规模数据管理上靠谱,做 NLP 或预训练数据处理的团队可以直接试试,省去自己搭存储的麻烦。原文
21:51berryxia@berryxia精选PaddleOCR 3.5 正式发布,支持 Transformers 作为推理后端,PP-OCRv5 和 PaddleOCR-VL 1.5 模型可直接在 Hugging Face 生态中运行。此前将 PaddleOCR 集成到 RAG 或 Document AI 项目需要额外搭建服务栈,现在流程大幅简化。Hugging Face 团队参与了合作,使得 OCR 工具与主流 Transformer 生态无缝对接。输出结果更精准可靠,无需依赖 LLM 来补充。AI产品PaddleOCRHugging FaceOCRTransformers文档智能推荐理由:做文档智能或 RAG 的团队终于不用在 OCR 和 Transformer 之间搭桥了,PaddleOCR 3.5 直接跑在 Hugging Face 上,省掉一堆服务栈,建议做 Document AI 的开发者点开试试。原文
21:08Clement Delangue@ClementDelangue83°Hugging Face 发布了名为 Carbon 的开源 DNA 基础模型,包含开放权重、训练代码和数据管道。该模型专为下游生物学任务设计,可微调或持续预训练。Carbon 比同尺寸最佳模型快 275 倍,能在单 GPU 上不到 2 天处理整个人类基因组,甚至可在笔记本电脑上本地运行。其核心技术是 DNA 原生分词器,将序列分割为 6 碱基块以提升效率,同时保留单碱基分辨率。此举旨在推动生物学 AI 的透明化和本地化,避免个人健康数据依赖黑盒 API。AI模型Hugging FaceDNA 模型开源/仓库生物信息学本地推理推荐理由:Hugging Face 把 DNA 分析从黑盒 API 拉到了本地,做生物信息学或个性化健康研究的开发者可以直接在笔记本上跑基因组模型,值得试试。原文
03:59Thomas Wolf@Thom_Wolf76°Hugging Face 团队发布了名为 Carbon 的 DNA 模型,其速度比当前最先进的 Evo2 快 275 倍,可在单 GPU 上两天内处理整个人类基因组。Carbon 的核心创新在于其独特的 tokenizer:将 DNA 序列切分为 6 碱基的块,同时保留单碱基分辨率,解决了 BPE 分词器在无空格序列上的低效问题。该模型支持 DNA 序列生成、基因结构分析、突变效应预测、蛋白质折叠以及生命树重建等任务。团队还提供了交互式 demo 供用户探索。AI模型DNA 模型CarbonHugging Face基因组分析tokenizer推荐理由:生物信息学研究者终于有了一个能跑全基因组的超快模型——Carbon 把处理时间从数周压缩到两天内,做基因组分析或蛋白质设计的团队可以直接用 demo 试效果。原文
22:29Hugging Face: Blog(博客/媒体)精选76°IBM Research 在 Hugging Face 上推出了 Open Agent Leaderboard,这是一个用于评估 AI 智能体性能的公开排行榜。该排行榜通过一系列标准化任务测试智能体的规划、工具使用和推理能力,旨在为开发者提供可复现的基准。目前已有多个主流模型参与评测,包括 GPT-4、Claude 等。这一举措有助于推动智能体领域的透明化和标准化,让开发者能更直观地比较不同智能体的实际表现。行业智能体排行榜IBMHugging Face评估基准推荐理由:智能体评估一直缺乏统一标准,IBM 这个排行榜让开发者能直接对比不同模型的规划与工具使用能力,做智能体应用的团队值得关注。原文
12:05Paul Couvert@itsPaulAi72°HiDream AI 与 Vivago AI 联合开源了 HiDream 图像生成模型,该模型在性能上可与闭源商业模型竞争。模型权重、技术报告和在线试用空间均已发布在 Hugging Face 和 GitHub 上。开源社区对此反应热烈,认为这是开源图像模型的重要里程碑。用户可以直接下载模型或在线体验,无需等待。AI模型HiDream图像生成开源/仓库Hugging FaceAI模型推荐理由:开源图像模型终于有了能打闭源方案的选手,做图像生成或 AI 绘画的开发者可以直接下载模型或在线试用,值得立刻体验。原文
19:14AI Engineer@aiDotEngineer精选73°开源模型 GLM 5.1 在 Artificial Analysis 智能指数上超越闭源模型,差距持续缩小。权重开放意味着可以在不离开基础设施的情况下进行量化、微调和边缘部署。Hugging Face 生态已为智能体工作构建:推理提供商支持工具路由、按 SWE bench 分数过滤的基准数据集、存储智能体会话的追踪仓库类型,以及可插入编码智能体的技能。现场演示中,Claude Code 被要求微调一个视觉语言模型,智能体自动计算 VRAM 需求、选择实例并启动任务,将过去需要一天的手工计算变为一个提示。AI模型GLM 5.1开源模型智能体Hugging Face微调推荐理由:开源模型首次在权威指数上超越闭源模型,做模型部署和微调的团队可以直接利用权重优势,而 Hugging Face 的智能体生态让训练任务自动化成为现实——建议点开看 Claude Code 如何一键微调模型。原文
14:01AK@_akhaliqNVIDIA 在 Hugging Face 上发布了 AnyFlow,这是首个任意步数视频扩散模型。它能够根据文本描述生成高质量视频,且支持在推理时灵活调整步数,无需重新训练。该模型在视频质量和生成效率上取得了平衡,为视频生成领域带来了新的可能性。开发者可以直接在 Hugging Face 上获取模型权重和使用示例。AI模型NVIDIAAnyFlow视频扩散模型Hugging Face文本生成视频推荐理由:做视频生成或扩散模型研究的开发者,现在有了一个无需重新训练就能灵活控制生成步数的工具,值得上手试试。原文
01:10AlphaSignal@AlphaSignalAI70°Hugging Face 开源了一个 CLI 智能体,能自动执行机器学习工程师的完整研究循环:从阅读论文、追踪引用,到拉取数据集、编写训练脚本,再到启动 GPU 任务并迭代优化。在科学推理任务中,它训练 Qwen3-1.7B 将 GPQA 得分从 10% 提升至 32%,超越 Claude Code 的 22.99%。在医疗领域,它因公开数据集质量不足,自动生成 1100 个合成样本并上采样 50 倍,在 HealthBench 上比 Codex 高出 60%。该智能体还具备自主诊断失败评估、恢复训练的能力,以 CLI 和 Web 应用形式提供,甚至可在手机上运行。AI产品Hugging FaceCLI 智能体开源/仓库自动化研究模型训练推荐理由:Hugging Face 这个开源智能体把 ML 研究全流程自动化了,做实验的团队可以直接用它跑论文复现和模型训练,省掉大量手动调参和写脚本的时间。原文
21:36IT之家(博客/媒体)70°AI 安全公司 HiddenLayer 在 Hugging Face 上发现一个名为“Open-OSS / privacy-filter”的恶意仓库,伪装成 OpenAI 的隐私脱敏模型“Privacy Filter”。该仓库在被下架前下载量已超过 20 万次,文件目录与正版几乎一致,但内含信息窃取类木马。受害者若按说明下载运行,电脑会遭黑客入侵。安全公司建议受影响的用户彻底重建开发环境,而非仅手动清理恶意软件。行业Hugging Face安全/漏洞山寨项目信息窃取木马OpenAI1 个信源在谈推荐理由:AI 开发者下载模型时容易中招——这个山寨项目下载量超 20 万次,说明很多人已经踩坑。建议所有在 Hugging Face 上找模型的团队立即检查自己的依赖,并提醒同事不要轻信非官方仓库。原文
08:34Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在X上发文称其基础设施规模巨大,并邀请仍在使用S3或R2托管模型、数据集、智能体记忆的用户与他们合作,声称能提供更好、更快、更便宜、更安全的服务。这凸显了Hugging Face在AI基础设施领域的野心,可能对现有云存储服务构成竞争。行业Hugging Face基础设施云存储S3R2推荐理由:Hugging Face 公开挑战传统云存储,展示其AI基础设施能力,值得关注。原文
08:34Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在 X 上分享,Reachy Mini 机器人出现在 LinusTech 最新视频的封面。这标志着开源机器人项目获得主流科技媒体关注。Reachy Mini 是一个可编程的桌面机器人,常用于 AI 研究和教育。行业开源/仓库机器人Hugging Face推荐理由:开源机器人项目获得主流科技媒体曝光,体现 AI 硬件社区影响力。原文
23:28Clement Delangue@ClementDelangue70°Hugging Face宣布其平台上公开数据集数量突破100万,总数据量达到PB级别,每天有数百万AI开发者下载、分析和训练模型。值得注意的是,自智能体技术成熟以来,数据集增速显著加快,过去8个月新增50万个数据集,而达到首个50万耗时4年。业界普遍认为,更好的数据是让更多人自主构建AI而非依赖API的下一个关键瓶颈。行业数据集开源/仓库Hugging Face智能体推荐理由:这一里程碑表明高质量数据的获取和分享正在变得更加高效,对AI模型训练和开源生态的持续发展具有积极意义。原文
22:17Together AI@togethercomputeTogether AI宣布其AI Native Cloud平台现在支持直接从Hugging Face部署任何模型,无需繁琐设置。用户只需单次会话即可运行模型,大幅降低了从“看起来不错”到“实际运行”的门槛。此举旨在简化AI模型部署流程,提升开发者和企业的实验效率。关键点是平台兼容所有Hugging Face模型,且强调零设置体验。AI产品AI平台部署Hugging FaceTogether AI推荐理由:这代表AI基础设施服务商正进一步降低模型部署门槛,对于需要快速实验和迭代的AI开发团队来说,此举能显著减少从发现模型到生产环境的时间成本,推动更广泛的模型应用。原文
22:16Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue在X(原Twitter)上发布了一条简短推文,提醒某内容需要添加到某个链接中。该推文未提供具体细节,但可能涉及Hugging Face平台或AI社区的相关更新或资源。由于内容简短,目前缺乏足够背景信息判断其重要性。AI产品社交动态Hugging Face推荐理由:推文内容极简,缺乏实质性信息,不构成重要行业动态或技术更新。原文
22:16Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue发推宣布UFO数据集已通过MTSlive上传至Hugging Face平台。该数据集包含UFO相关图像,旨在推动计算机视觉模型训练。此举动可能激发开发者利用公开数据集进行异常目标检测等CV任务,扩展AI在非传统领域的研究边界。目前尚未有公开训练结果,但已引发社区关注。AI产品数据集计算机视觉Hugging FaceUFO推荐理由:UFO数据集作为非传统视觉数据资源,为CV研究者提供了探索异常检测、低置信度场景的新材料,有助于推动AI在开放世界感知中的鲁棒性研究。原文
22:16Clement Delangue@ClementDelangueHugging Face联合创始人Clement Delangue透露,Hugging Face上公开GGUF模型总数已达17.6万个。2024年10月至2月,月均新增约5100个GGUF模型;3月至4月跃升至约9200个/月,近乎翻倍。3月成为转折点(环比增长55%),4月维持9700个的高位,表明增长并非暂时现象。这一趋势得益于llama.cpp工具改进、自动化量化流程以及更多模型原生支持GGUF,社区量化模型速度创历史新高。行业开源/仓库模型量化GGUFHugging Face本地AI推荐理由:GGUF模型数量的快速增长反映了本地AI部署的实际需求和技术成熟度的提升。对于开发者和企业,这意味着更丰富的开源模型选择和更便捷的本地推理实践,推动AI应用向边缘设备转移。原文