全部 AI 动态 · AI 热点

6月26日

08:52

08:52Hugging Face: Blog（博客/媒体）

精选

HuggingFace推出新功能：只需一条命令即可在HF Jobs上启动vLLM推理引擎。vLLM是一个高性能、低延迟的推理框架，支持多种GPU和自定义模型。该功能简化了从模型托管到服务部署的流程，无需手动配置容器或基础设施。用户可以快速部署LLaMA、Mistral等开源模型。

技巧 vLLM HuggingFace HF Jobs 推理模型部署

推荐理由：HuggingFace出了新招：一行命令就能跑vLLM服务器，省去了手动配置的麻烦，适合快速部署自己的模型。

原文

6月25日

02:24

Clement Delangue@ClementDelangue

精选

Kog在HuggingFace上开源了其2B参数模型，该模型此前被用于演示，运行速度达到3000+ tokens每秒。开源模型可供开发者下载和部署，适用于快速推理场景。

AI模型 Kog HuggingFace 2B模型开源模型推理速度

推荐理由：Kog开源了一个2B模型，每秒能处理3000多个token，适合需要高速推理的任务。

原文

6月23日

01:03

Clement Delangue@ClementDelangue

HuggingFace 平台上的公开模型数量即将突破300万个，公开数据集也即将达到100万个。该平台已成为开源AI社区的核心枢纽，模型和数据集数量在过去一年快速翻倍。这一里程碑反映了开源AI生态的持续繁荣。

行业 HuggingFace 开源模型数据集社区里程碑

推荐理由：HuggingFace 马上要突破300万模型和100万数据集了，这说明开源AI有多火。看看这个数字，社区力量真强。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月14日

04:22

Clement Delangue@ClementDelangue

HuggingFace CEO Clement Delangue在X上发文指出，前沿模型API的护栏很容易被越狱，且很浅显、无法修复。他认为这些护栏主要是烟雾弹和干扰，需要不同的AI安全范式。该推文获得52个点赞和1304次查看。

行业 HuggingFace Clement Delangue AI安全 API护栏越狱

推荐理由：HuggingFace CEO吐槽API护栏

原文

6月13日

22:51

量子位@鹭羽

HuggingFace CEO和Bengio团队推荐的HRM模型，参数量仅1B，训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型，如MMLU上达到45.2%，HellaSwag上达到72.1%。其核心创新在于高效训练方法，大幅降低了资源需求。

AI模型 HRM HuggingFace Bengio 开源模型推理模型

推荐理由：1B模型，1500美元，性能超预期

原文

10:46

Clement Delangue@ClementDelangue

精选

HuggingFace CEO Clement Delangue宣布下周前往华盛顿DC，直接与政策制定者讨论开源AI、透明度、权力集中以及真实风险与收益。他正在征集应该会见的人选，包括国会议员、白宫人员、公共组织等。这一行动反映出AI行业对政策对话的重视。

行业 HuggingFace 开源AI AI监管 AI政策

推荐理由：HuggingFace CEO亲自游说华盛顿

原文

10:17

Clement Delangue@ClementDelangue

精选

HuggingFace 联合创始人兼首席执行官 Clement Delangue 在 X 平台宣布，下周将前往华盛顿特区，直接与国会成员、白宫官员及公共组织等政策制定者会面。讨论议题包括开源 AI、透明度、权力集中以及 AI 的真实风险与收益。Delangue 还向公众征求应会面的对象，并承认不确定此行影响力但将尽力尝试。

行业 HuggingFace Clement Delangue 开源AI AI政策华盛顿

推荐理由：CEO亲赴华盛顿聊开源AI

原文

6月12日

22:25

Clement Delangue@ClementDelangue

HuggingFace CEO Clement Delangue 在 X 上发帖，指出当前 AI 评测存在结构性缺陷：它们倾向于让闭源 API 受益，因为这些 API 可以在后台进行路由、回退、集成和优化，而缺乏透明度。他以 @ArtificialAnlys 的评测为例，质疑将一个模型与两个模型进行比较是否公平。该帖引发广泛讨论，反映了开源社区对评测标准公正性的担忧。

行业 AI评测闭源API 开源社区透明度 HuggingFace

推荐理由：AI 评测的公平性直接影响模型选择和技术方向，做模型选型或评测的开发者值得关注这个争议，看完会重新审视排行榜的参考价值。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

02:35

Julien Chaumond@julien_c

精选

HuggingFace 发布了新的终端命令 `hf repos ls --explore`，支持在 CLI 中可视化存储分布、发现异常大数据或文件，并直接导航仓库。该功能无需离开终端即可管理多个仓库，提升开发效率。用户可通过该命令快速识别存储占用异常的文件或目录。

AI产品 HuggingFace CLI工具存储管理异常检测

推荐理由：终端就能看仓库存储分布，省事

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

11:04

shao__meng@shao__meng

精选

HuggingFace 联合社区作者 @SergioPaniego 和 @ariG23498 发布了一份 AI Agent 词汇表，旨在统一和澄清智能体领域的关键术语。该词汇表覆盖了 Agent、工具、规划、记忆等核心概念，帮助开发者和研究者避免因术语歧义导致的沟通成本。文章以信息卡形式呈现，便于保存和快速查阅，适合作为团队内部或学习时的参考手册。

AI产品智能体词汇表 HuggingFace 开发者工具参考手册

推荐理由：做 AI Agent 开发或研究的团队，这份词汇表能帮你统一术语、减少沟通摩擦，建议收藏并分享给同事。

原文

5月30日

11:35

AK@_akhaliq

HuggingFace 宣布其推理 API 现在支持超过 81,000 个模型，覆盖文本、图像、音频等多种模态。这意味着开发者可以直接通过 API 调用海量预训练模型，无需自行部署基础设施。这一更新大幅降低了 AI 模型的使用门槛，尤其适合快速原型开发和实验。对于需要灵活选择模型的团队来说，这是一个重要的资源整合。

AI产品 HuggingFace 推理 API 模型部署开发者工具开源/仓库

推荐理由：81k 模型一键调用，省去部署烦恼——做 AI 应用开发的团队可以直接用 API 快速验证想法，值得收藏。

原文

5月29日

03:07

NVIDIA AI@NVIDIAAI

72°

NVIDIA 研究团队的 CVPR2026 论文 LocateAnything 在 HuggingFace 上成为趋势第一。该模型是一种视觉语言检测模型，创新性地并行解码边界框，而非传统的一次一个坐标。在 1.38 亿高质量样本上训练，显著提升了定位精度和吞吐量，适用于 AI 智能体和机器人等需要快速精准视觉定位的场景。项目页面已公开。

论文视觉检测边界框预测 NVIDIA CVPR2026 HuggingFace

推荐理由：做视觉检测或机器人感知的团队，LocateAnything 的并行解码思路能直接提升实时性，值得点开看看项目页。

原文

5月27日

23:55

Perplexity@perplexity_ai

精选

Perplexity AI发布的编码器在生产输入长度下，p50延迟比HuggingFace tokenizers低约5倍，比SentencePiece C++低2倍，比IREE C低1.5倍。在514 tokens的输入时，运行时间仅为63微秒，且实现零堆分配。该编码器专门针对长输入场景优化，显著提升推理效率。

AI模型 Perplexity AI HuggingFace SentencePiece 编码器性能优化

推荐理由：Perplexity AI编码器快了5倍

原文

23:50

AI Engineer@aiDotEngineer

HuggingFace的Ben Burtenshaw提出，当前的编程助手只关注代码语法，但真正的突破在于让它们理解系统架构和AI系统工程。他认为，编程助手需要从“写代码”升级为“做系统设计”，包括理解依赖关系、性能瓶颈和部署策略。这一观点挑战了现有AI编程工具的定位，为开发者提供了新的思考方向。

AI产品编程助手 AI系统工程系统架构 HuggingFace 开发者工具

推荐理由：做AI系统设计和架构的开发者会重新思考编程助手的价值——不只是帮你写代码，而是帮你做工程决策，值得点开看看这个观点。

原文

5月21日

08:00

Julien Chaumond@julien_c

HuggingFace 联合创始人 Julien Chaumond 在 X 上发起讨论，探讨 Apple Silicon 是否是本地 AI 的最佳平台。该话题引发社区热议，目前已有 7 个点赞和 715 次浏览。讨论聚焦于 Apple Silicon 在运行本地 AI 模型时的性能、能效和生态优势，与 NVIDIA GPU 等传统方案形成对比。这反映了本地 AI 部署正从云端向边缘设备迁移的趋势，Apple Silicon 的 M 系列芯片因其统一内存架构和高效能而备受关注。

行业 Apple Silicon 本地AI HuggingFace 边缘计算芯片对比

推荐理由：本地 AI 部署正在从云端走向桌面，Apple Silicon 的 M 系列芯片可能是最佳选择——做本地推理或边缘 AI 的开发者值得关注这场讨论。

原文

5月20日

21:52

Julien Chaumond@julien_c

HuggingFace 推出硬件趋势页面，展示开源 AI 社区实际使用的 GPU、CPU 型号、VRAM 分布和推理硬件趋势。该页面基于真实社区使用数据，而非厂商宣传或基准测试，帮助开发者了解主流硬件配置。目前数据显示，NVIDIA 的 RTX 4090、A100 等 GPU 占据主导，VRAM 集中在 24GB 以上。这一工具对 AI 开发者选型、部署模型有直接参考价值。

行业 HuggingFace 硬件趋势 GPU 开源AI 社区数据

推荐理由：HuggingFace 用真实社区数据告诉你大家都在用什么硬件跑模型，做部署选型的开发者可以直接参考，比看厂商宣传靠谱得多。

原文

5月19日

13:17

Clement Delangue@ClementDelangue

HuggingFace CEO Clement Delangue 在Dell Technologies World主题演讲中宣布，与Dell合作推动基于HuggingFace开源模型的本地AI部署。他认为，本地AI相比云API更便宜、更快、更安全，是应对今年GPU短缺的重要方案。该合作旨在让企业能够更便捷地在本地运行开源模型，减少对云端GPU的依赖。

行业开源模型本地部署 GPU短缺 HuggingFace Dell

推荐理由：GPU短缺是今年AI部署的最大瓶颈之一，本地AI方案能直接帮企业省钱、提速、保安全，做企业AI落地的团队值得关注。

原文

5月16日

14:10

Clement Delangue@ClementDelangue

HuggingFace CEO Clement Delangue 在采访中反驳了开源AI风险论，认为限制AI反而会增加风险。他以GPT-2和Mythos为例，指出当初被警告危险的模型最终并未造成灾难。他强调，在网络安全领域，少数玩家垄断能力才是最大风险，开源能让防御者更快反应。他用“有人会打人，所以绑住所有人的手”的比喻批评限制AI的逻辑。Delangue 警告，限制会拖慢进步、扩大能力差距，并制造新的风险。

行业开源 AI安全 HuggingFace Clement Delangue 行业观点

推荐理由：开源与安全的争论从未停止——Delangue 用历史案例和比喻直击核心，做AI政策研究或开源项目的团队值得一看，能帮你理解反对限制的论据。

原文

5月15日

23:20

Clement Delangue@ClementDelangue

HuggingFace 推出专为 AI 团队设计的存储服务，解决模型权重、数据集、检查点和工件等大文件的存储痛点。该服务提供简单的每TB定价、内置CDN加速、Xet去重技术，并默认支持私有存储。旨在让AI团队无需在昂贵的对象存储和繁琐的Git工作流之间做选择，直接在HuggingFace平台上管理AI数据。

AI产品 HuggingFace 存储服务模型权重数据集管理 AI基础设施

推荐理由：做AI模型训练和数据集管理的团队终于有了一个专为AI工作流优化的存储方案，不用再纠结于通用对象存储的高成本或Git对大文件的低效处理，建议直接试试。

原文