AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:HuggingFace×
6月26日
08:52
08:52Hugging Face: Blog(博客/媒体)
精选
HuggingFace推出新功能:只需一条命令即可在HF Jobs上启动vLLM推理引擎。vLLM是一个高性能、低延迟的推理框架,支持多种GPU和自定义模型。该功能简化了从模型托管到服务部署的流程,无需手动配置容器或基础设施。用户可以快速部署LLaMA、Mistral等开源模型。
技巧vLLMHuggingFaceHF Jobs推理模型部署

推荐理由:HuggingFace出了新招:一行命令就能跑vLLM服务器,省去了手动配置的麻烦,适合快速部署自己的模型。
原文
6月25日
02:24
02:24Clement Delangue@ClementDelangue
精选
Kog在HuggingFace上开源了其2B参数模型,该模型此前被用于演示,运行速度达到3000+ tokens每秒。开源模型可供开发者下载和部署,适用于快速推理场景。
AI模型KogHuggingFace2B模型开源模型推理速度

推荐理由:Kog开源了一个2B模型,每秒能处理3000多个token,适合需要高速推理的任务。
原文
6月23日
01:03
01:03Clement Delangue@ClementDelangue
HuggingFace 平台上的公开模型数量即将突破300万个,公开数据集也即将达到100万个。该平台已成为开源AI社区的核心枢纽,模型和数据集数量在过去一年快速翻倍。这一里程碑反映了开源AI生态的持续繁荣。
行业HuggingFace开源模型数据集社区里程碑

推荐理由:HuggingFace 马上要突破300万模型和100万数据集了,这说明开源AI有多火。看看这个数字,社区力量真强。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月14日
04:22
04:22Clement Delangue@ClementDelangue
HuggingFace CEO Clement Delangue在X上发文指出,前沿模型API的护栏很容易被越狱,且很浅显、无法修复。他认为这些护栏主要是烟雾弹和干扰,需要不同的AI安全范式。该推文获得52个点赞和1304次查看。
行业HuggingFaceClement DelangueAI安全API护栏越狱

推荐理由:HuggingFace CEO吐槽API护栏
原文
6月13日
22:51
22:51量子位@鹭羽
HuggingFace CEO和Bengio团队推荐的HRM模型,参数量仅1B,训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型,如MMLU上达到45.2%,HellaSwag上达到72.1%。其核心创新在于高效训练方法,大幅降低了资源需求。
AI模型HRMHuggingFaceBengio开源模型推理模型

推荐理由:1B模型,1500美元,性能超预期
原文
10:46
10:46Clement Delangue@ClementDelangue
精选
HuggingFace CEO Clement Delangue宣布下周前往华盛顿DC,直接与政策制定者讨论开源AI、透明度、权力集中以及真实风险与收益。他正在征集应该会见的人选,包括国会议员、白宫人员、公共组织等。这一行动反映出AI行业对政策对话的重视。
行业HuggingFace开源AIAI监管AI政策

推荐理由:HuggingFace CEO亲自游说华盛顿
原文
10:17
10:17Clement Delangue@ClementDelangue
精选
HuggingFace 联合创始人兼首席执行官 Clement Delangue 在 X 平台宣布,下周将前往华盛顿特区,直接与国会成员、白宫官员及公共组织等政策制定者会面。讨论议题包括开源 AI、透明度、权力集中以及 AI 的真实风险与收益。Delangue 还向公众征求应会面的对象,并承认不确定此行影响力但将尽力尝试。
行业HuggingFaceClement Delangue开源AIAI政策华盛顿

推荐理由:CEO亲赴华盛顿聊开源AI
原文
6月12日
22:25
22:25Clement Delangue@ClementDelangue
HuggingFace CEO Clement Delangue 在 X 上发帖,指出当前 AI 评测存在结构性缺陷:它们倾向于让闭源 API 受益,因为这些 API 可以在后台进行路由、回退、集成和优化,而缺乏透明度。他以 @ArtificialAnlys 的评测为例,质疑将一个模型与两个模型进行比较是否公平。该帖引发广泛讨论,反映了开源社区对评测标准公正性的担忧。
行业AI评测闭源API开源社区透明度HuggingFace

推荐理由:AI 评测的公平性直接影响模型选择和技术方向,做模型选型或评测的开发者值得关注这个争议,看完会重新审视排行榜的参考价值。
原文
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
02:35
02:35Julien Chaumond@julien_c
精选
HuggingFace 发布了新的终端命令 `hf repos ls --explore`,支持在 CLI 中可视化存储分布、发现异常大数据或文件,并直接导航仓库。该功能无需离开终端即可管理多个仓库,提升开发效率。用户可通过该命令快速识别存储占用异常的文件或目录。
AI产品HuggingFaceCLI工具存储管理异常检测

推荐理由:终端就能看仓库存储分布,省事
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月1日
11:04
11:04shao__meng@shao__meng
精选
HuggingFace 联合社区作者 @SergioPaniego 和 @ariG23498 发布了一份 AI Agent 词汇表,旨在统一和澄清智能体领域的关键术语。该词汇表覆盖了 Agent、工具、规划、记忆等核心概念,帮助开发者和研究者避免因术语歧义导致的沟通成本。文章以信息卡形式呈现,便于保存和快速查阅,适合作为团队内部或学习时的参考手册。
AI产品智能体词汇表HuggingFace开发者工具参考手册

推荐理由:做 AI Agent 开发或研究的团队,这份词汇表能帮你统一术语、减少沟通摩擦,建议收藏并分享给同事。
原文
5月30日
11:35
11:35AK@_akhaliq
HuggingFace 宣布其推理 API 现在支持超过 81,000 个模型,覆盖文本、图像、音频等多种模态。这意味着开发者可以直接通过 API 调用海量预训练模型,无需自行部署基础设施。这一更新大幅降低了 AI 模型的使用门槛,尤其适合快速原型开发和实验。对于需要灵活选择模型的团队来说,这是一个重要的资源整合。
AI产品HuggingFace推理 API模型部署开发者工具开源/仓库

推荐理由:81k 模型一键调用,省去部署烦恼——做 AI 应用开发的团队可以直接用 API 快速验证想法,值得收藏。
原文
5月29日
03:07
03:07NVIDIA AI@NVIDIAAI
72°
NVIDIA 研究团队的 CVPR2026 论文 LocateAnything 在 HuggingFace 上成为趋势第一。该模型是一种视觉语言检测模型,创新性地并行解码边界框,而非传统的一次一个坐标。在 1.38 亿高质量样本上训练,显著提升了定位精度和吞吐量,适用于 AI 智能体和机器人等需要快速精准视觉定位的场景。项目页面已公开。
论文视觉检测边界框预测NVIDIACVPR2026HuggingFace

推荐理由:做视觉检测或机器人感知的团队,LocateAnything 的并行解码思路能直接提升实时性,值得点开看看项目页。
原文
5月27日
23:55
23:55Perplexity@perplexity_ai
精选
Perplexity AI发布的编码器在生产输入长度下,p50延迟比HuggingFace tokenizers低约5倍,比SentencePiece C++低2倍,比IREE C低1.5倍。在514 tokens的输入时,运行时间仅为63微秒,且实现零堆分配。该编码器专门针对长输入场景优化,显著提升推理效率。
AI模型Perplexity AIHuggingFaceSentencePiece编码器性能优化

推荐理由:Perplexity AI编码器快了5倍
原文
23:50
23:50AI Engineer@aiDotEngineer
HuggingFace的Ben Burtenshaw提出,当前的编程助手只关注代码语法,但真正的突破在于让它们理解系统架构和AI系统工程。他认为,编程助手需要从“写代码”升级为“做系统设计”,包括理解依赖关系、性能瓶颈和部署策略。这一观点挑战了现有AI编程工具的定位,为开发者提供了新的思考方向。
AI产品编程助手AI系统工程系统架构HuggingFace开发者工具

推荐理由:做AI系统设计和架构的开发者会重新思考编程助手的价值——不只是帮你写代码,而是帮你做工程决策,值得点开看看这个观点。
原文
5月21日
08:00
08:00Julien Chaumond@julien_c
HuggingFace 联合创始人 Julien Chaumond 在 X 上发起讨论,探讨 Apple Silicon 是否是本地 AI 的最佳平台。该话题引发社区热议,目前已有 7 个点赞和 715 次浏览。讨论聚焦于 Apple Silicon 在运行本地 AI 模型时的性能、能效和生态优势,与 NVIDIA GPU 等传统方案形成对比。这反映了本地 AI 部署正从云端向边缘设备迁移的趋势,Apple Silicon 的 M 系列芯片因其统一内存架构和高效能而备受关注。
行业Apple Silicon本地AIHuggingFace边缘计算芯片对比

推荐理由:本地 AI 部署正在从云端走向桌面,Apple Silicon 的 M 系列芯片可能是最佳选择——做本地推理或边缘 AI 的开发者值得关注这场讨论。
原文
5月20日
21:52
21:52Julien Chaumond@julien_c
HuggingFace 推出硬件趋势页面,展示开源 AI 社区实际使用的 GPU、CPU 型号、VRAM 分布和推理硬件趋势。该页面基于真实社区使用数据,而非厂商宣传或基准测试,帮助开发者了解主流硬件配置。目前数据显示,NVIDIA 的 RTX 4090、A100 等 GPU 占据主导,VRAM 集中在 24GB 以上。这一工具对 AI 开发者选型、部署模型有直接参考价值。
行业HuggingFace硬件趋势GPU开源AI社区数据

推荐理由:HuggingFace 用真实社区数据告诉你大家都在用什么硬件跑模型,做部署选型的开发者可以直接参考,比看厂商宣传靠谱得多。
原文
5月19日
13:17
13:17Clement Delangue@ClementDelangue
HuggingFace CEO Clement Delangue 在Dell Technologies World主题演讲中宣布,与Dell合作推动基于HuggingFace开源模型的本地AI部署。他认为,本地AI相比云API更便宜、更快、更安全,是应对今年GPU短缺的重要方案。该合作旨在让企业能够更便捷地在本地运行开源模型,减少对云端GPU的依赖。
行业开源模型本地部署GPU短缺HuggingFaceDell

推荐理由:GPU短缺是今年AI部署的最大瓶颈之一,本地AI方案能直接帮企业省钱、提速、保安全,做企业AI落地的团队值得关注。
原文
5月16日
14:10
14:10Clement Delangue@ClementDelangue
HuggingFace CEO Clement Delangue 在采访中反驳了开源AI风险论,认为限制AI反而会增加风险。他以GPT-2和Mythos为例,指出当初被警告危险的模型最终并未造成灾难。他强调,在网络安全领域,少数玩家垄断能力才是最大风险,开源能让防御者更快反应。他用“有人会打人,所以绑住所有人的手”的比喻批评限制AI的逻辑。Delangue 警告,限制会拖慢进步、扩大能力差距,并制造新的风险。
行业开源AI安全HuggingFaceClement Delangue行业观点

推荐理由:开源与安全的争论从未停止——Delangue 用历史案例和比喻直击核心,做AI政策研究或开源项目的团队值得一看,能帮你理解反对限制的论据。
原文
5月15日
23:20
23:20Clement Delangue@ClementDelangue
HuggingFace 推出专为 AI 团队设计的存储服务,解决模型权重、数据集、检查点和工件等大文件的存储痛点。该服务提供简单的每TB定价、内置CDN加速、Xet去重技术,并默认支持私有存储。旨在让AI团队无需在昂贵的对象存储和繁琐的Git工作流之间做选择,直接在HuggingFace平台上管理AI数据。
AI产品HuggingFace存储服务模型权重数据集管理AI基础设施

推荐理由:做AI模型训练和数据集管理的团队终于有了一个专为AI工作流优化的存储方案,不用再纠结于通用对象存储的高成本或Git对大文件的低效处理,建议直接试试。
原文
精选全部日报登录