全部 AI 动态 · AI 热点

AITOP

6月4日

23:40

Paul Couvert@itsPaulAi

精选

NVIDIA发布了新的开源模型，其基准测试成绩与两倍大小的模型相当。该模型推理速度更快且成本更低。NVIDIA同时公开了模型权重、训练数据和配方。这标志着开源模型在效率上取得了进步。

AI模型 NVIDIA 开源模型基准测试

推荐理由：NVIDIA开源模型性价比高

原文

22:39

elvis@omarsar0

83°

NVIDIA 发布了 Nemotron 3 Ultra，一个 550B 参数的混合专家（MoE）开源模型，专为长时间运行的智能体任务优化。该模型在推理速度上比同类开源前沿模型快 5 倍，同时将复杂智能体任务的成本降低高达 30%。这标志着开源模型在支持本地长时间运行编程智能体方面迈出了重要一步，为开发者提供了更高效、更经济的替代方案。

AI模型 NVIDIA Nemotron 3 Ultra MoE 开源模型智能体

推荐理由：做智能体或编程助手的开发者终于有了一个开源的高效选择——Nemotron 3 Ultra 在速度和成本上显著优于同类模型，值得立即关注和测试。

原文

21:27

NVIDIA AI@NVIDIAAI

93°

NVIDIA 今日正式推出 Nemotron 3 Ultra，一款 550B 参数的 MoE（混合专家）开源模型，专为长时间运行的智能体任务设计。相比其他开源前沿模型，该模型推理速度提升 5 倍，复杂智能体任务成本降低高达 30%。Nemotron 3 Ultra 旨在解决长周期 AI 任务中的效率与成本瓶颈，为开发者提供更经济、更快速的智能体部署方案。NVIDIA 强调其“前沿智能”级别性能，并保持开源，进一步推动 AI 生态发展。

AI模型 NVIDIA Nemotron 3 Ultra MoE 开源模型智能体

推荐理由：做智能体开发和部署的团队终于有了一个兼顾性能与成本的开源选择——Nemotron 3 Ultra 的 5 倍推理加速和 30% 成本降低值得直接上手测试。

原文

12:18

小互@imxiaohu

78°

Google 发布了 Gemma 4 12B 开源模型，采用无编码器架构，能直接处理文字、图像、音频和视频四种输入，无需传统视觉或音频编码器。该模型可在 16GB 显存的笔记本上运行，4-bit 量化后仅需 8GB 显存。支持 256K Token 上下文窗口、140 多种语言，并内置逐步推理和原生函数调用功能。这一架构创新降低了多模态 AI 的硬件门槛，让普通用户也能在本地运行全模态模型。

AI模型 Gemma 4 开源模型多模态无编码器架构本地推理

推荐理由：无编码器架构让多模态模型不再依赖专用编码器，16GB 笔记本就能跑全模态 AI，做本地 AI 应用或边缘计算的开发者可以直接试试。

原文

10:00

Jeff Dean@JeffDean

精选

谷歌发布Gemma 4 12B模型，采用Apache 2.0许可证开放权重。该模型采用无编码器多模态架构，统一处理文本、图像等输入。12B参数规模可在笔记本电脑上直接运行，兼顾边缘效率与高级推理。

AI模型 Gemma 4 12B Google Apache 2.0 多模态开源模型

推荐理由：12B模型笔记本就能跑

原文

08:22

berryxia@berryxia

Google 昨晚发布了 Gemma 4 12B 多模态大模型，该模型支持文本和图像输入，最低只需 16GB 内存即可运行。这降低了多模态模型的本地部署门槛，适合个人开发者和资源受限的环境。与 Qwen 等同类模型的对比结果值得关注，可能影响开源多模态模型的竞争格局。

AI模型多模态模型 Gemma 4 Google 本地部署开源模型

推荐理由：多模态模型本地运行门槛进一步降低，做 AI 应用或本地部署的开发者可以关注 Gemma 4 与 Qwen 的对比，评估是否值得迁移或尝试。

原文

06:44

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 在 X 上发帖调侃，认为现在即使把开源模型命名为“0pus 4.8”或“GPT 5.S”放进应用，用户也会大量使用而不抱怨。他指出这是“前沿”营销的力量——品牌和命名比实际技术更能吸引用户。这条推文引发了关于 AI 行业品牌效应与真实技术差距的讨论。

行业开源模型品牌营销前沿模型用户认知 Hugging Face

推荐理由：做 AI 应用或营销的团队值得看看——品牌命名对用户认知的影响可能远超技术本身，别让“前沿”标签蒙蔽了你的判断。

原文

02:35

Demis Hassabis@demishassabis

精选

Google 发布 Gemma 4 12B 模型，庆祝其总下载量突破 1.5 亿次。该模型体积小巧，仅需 16GB VRAM 即可在笔记本上本地运行。采用 Apache 2.0 开源许可证，开发者可自由使用和修改。

AI模型 Gemma Gemma 4 Google 开源模型

推荐理由：小模型也能本地跑，性能强

原文

02:01

阶跃星辰 Stepfun@Stepfun_AI

StepFun 与 Modal 合作，发布了在 Modal 无服务器 AI 平台上部署 Step 3.7 Flash 模型的指南。该方案使用 8×H100 GPU、Modal Volumes 和 SGLang，提供 OpenAI 兼容的聊天补全端点。开发者无需管理基础设施即可快速部署和扩展推理工作负载。这降低了 StepFun 开源模型的使用门槛，让更多构建者能轻松调用。

AI产品 Step 3.7 Flash Modal SGLang 无服务器部署开源模型

推荐理由：想低成本部署开源推理模型的团队，现在可以直接在 Modal 上跑 Step 3.7 Flash，免去 GPU 管理烦恼，还自带 OpenAI 兼容接口，建议试试。

原文

01:28

SiliconFlowAI@siliconflowai

83°

AI模型 MiniMax M3 开源模型编码能力多模态

推荐理由：M3 把编码、长上下文和多模态三合一开源了，做 AI 应用开发的团队可以直接在 SiliconFlow 上低成本试用，编码能力还超过了 GPT-5.5，值得上手体验。

原文

00:32

lmarena.ai@lmarena_ai

76°

Ideogram-4.0-Quality 在文生图领域成为新的开源模型第一名，在所有子类别上相比前代有巨大提升。尤其在文本渲染和产品、品牌与商业设计方面进步最为显著。该模型在公开评测中表现优异，标志着开源文生图模型质量迈上新台阶。

AI模型 Ideogram-4.0-Quality 文生图开源模型文本渲染商业设计

推荐理由：做设计或品牌营销的团队终于有了一个能打的开源文生图模型——Ideogram-4.0-Quality 在文本渲染和商业设计上进步明显，值得直接上手试试。

原文

00:23

Replicate@replicate

精选

Ideogram 4.0 图像模型正式发布，原生支持 2K 分辨率，并显著提升了排版能力。该模型完全开源，用户可下载权重进行微调，并在本地硬件上运行。模型已上线所有 Ideogram 计划和 API。此前版本在文本渲染方面较弱，4.0 版本在这一领域取得了突破。

AI模型 Ideogram Ideogram 4.0 开源模型图像生成 2K分辨率

推荐理由：Ideogram 4.0 开源，2K原生，排版强

原文

6月3日

23:58

Ideogram@ideogram_ai

精选

Ideogram 4.0 正式发布，声称是当前最好的开源图像模型。模型权重可下载，支持用户在自己的数据上微调并在本地硬件运行。该模型已上线所有 Ideogram 订阅计划和 API。

AI模型 Ideogram 开源模型图像生成

推荐理由：Ideogram 4.0 开源了，能自己微调

原文

08:52

Clement Delangue@ClementDelangue

精选

Hugging Face CEO Clement Delangue 指出，UI 中自动的幕后模型路由（而非模型选择器）将把价值捕获和使用重新分配给更多模型，尤其是开源/小型/廉价模型。这消除了用户手动切换模型的认知负担，避免用户默认使用前沿模型。Factory 推出的 Router 功能可自动为每个任务选择最佳模型，在保持前沿性能的同时将成本降低 25%。这一趋势将改变 AI 应用的价值分配格局。

AI产品模型路由 Factory 成本优化开源模型 AI 应用

推荐理由：模型路由解决了用户手动选模型的痛点，做 AI 应用或 API 调用的团队可以直接用 Factory Router 降本增效，值得关注。

原文

6月2日

10:35

Harrison Chase@hwchase17

精选76°

MiniMax 正式发布 M3 模型，这是首个同时具备编码、智能体能力和原生多模态的开放权重模型。在 SWE-Bench Pro 上达到 59.0%，Terminal Bench 2.1 为 66.0%，并支持 1M 上下文窗口。模型权重和技术报告将在约 10 天后公开。开发者可通过 API 和专属代码平台 code.minimax.io 使用。

AI模型 MiniMax M3 开源模型编码能力智能体

推荐理由：MiniMax M3 把编码、智能体和多模态三合一开源，做 AI 应用和 Agent 开发的团队可以直接拿来用，尤其适合需要长上下文和复杂任务自动化的场景。

原文

10:14

Justine Moore@venturetwins

该推文汇总了 a16z 投资的多家 AI 初创公司，涵盖开源生成式模型、AI 照片工具、3D 世界模型、AI 角色实验室和矢量图形基础模型。这些项目代表了生成式 AI 在图像、视频、3D 和图形设计等领域的多元化应用。对于关注 AI 创业生态和开源模型的开发者、设计师和投资者来说，这是一份值得关注的公司清单。

行业 a16z 开源模型生成式 AI AI 创业投资

推荐理由：a16z 的 AI 投资版图揭示了生成式 AI 的下一个热点方向，做 AI 应用或模型开发的团队可以从中发现潜在合作或学习对象。

原文

08:23

Guillermo Rauch@rauchg

76°

MiniMax M3 在 Next.js 智能体评测中成为领先的开源模型，性能仅次于 Opus 和 GPT-5，但成本低 10 倍。这是 MiniMax 首个支持多模态输入的长上下文模型。Vercel 宣布 M3 已上线 AI Gateway，并提供一周 50% 折扣。开发者可以以极低成本获得接近顶级模型的智能体能力。

AI模型 MiniMax M3 开源模型智能体 Next.js 多模态

推荐理由：做 Next.js 智能体开发的团队终于有了高性价比的开源选择——M3 性能接近 Opus 但成本仅 1/10，Vercel 用户现在就能用上，建议立刻试试。

原文

02:53

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 发推称赞 NVIDIA 是“美国开源 AI 之王”，指出 NVIDIA 在 Hugging Face 上已拥有超过 1000 个公开仓库（820 个模型、249 个数据集、57 个空间），粉丝近 6 万。当前 HF 上排名第一的热门模型是 LocateAnything，排名第五的是 PiD。NVIDIA 宣布采用 Linux 基金会的 OpenMDW 框架，并发布了 Cosmos 3（用于物理 AI 的全模态世界模型）、Alphamayo 2 Super（自动驾驶开源模型），以及即将推出 Nemotron 3 和正在开发中的 Nemotron 4。这些成果展示了 NVIDIA 在开源 AI 生态中的持续投入和领导力。

行业 NVIDIA 开源模型 Hugging Face 自动驾驶物理AI

推荐理由：NVIDIA 在开源 AI 上的投入远超多数人想象——1000 个公开仓库、多个前沿模型，做 AI 研究或开发的团队值得关注这些新资源，尤其是 Cosmos 3 和 Nemotron 系列。

原文

6月1日

12:35

NVIDIA AI@NVIDIAAI

精选

NVIDIA AI 官方推特宣布，新一代大语言模型 Nemotron 3 Ultra 将于本周内推出。这是 Nemotron 系列的最新版本，具体参数和性能细节尚未披露。此前 Nemotron 4 340B 以推理基准上的表现受到关注，业界期待新版本能否进一步在效率和准确性上提升。

AI模型 Nemotron 3 Ultra NVIDIA 开源模型推理模型

推荐理由：NVIDIA 终于要发新模型了

原文

11:12

OpenRouter@OpenRouterAI

精选76°

MiniMax 发布了 M3 模型，这是首个同时具备编码、智能体与多模态能力的开源权重模型。在 SWE-Bench Pro 上达到 59.0%，Terminal Bench 2.1 上 66.0%，并支持 1M 上下文窗口。模型原生多模态，从零开始训练，权重和技术报告将在约 10 天后公开。API 已上线 platform.minimax.io，并提供 MiniMax Code 工具。

AI模型 MiniMax M3 开源模型编码智能体多模态

推荐理由：MiniMax M3 把编码、智能体和多模态三个前沿能力打包进一个开源模型，做 AI 应用开发或智能体研究的团队可以直接用 API 体验，值得关注即将开源的权重。

原文

11:11

OpenRouter@OpenRouterAI

精选76°

MiniMax-M3 是一款前沿开源权重模型，已在 OpenRouter 平台上线。它集成了 100 万 token 的超长上下文窗口、顶尖的编程与智能体能力，以及原生支持图像和视频的多模态处理。该模型在编码和智能体任务上表现卓越，同时保持了开源特性，为开发者和研究者提供了强大的工具。其 1M token 上下文窗口尤其适合处理长文档、复杂代码库和多模态数据融合场景。

AI模型 MiniMax-M3 开源模型长上下文多模态编程助手

推荐理由：MiniMax-M3 把长上下文、强编码和多模态塞进一个开源模型里，做复杂智能体或长文档处理的团队可以直接在 OpenRouter 上试，省去自己部署的麻烦。

原文

11:07

lmarena.ai@lmarena_ai

精选76°

MiniMax 发布开源权重模型 M3，首次在单一模型中融合编码、智能体与多模态三大前沿能力。在 SWE-Bench Pro 上达到 59.0%，Terminal Bench 2.1 为 66.0%，并支持 1M 上下文长度。模型已上线 Arena 的文本、视觉、文档和代码竞技场，用户可投票评测。权重和技术报告将在约 10 天后公开。

AI模型 MiniMax M3 开源模型编码智能体多模态 Arena

推荐理由：MiniMax M3 把编码、智能体和多模态塞进一个开源模型，做 AI 应用和 Agent 开发的团队可以直接在 Arena 上测效果，省去自己搭环境的时间。

原文

5月31日

09:58

elvis@omarsar0

行业开源模型闭源模型能力差距 Epoch AI 行业趋势

推荐理由：开源模型追赶速度超出预期，做模型选型或关注AI生态的开发者值得关注这一趋势，直接了解开源模型的最新进展。

原文

04:11

AI Notkilleveryone@ai_zona

AI Zona 在 Telegram 上推出了新频道 @AIZonaNews，专注于提供 AI 代理、初创公司和市场动态的精选信息。该频道承诺内容经过多个来源交叉验证，无噪音，每天更新三次，永久免费。订阅者将获得 AI 代理生态系统信号、融资与并购提醒、开源模型发布以及加密宏观动态。

行业 AI 代理初创公司市场动态 Telegram 频道开源模型

推荐理由：对于关注 AI 行业动态的从业者和投资者，这个频道提供了经过验证的精选信息，省去筛选噪音的时间，值得订阅。

原文

5月30日

16:06

Gary Marcus@GaryMarcus

精选

行业开源模型闭源模型能力差距 Epoch AI 商业模式

推荐理由：开源模型与闭源模型的差距被量化了——4个月的滞后对AI开发者和企业技术决策者来说是个关键信号，值得关注开源生态能否缩小这一差距。

原文

11:50

Harrison Chase@hwchase17

LangChain 的 LangSmith Signal 最新数据显示，开源模型正在经历爆发式增长。2026 年 4 月，已有 1/3 的 AI 团队运行过开源权重模型，而九个月前这一比例仅为 1/5。使用开源权重的团队总数增长了 3 倍。新用户选择开源模型的比率高于早期用户。这表明开源模型正从边缘走向主流，成为越来越多 AI 团队的首选。

行业开源模型 LangChain AI 团队行业趋势模型选型

推荐理由：开源模型的使用率翻倍增长，做 AI 应用或模型选型的团队值得关注这个趋势——新用户更倾向开源，意味着生态正在加速成熟。

原文

04:18

Fireworks AI@FireworksAI_HQ

Ramp Labs 在自家后端部署了 1 万个 AI 智能体进行安全测试，发现开源模型（Kimi K2.6 和 DeepSeek V4 Pro）在 Fireworks 上运行，能以比 GPT 5.5 低约 5 倍的 token 成本，成功发现 7 个高危漏洞。Ramp 表示如果重做，会更依赖开源模型。这为开源权重模型在安全领域的价值提供了有力证据，表明在 GPU 资源稀缺的背景下，成本和效果需要平衡。

行业开源模型安全测试智能体成本优化 Ramp Labs

推荐理由：做安全测试或 AI 落地的团队，这个案例直接告诉你：开源模型在真实生产代码中能低成本挖出高危漏洞，值得在预算有限时优先尝试。

原文

01:32

LangChain@LangChainAI

行业开源模型 AI 团队 LangSmith 行业趋势模型采用率

推荐理由：开源模型使用率翻倍增长，做 AI 开发的团队值得关注这一趋势——新用户更倾向开源，意味着生态正在成熟，建议评估是否将开源模型纳入技术栈。

原文

5月29日

23:55

AK@_akhaliq

OmniRetrieval 是一个新提出的统一检索框架，能够跨结构化数据库、非结构化文本和知识图谱等多种异构知识源进行检索。通过单一模型，它无需为每种数据源单独设计检索器，在多个基准测试中降低了检索延迟约30%。该工作由学术界联合发布，参数规模为7B，已开源模型权重。

AI模型 OmniRetrieval 统一检索异构知识源开源模型

推荐理由：跨源检索统一方案

原文

22:06

LangChain@LangChainAI

LangChain 发布 Deep Agents v0.6，将 Harness Profiles 提升为一等抽象，使得开发者可以轻松配置和优化模型推理。新版本支持 Kimi、Qwen、DeepSeek 等开源模型，在保持生产级性能的同时，成本仅为闭源前沿 API 的 1/20 以下。这为需要高性价比 AI 代理的团队提供了更灵活的选择。

AI产品 LangChain Deep Agents Harness Profiles 开源模型推理优化

推荐理由：做 AI 代理的团队终于可以低成本使用开源模型达到生产级性能，建议做推理优化的开发者直接试试 Harness Profiles 的调优功能。

原文

10:24

Clement Delangue@ClementDelangue

精选72°

Hugging Face CEO Clément Delangue指出，当前大多数人在用强化学习训练智能体LLM时，存在一个静默的bug：单轮RL表现完美，但加入工具调用后，损失函数会无故飙升，最终出现形状不匹配错误。根本原因在于，每次解析模型输出以检测工具调用时，重新对更新后的对话进行token化，可能导致梯度落在模型从未实际采样的序列上，从而产生无用的梯度信号。修复方法很简单：永远不要重新编码已经解码的token，将采样的token保存在一个缓冲区中，避免重新渲染。团队已发布深度分析，包括对主流开源模型家族的审计，显示大多数聊天模板已支持该修复。

论文强化学习智能体 Token编码训练陷阱开源模型

推荐理由：做多轮RL训练智能体LLM的团队，这个静默bug可能正在破坏你的训练曲线，看完这篇分析能直接修复，省下大量调试时间。

原文

08:01

Fireworks AI@FireworksAI_HQ

Fireworks AI 宣布其平台每日处理30万亿token，且开源模型的使用份额持续增长。其合作伙伴 Factory AI 的数据显示，过去一个月内，开源模型的使用量（按总消耗和事件数计算）相比闭源模型增长了3倍以上。这一趋势表明，开源模型在企业级应用中的采用率正在加速，可能改变AI行业的竞争格局。Fireworks AI 创始人表示，年底时开源与闭源模型的token份额对比将值得关注。

行业开源模型闭源模型 token份额 Fireworks AI Factory AI

推荐理由：开源模型在真实生产环境中的使用量已经超过闭源模型3倍，做AI部署和模型选型的团队值得关注这一趋势变化。

原文

5月28日

09:43

Latent.Space@latentspacepod

83°

Alex Rives 团队宣布推出 ESMFold2，一个开源的科学引擎，用于蛋白质预测、设计和发现。该模型在蛋白质相互作用（尤其是抗体）方面达到最先进水平，这是治疗药物的关键模态。团队针对五个重要的癌症和免疫学治疗靶点，设计并验证了迷你蛋白结合剂和单链抗体，成功率极高，亲和力达到治疗活性水平。同时发布了包含 68 亿蛋白质和 11 亿预测结构的图谱。ESMFold2 基于在数十亿蛋白质序列上训练的语言模型，通过语言建模自然涌现出蛋白质生物学的世界模型，其表征空间反映了通过一个世纪实证科学积累的理解。

AI模型 ESMFold2 蛋白质预测抗体设计开源模型药物发现

推荐理由：ESMFold2 将语言模型用于蛋白质设计，解决了抗体和蛋白结合剂设计这一基础难题，做药物发现和生物工程的团队可以直接用这个开源模型加速新药研发。

原文

5月26日

20:27

Hunyuan@TXhunyuan

精选

腾讯混元宣布Hy-MT2模型转换为Apache License 2.0许可，允许自由研究、商业使用、微调和衍生作品。该模型的两个变体目前在Hugging Face趋势排行榜上分别位列第1和第4位。社区可直接克隆、修改并反馈。

AI模型 Hy-MT2 Tencent Hunyuan Apache 2.0 开源模型

推荐理由：腾讯混元MT2现在完全开源可商用

原文

10:50

Hunyuan@TXhunyuan

精选

腾讯混元发布Hy-MT2系列翻译模型，包含Hy-MT2-1.8B和Hy-MT2-30B-A3B两个版本。Hy-MT2-1.8B在Hugging Face开源模型趋势排行榜位列第1，Hy-MT2-30B-A3B位列第4，两者合计下载量已超7000次。同时基于Hy-MT2推出腾讯Hy翻译微信小程序，支持语音输入、离线翻译以及自定义翻译风格与指令。

AI模型 Hy-MT2 Tencent Hunyuan 翻译模型开源模型 Hugging Face

推荐理由：腾讯翻译模型冲上榜首

原文

5月25日

04:03

Ate-a-Pi@svpino

精选

开发者 Santiago 发现可以用 Ollama 启动 Claude Code 并指定开源模型（如 Gemma 4:26B），但这样会失去使用 Anthropic 官方模型的能力。他询问是否有办法在 Claude Code 中同时使用 Anthropic 模型和开源模型。这反映了开发者对模型灵活性的需求，以及当前工具在模型切换上的限制。

AI产品 Claude Code 开源模型 Ollama 模型切换开发者工具

推荐理由：如果你在用 Claude Code 做开发，又想尝试开源模型，这个痛点值得关注——目前无法同时使用两种模型，但社区可能有解决方案。

原文

5月22日

22:38

Paul Couvert@itsPaulAi

精选76°

Qwen-3.7-max 在真实智能体任务（编写自训练俄罗斯方块机器人）中，以 1.32 美元成本实现 56% 的改进，远超 Claude Opus 4.7（12.15 美元，28% 改进）和 GPT-5.5（2.85 美元，7% 改进）。该模型在长智能体循环中表现突出，成本仅为 Opus 4.7 的 1/9、GPT-5.5 的 1/2。这一结果出乎意料，展示了开源模型在复杂自主任务上的潜力。

AI模型 Qwen-3.7-max 智能体成本对比开源模型 GPT-5.5

推荐理由：做智能体开发或自动化任务的团队，可以拿 Qwen-3.7-max 替代高价闭源模型，成本直降 9 倍效果反而更好，值得立刻跑个 benchmark 验证。

原文

10:27

Geek@geekbb

精选

腾讯发布Hy-MT2翻译模型，参数量1.8B。该模型在配置较低的Mac mini上实测翻译效果不错，表明小参数模型可胜任设备端翻译任务。Hy-MT2已在Hugging Face平台开放下载。

AI模型 Hy-MT2 腾讯翻译模型开源模型

推荐理由：丐版Mac mini也能跑翻译

原文

08:05

lmarena.ai@lmarena_ai

HiDream AI 推出的 HiDream-01-Image 模型在 Text-to-Image Arena 中综合排名第27，成为排名第4的开源文生图模型。该模型在开源社区中表现出色，超越了多数同类开源模型，展示了 HiDream AI 在图像生成领域的实力。这一成绩意味着开发者可以免费使用接近闭源顶尖水平的文生图能力。

AI模型文生图开源模型 HiDream-01-Image HiDream_AI 模型排名

推荐理由：开源文生图模型又添猛将，HiDream-01-Image 排名第4，做图像生成应用的团队可以直接拿来用，性价比很高。

原文

08:05

Thomas Wolf@Thom_Wolf

微软因基于 token 的计费成本过高，本周取消了内部 Claude Code 许可证，即使拥有无限云资源也难以承受。Uber CTO 内部备忘录警告，公司在四个月内烧光了 2026 年整个 AI 预算。美国 AI 软件价格已上涨 20% 至 37%，GitHub 也正从固定费率转向按用量计费。AI 补贴时代正在终结，token 定价迫使企业面对大规模运行模型的真实成本，远高于固定费率实验时的预期。这可能导致企业缩减 AI 使用以匹配预算，或实验室降价吸收亏损，两种路径都指向数字不再奏效，最终需要有人承担减值。

行业开源模型 AI成本企业级AI token计费微软

推荐理由：AI 补贴时代正在终结，企业级用户和开发者需要重新评估 AI 成本——微软和 Uber 的案例是真实预警，做 AI 采购或预算规划的人值得点开了解。

原文