№24gb·general
24gb
别名
- 首次出现
- 2026-05-29
- 最近出现
- 2026-06-11
- 累计提及
- 20
§ 01综述
近期,AI 模型对显存的需求持续成为焦点,特别是 24GB 显存成为用户心照不宣的“及格线”。多家机构推出能在 24GB GPU 上运行的新模型,同时也在探索加速推理的新架构。
Ideogram 开源高效版模型:Ideogram 发布了 9.3B 参数的 Diffusion Transformer 模型 Ideogram 4.0,并进一步开源了 fp8 和 nf4 量化版本。其中 nf4 版本显存占用低至 24GB,使消费级显卡(如 RTX 4090)即可运行大型图像生成模型 ((Ideogram 开源 fp8/nf4 模型,nf4 可在 24GB GPU 运行](https://x.com/ideogram_ai/status/2062956472489922584)) ((Ideogram 4.0 发布:9.3B Diffusion Transformer 可在 24GB 显卡运行](https://x.com/ideogram_ai/status/2062956373957292281))。
Google 推出 DiffusionGemma:Google DeepMind 发布实验性文本扩散模型 DiffusionGemma,通过并行生成 256 个 token,将推理速度提升 4 倍。该模型虽然对显存有一定要求,但其创新方向为降低部署门槛提供了新思路 ((Google DeepMind 发布 DiffusionGemma,并行生成 256 tokens,速度提升 4 倍](https://x.com/NVIDIAAI/status/2064770996603863328)) ((Google 发布 DiffusionGemma:实验性开放文本扩散模型,速度提升 4 倍](https://x.com/googleaidevs/status/2064743223491449013))。
当前焦点在于:24GB 显存正成为消费级与专业级的分水岭。模型通过量化(如 nf4)和架构创新(如并行扩散),努力让更多用户能在单卡上完成推理。未来可观察量化方案的普及度,以及是否有更高效的模型结构进一步下调显存门槛。