全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

11:25

小互@imxiaohu

78°

Google 开源了 DiffusionGemma，一种基于扩散架构的语言模型，区别于逐词生成的 Transformer，它能一次性生成 256 个 tokens 的整块文本，再通过多轮迭代逐步优化。在 H100 上推理速度可达 1000+ tokens/s，RTX 5090 上 700+ tokens/s，26B 参数模型仅需 18GB 显存。其生成过程类似写草稿后反复修改，能自动修正前文错误，提升输出质量。这一开源模型为需要高吞吐、长文本生成的场景提供了新选择。

AI模型 Google DiffusionGemma 扩散模型开源/仓库文本生成

推荐理由：DiffusionGemma 解决了 Transformer 逐词生成速度慢、无法回头修改的痛点，做文本生成或长内容创作的开发者可以直接在消费级显卡上跑，体验 1000+ tokens/s 的生成速度。

原文

06:50

berryxia@berryxia

78°

Google 发布 DiffusionGemma，一种基于扩散模型的新型文本生成模型，速度可达 1000+ token/s，是传统自回归模型的 4 倍。它摒弃了逐词生成的方式，而是通过并行起草、纠错和精炼整段文本，实现高速生成。模型已以 Apache 2.0 协议开源，权重在 Hugging Face 上可获取，18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异，支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式，从串行生成转向并行炼句。

AI模型扩散模型文本生成开源/仓库 Google 并行生成

推荐理由：DiffusionGemma 把文本生成速度拉到 4 倍，还彻底开源，做本地部署或加速日常 workflow 的开发者可以直接拖权重玩。

原文

02:55

02:55Google DeepMind: Blog（博客/媒体）

Google DeepMind 推出 DiffusionGemma，一种基于扩散模型的文本生成方法，相比传统自回归模型，生成速度提升 4 倍。该模型在保持生成质量的同时，显著降低了推理延迟，适用于需要快速响应的应用场景。DiffusionGemma 通过并行生成 token 而非逐个生成，实现了速度飞跃。这一进展对实时对话系统、内容生成等场景具有重要意义。

AI模型文本生成扩散模型推理加速 DeepMind DiffusionGemma

推荐理由：做文本生成应用的开发者，如果你的产品对延迟敏感，DiffusionGemma 的 4 倍加速值得一试，能直接提升用户体验。

原文

01:33

Patrick Loeber@patloeber

Google 发布了 DiffusionGemma，一种基于扩散模型的文本生成新方法，相比传统自回归模型实现了4倍的速度提升。该模型已在 Hugging Face 上以 Apache 2.0 许可证开源，允许自由使用和修改。这一突破有望大幅降低文本生成的计算成本，对需要快速响应的应用场景尤为重要。开发者可以立即下载并集成到自己的项目中。

AI模型文本生成扩散模型开源/仓库 Google DiffusionGemma

推荐理由：文本生成速度提升4倍，对需要低延迟推理的开发者来说是个直接可用的利器，建议试试这个开源模型。

原文

00:39

Google DeepMind@GoogleDeepMind

Google DeepMind 推出实验性开放模型 DiffusionGemma，采用块级文本生成技术，不再逐词预测，而是同时生成整段文本。该模型在专用 GPU 上输出速度提升高达 4 倍，并能实时自我修正和格式化复杂 Markdown。这标志着文本生成范式的转变，尤其适合需要快速、高质量输出的场景。

AI模型 DiffusionGemma 文本生成块级生成速度提升开放模型

推荐理由：做文本生成或需要快速格式化 Markdown 的开发者，可以试试这个块级生成模型，速度提升明显且能自我纠错，值得关注。

原文

00:33

elvis@omarsar0

Google DeepMind 推出 DiffusionGemma，一种基于扩散的新型开放模型，可在专用 GPU 上实现最高 4 倍的输出加速。与传统逐词预测不同，它同时生成整段文本，并能在生成过程中自我纠错和实时格式化复杂 Markdown。该模型权重已在 Hugging Face 上开放。这对于文本扩散领域的研究者来说是一个重要进展，因为该方向目前仍有大量未探索的研究问题。

AI模型扩散模型文本生成 Google DeepMind DiffusionGemma 开源/仓库

推荐理由：文本扩散模型的研究者终于有了一个强大的开放基线——DiffusionGemma 同时生成整段文本并支持实时纠错，做生成式 AI 研究的团队值得下载权重试试。

原文

5月27日

10:49

arXiv cs.LG@Yuchen Liang, Ness Shroff, Yingbin Liang

精选

离散扩散模型在文本和符号领域表现优异，但均匀率模型生成样本时通常需要大量步骤。现有加速方法要么需要额外训练，要么混合速度慢。本文提出Gibbs加速离散扩散（GADD），利用具体分数函数结构直接构建Gibbs后验似然，无需额外训练。GADD实现了O(polylog(ε^{-1}))的采样复杂度，是均匀率离散扩散模型的首个此类理论保证。实验表明，GADD在合成数据、零样本文本生成和条件音乐生成中，显著提升了样本质量和计算效率，优于标准基线方法。

论文离散扩散模型 Gibbs校正器采样加速文本生成音乐生成

推荐理由：离散扩散模型加速一直是个难题，GADD用Gibbs校正器实现了理论最优采样复杂度，做生成模型的研究者可以直接参考其方法。

原文

5月23日

09:53

09:53Hugging Face: Blog（博客/媒体）

精选

NVIDIA 发布了 Nemotron-Labs 扩散语言模型，该模型采用扩散机制替代传统的自回归生成方式，大幅提升文本生成速度，接近光速。与 GPT-4 等模型相比，Nemotron-Labs 在保持生成质量的同时，推理速度提升了一个数量级。该模型在多个基准测试中表现出色，尤其适合需要低延迟的实时应用场景。这一突破可能改变大语言模型的部署范式，让文本生成更接近实时交互。

AI模型扩散模型文本生成 NVIDIA 推理加速 Nemotron-Labs

推荐理由：NVIDIA 的扩散语言模型将文本生成速度推向新高度，做实时对话或低延迟应用的开发者可以直接关注，它可能改变你对大模型推理速度的认知。

原文

5月19日

12:01

Geek@geekbb

72°

阿里巴巴通义千问团队发布了 Qwen 3.7 预览版，包括 Max 和 Plus 两个版本，已在 LMSYS Arena 上线。该模型在文本和视觉任务上表现强劲，使阿里在 Arena 文本榜单升至第6、视觉榜单升至第5。官方表示完整系列模型即将发布，值得期待。

AI模型 Qwen Arena 多模态文本生成阿里

推荐理由：Qwen 3.7 预览版在 Arena 上表现亮眼，阿里排名大幅提升，做多模态或文本生成的应用开发者可以关注后续正式版发布。

原文

5月15日

23:12

AlphaSignal@AlphaSignalAI

精选73°

研究人员提出Embedded Language Flows方法，让扩散模型在文本生成任务上仅需传统方法十分之一的数据量即可达到更优性能。该方法全程在连续嵌入空间操作，仅在最后一步将向量转换为单词，无需单独的解码器。通过预测干净嵌入而非噪声，并在训练中应用无分类器引导，该方法在语言基准测试中困惑度更低，并在翻译和摘要任务上超越自回归模型。这一成果挑战了“连续扩散在语言领域行不通”的普遍认知。

论文扩散模型文本生成连续嵌入 Embedded Language Flows NLP

推荐理由：扩散模型终于能高效处理文本了，做NLP或生成式AI的团队可以关注这个新范式——数据需求降低10倍，性能反而更好，值得一试。

原文

5月13日

00:33

00:33MiniMax: News（资讯）

AI产品 MiniMax 多模态文本生成语音合成视频生成

推荐理由：此次更新体现了 MiniMax 在 AI 多模态领域的持续投入，特别是 M2.7 和 Speech 2.8 的推出可能带来文本理解和语音合成性能的提升，值得关注其在开放平台上的实际表现。

原文

5月11日

22:16

AK@_akhaliq

该论文提出了一种连续潜在扩散语言模型（Continuous Latent Diffusion Language Model），将扩散模型应用于语言建模的潜在空间。与传统自回归模型不同，该方法在连续潜在空间中进行迭代去噪，可能提升生成质量和效率。论文展示了模型在文本生成任务上的初步结果，为语言建模提供了新的研究方向。这一工作将视觉领域成功的扩散模型扩展到自然语言处理，具有重要的理论意义和实践潜力。

论文扩散模型语言模型论文文本生成

推荐理由：这是扩散模型应用于语言建模的又一探索，为NLP领域提供了非自回归的新思路，值得关注其在文本生成和编辑等场景的后续进展。

原文