11:25小互@imxiaohu78°Google 开源了 DiffusionGemma,一种基于扩散架构的语言模型,区别于逐词生成的 Transformer,它能一次性生成 256 个 tokens 的整块文本,再通过多轮迭代逐步优化。在 H100 上推理速度可达 1000+ tokens/s,RTX 5090 上 700+ tokens/s,26B 参数模型仅需 18GB 显存。其生成过程类似写草稿后反复修改,能自动修正前文错误,提升输出质量。这一开源模型为需要高吞吐、长文本生成的场景提供了新选择。AI模型GoogleDiffusionGemma扩散模型开源/仓库文本生成6 个信源在谈推荐理由:DiffusionGemma 解决了 Transformer 逐词生成速度慢、无法回头修改的痛点,做文本生成或长内容创作的开发者可以直接在消费级显卡上跑,体验 1000+ tokens/s 的生成速度。原文
06:50berryxia@berryxia78°Google 发布 DiffusionGemma,一种基于扩散模型的新型文本生成模型,速度可达 1000+ token/s,是传统自回归模型的 4 倍。它摒弃了逐词生成的方式,而是通过并行起草、纠错和精炼整段文本,实现高速生成。模型已以 Apache 2.0 协议开源,权重在 Hugging Face 上可获取,18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异,支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式,从串行生成转向并行炼句。AI模型扩散模型文本生成开源/仓库Google并行生成推荐理由:DiffusionGemma 把文本生成速度拉到 4 倍,还彻底开源,做本地部署或加速日常 workflow 的开发者可以直接拖权重玩。原文
02:55Google DeepMind: Blog(博客/媒体)Google DeepMind 推出 DiffusionGemma,一种基于扩散模型的文本生成方法,相比传统自回归模型,生成速度提升 4 倍。该模型在保持生成质量的同时,显著降低了推理延迟,适用于需要快速响应的应用场景。DiffusionGemma 通过并行生成 token 而非逐个生成,实现了速度飞跃。这一进展对实时对话系统、内容生成等场景具有重要意义。AI模型文本生成扩散模型推理加速DeepMindDiffusionGemma推荐理由:做文本生成应用的开发者,如果你的产品对延迟敏感,DiffusionGemma 的 4 倍加速值得一试,能直接提升用户体验。原文
01:33Patrick Loeber@patloeberGoogle 发布了 DiffusionGemma,一种基于扩散模型的文本生成新方法,相比传统自回归模型实现了4倍的速度提升。该模型已在 Hugging Face 上以 Apache 2.0 许可证开源,允许自由使用和修改。这一突破有望大幅降低文本生成的计算成本,对需要快速响应的应用场景尤为重要。开发者可以立即下载并集成到自己的项目中。AI模型文本生成扩散模型开源/仓库GoogleDiffusionGemma推荐理由:文本生成速度提升4倍,对需要低延迟推理的开发者来说是个直接可用的利器,建议试试这个开源模型。原文
00:39Google DeepMind@GoogleDeepMindGoogle DeepMind 推出实验性开放模型 DiffusionGemma,采用块级文本生成技术,不再逐词预测,而是同时生成整段文本。该模型在专用 GPU 上输出速度提升高达 4 倍,并能实时自我修正和格式化复杂 Markdown。这标志着文本生成范式的转变,尤其适合需要快速、高质量输出的场景。AI模型DiffusionGemma文本生成块级生成速度提升开放模型推荐理由:做文本生成或需要快速格式化 Markdown 的开发者,可以试试这个块级生成模型,速度提升明显且能自我纠错,值得关注。原文
00:33elvis@omarsar0Google DeepMind 推出 DiffusionGemma,一种基于扩散的新型开放模型,可在专用 GPU 上实现最高 4 倍的输出加速。与传统逐词预测不同,它同时生成整段文本,并能在生成过程中自我纠错和实时格式化复杂 Markdown。该模型权重已在 Hugging Face 上开放。这对于文本扩散领域的研究者来说是一个重要进展,因为该方向目前仍有大量未探索的研究问题。AI模型扩散模型文本生成Google DeepMindDiffusionGemma开源/仓库推荐理由:文本扩散模型的研究者终于有了一个强大的开放基线——DiffusionGemma 同时生成整段文本并支持实时纠错,做生成式 AI 研究的团队值得下载权重试试。原文
10:49arXiv cs.LG@Yuchen Liang, Ness Shroff, Yingbin Liang精选离散扩散模型在文本和符号领域表现优异,但均匀率模型生成样本时通常需要大量步骤。现有加速方法要么需要额外训练,要么混合速度慢。本文提出Gibbs加速离散扩散(GADD),利用具体分数函数结构直接构建Gibbs后验似然,无需额外训练。GADD实现了O(polylog(ε^{-1}))的采样复杂度,是均匀率离散扩散模型的首个此类理论保证。实验表明,GADD在合成数据、零样本文本生成和条件音乐生成中,显著提升了样本质量和计算效率,优于标准基线方法。论文离散扩散模型Gibbs校正器采样加速文本生成音乐生成推荐理由:离散扩散模型加速一直是个难题,GADD用Gibbs校正器实现了理论最优采样复杂度,做生成模型的研究者可以直接参考其方法。原文
09:53Hugging Face: Blog(博客/媒体)精选NVIDIA 发布了 Nemotron-Labs 扩散语言模型,该模型采用扩散机制替代传统的自回归生成方式,大幅提升文本生成速度,接近光速。与 GPT-4 等模型相比,Nemotron-Labs 在保持生成质量的同时,推理速度提升了一个数量级。该模型在多个基准测试中表现出色,尤其适合需要低延迟的实时应用场景。这一突破可能改变大语言模型的部署范式,让文本生成更接近实时交互。AI模型扩散模型文本生成NVIDIA推理加速Nemotron-Labs2 个信源在谈推荐理由:NVIDIA 的扩散语言模型将文本生成速度推向新高度,做实时对话或低延迟应用的开发者可以直接关注,它可能改变你对大模型推理速度的认知。原文
12:01Geek@geekbb72°阿里巴巴通义千问团队发布了 Qwen 3.7 预览版,包括 Max 和 Plus 两个版本,已在 LMSYS Arena 上线。该模型在文本和视觉任务上表现强劲,使阿里在 Arena 文本榜单升至第6、视觉榜单升至第5。官方表示完整系列模型即将发布,值得期待。AI模型QwenArena多模态文本生成阿里推荐理由:Qwen 3.7 预览版在 Arena 上表现亮眼,阿里排名大幅提升,做多模态或文本生成的应用开发者可以关注后续正式版发布。原文
23:12AlphaSignal@AlphaSignalAI精选73°研究人员提出Embedded Language Flows方法,让扩散模型在文本生成任务上仅需传统方法十分之一的数据量即可达到更优性能。该方法全程在连续嵌入空间操作,仅在最后一步将向量转换为单词,无需单独的解码器。通过预测干净嵌入而非噪声,并在训练中应用无分类器引导,该方法在语言基准测试中困惑度更低,并在翻译和摘要任务上超越自回归模型。这一成果挑战了“连续扩散在语言领域行不通”的普遍认知。论文扩散模型文本生成连续嵌入Embedded Language FlowsNLP推荐理由:扩散模型终于能高效处理文本了,做NLP或生成式AI的团队可以关注这个新范式——数据需求降低10倍,性能反而更好,值得一试。原文
00:33MiniMax: News(资讯)MiniMax 在其官网展示了最新模型和产品的更新,包括文本模型 MiniMax M2.7 (NEW)、语音模型 MiniMax Speech 2.8 (NEW)、视频模型 MiniMax Hailuo 2.3 / 2.3 Fast (NEW) 以及音乐模型 MiniMax Music 2.6 和 2.5+ (NEW)。此外,AI 原生应用 Agent 也被标注为新产品状态。这些更新表明 MiniMax 正在快速迭代其多模态 AI 能力,涵盖文本、语音、视频和音乐生成领域。对于开发者和企业用户,这意味着可以通过开放平台获得更先进的 AI 能力,用于构建多样化的应用场景。AI产品MiniMax多模态文本生成语音合成视频生成推荐理由:此次更新体现了 MiniMax 在 AI 多模态领域的持续投入,特别是 M2.7 和 Speech 2.8 的推出可能带来文本理解和语音合成性能的提升,值得关注其在开放平台上的实际表现。原文
22:16AK@_akhaliq该论文提出了一种连续潜在扩散语言模型(Continuous Latent Diffusion Language Model),将扩散模型应用于语言建模的潜在空间。与传统自回归模型不同,该方法在连续潜在空间中进行迭代去噪,可能提升生成质量和效率。论文展示了模型在文本生成任务上的初步结果,为语言建模提供了新的研究方向。这一工作将视觉领域成功的扩散模型扩展到自然语言处理,具有重要的理论意义和实践潜力。论文扩散模型语言模型论文文本生成推荐理由:这是扩散模型应用于语言建模的又一探索,为NLP领域提供了非自回归的新思路,值得关注其在文本生成和编辑等场景的后续进展。原文