06:54IT之家(博客/媒体)72°谷歌发布 DiffusionGemma,一种基于文本扩散机制的开源 AI 模型,在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出,避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token,DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色,但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源,可从 Hugging Face 下载。AI模型扩散模型谷歌Gemma本地推理开源6 个信源在谈推荐理由:本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行,做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。原文
03:39Decoder@Jonathan Kemper72°Google 发布了 DiffusionGemma,一个 260 亿参数的开源模型。它不采用传统的逐词生成方式,而是通过扩散过程从噪声中生成文本,类似于图像 AI 的工作方式。据 Nvidia 称,该模型在单个 H100 GPU 上每秒可处理约 1000 个 token,速度是同类自回归模型的约 4 倍。但输出质量较低,因此 Google 目前将其定位为面向开发者的实验性工具。AI模型GoogleDiffusionGemma扩散模型开源模型推理加速10 个信源在谈推荐理由:DiffusionGemma 为文本生成开辟了新路径,追求推理速度的开发者可以尝试这种非自回归方案,尤其适合对实时性要求高的场景。原文
02:55Google DeepMind: Blog(博客/媒体)Google DeepMind 推出 DiffusionGemma,一种基于扩散模型的文本生成方法,相比传统自回归模型,生成速度提升 4 倍。该模型在保持生成质量的同时,显著降低了推理延迟,适用于需要快速响应的应用场景。DiffusionGemma 通过并行生成 token 而非逐个生成,实现了速度飞跃。这一进展对实时对话系统、内容生成等场景具有重要意义。AI模型文本生成扩散模型推理加速DeepMindDiffusionGemma推荐理由:做文本生成应用的开发者,如果你的产品对延迟敏感,DiffusionGemma 的 4 倍加速值得一试,能直接提升用户体验。原文
08:59marktechpost@Asif Razzaq精选Sakana AI 提出 DiffusionBlocks 框架,将残差网络中的每一层更新解释为逆向扩散去噪步骤,从而将网络分解为多个独立可训练的块。这种方法允许每个块单独训练,无需端到端反向传播,降低了训练复杂度和内存需求。实验表明,DiffusionBlocks 在图像生成任务上达到与标准残差网络相当的性能,同时训练效率更高。该工作为扩散模型与残差网络的结合提供了新思路,有望推动大规模模型的分布式训练。论文扩散模型残差网络块式训练Sakana AI图像生成推荐理由:Sakana AI 这个框架解决了残差网络训练中梯度回传的瓶颈,做大规模生成模型或分布式训练的团队值得关注——它让每个模块可以独立优化,直接降低显存和通信开销。原文
09:53Hugging Face: Blog(博客/媒体)精选NVIDIA 发布了 Nemotron-Labs 扩散语言模型,该模型采用扩散机制替代传统的自回归生成方式,大幅提升文本生成速度,接近光速。与 GPT-4 等模型相比,Nemotron-Labs 在保持生成质量的同时,推理速度提升了一个数量级。该模型在多个基准测试中表现出色,尤其适合需要低延迟的实时应用场景。这一突破可能改变大语言模型的部署范式,让文本生成更接近实时交互。AI模型扩散模型文本生成NVIDIA推理加速Nemotron-Labs2 个信源在谈推荐理由:NVIDIA 的扩散语言模型将文本生成速度推向新高度,做实时对话或低延迟应用的开发者可以直接关注,它可能改变你对大模型推理速度的认知。原文
16:33IT之家(博客/媒体)据路透社报道,微软正积极物色人工智能初创企业,为未来减少对OpenAI的依赖做准备。潜在收购旨在储备AI人才并打造顶尖模型,曾考虑收购代码生成公司Cursor但因监管担忧放弃。微软还与斯坦福团队创立的Inception洽谈,该公司采用扩散模型技术研发文本生成,估值期望超10亿美元。微软对OpenAI的累计投入已超1000亿美元,但双方矛盾渐显,近期协议已放宽限制。收购竞争激烈,SpaceX等对手也在争夺同一标的。行业微软OpenAI收购AI初创企业扩散模型3 个信源在谈推荐理由:微软的收购动向直接反映AI行业格局变化,做AI战略或投资的读者值得关注——这可能是微软自研模型的关键一步,也暗示OpenAI合作关系的松动。原文