全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

06:54

06:54IT之家（博客/媒体）

72°

谷歌发布 DiffusionGemma，一种基于文本扩散机制的开源 AI 模型，在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出，避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token，DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色，但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源，可从 Hugging Face 下载。

AI模型扩散模型谷歌 Gemma 本地推理开源

推荐理由：本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行，做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。

03:39

03:39

Decoder@Jonathan Kemper

72°

Google 发布了 DiffusionGemma，一个 260 亿参数的开源模型。它不采用传统的逐词生成方式，而是通过扩散过程从噪声中生成文本，类似于图像 AI 的工作方式。据 Nvidia 称，该模型在单个 H100 GPU 上每秒可处理约 1000 个 token，速度是同类自回归模型的约 4 倍。但输出质量较低，因此 Google 目前将其定位为面向开发者的实验性工具。

AI模型 Google DiffusionGemma 扩散模型开源模型推理加速

推荐理由：DiffusionGemma 为文本生成开辟了新路径，追求推理速度的开发者可以尝试这种非自回归方案，尤其适合对实时性要求高的场景。

02:55

02:55Google DeepMind: Blog（博客/媒体）

Google DeepMind 推出 DiffusionGemma，一种基于扩散模型的文本生成方法，相比传统自回归模型，生成速度提升 4 倍。该模型在保持生成质量的同时，显著降低了推理延迟，适用于需要快速响应的应用场景。DiffusionGemma 通过并行生成 token 而非逐个生成，实现了速度飞跃。这一进展对实时对话系统、内容生成等场景具有重要意义。

AI模型文本生成扩散模型推理加速 DeepMind DiffusionGemma

推荐理由：做文本生成应用的开发者，如果你的产品对延迟敏感，DiffusionGemma 的 4 倍加速值得一试，能直接提升用户体验。

5月28日

08:59

08:59

marktechpost@Asif Razzaq

精选

Sakana AI 提出 DiffusionBlocks 框架，将残差网络中的每一层更新解释为逆向扩散去噪步骤，从而将网络分解为多个独立可训练的块。这种方法允许每个块单独训练，无需端到端反向传播，降低了训练复杂度和内存需求。实验表明，DiffusionBlocks 在图像生成任务上达到与标准残差网络相当的性能，同时训练效率更高。该工作为扩散模型与残差网络的结合提供了新思路，有望推动大规模模型的分布式训练。

论文扩散模型残差网络块式训练 Sakana AI 图像生成

推荐理由：Sakana AI 这个框架解决了残差网络训练中梯度回传的瓶颈，做大规模生成模型或分布式训练的团队值得关注——它让每个模块可以独立优化，直接降低显存和通信开销。

5月23日

09:53

09:53Hugging Face: Blog（博客/媒体）

精选

NVIDIA 发布了 Nemotron-Labs 扩散语言模型，该模型采用扩散机制替代传统的自回归生成方式，大幅提升文本生成速度，接近光速。与 GPT-4 等模型相比，Nemotron-Labs 在保持生成质量的同时，推理速度提升了一个数量级。该模型在多个基准测试中表现出色，尤其适合需要低延迟的实时应用场景。这一突破可能改变大语言模型的部署范式，让文本生成更接近实时交互。

AI模型扩散模型文本生成 NVIDIA 推理加速 Nemotron-Labs

推荐理由：NVIDIA 的扩散语言模型将文本生成速度推向新高度，做实时对话或低延迟应用的开发者可以直接关注，它可能改变你对大模型推理速度的认知。

5月14日

16:33

16:33IT之家（博客/媒体）

据路透社报道，微软正积极物色人工智能初创企业，为未来减少对OpenAI的依赖做准备。潜在收购旨在储备AI人才并打造顶尖模型，曾考虑收购代码生成公司Cursor但因监管担忧放弃。微软还与斯坦福团队创立的Inception洽谈，该公司采用扩散模型技术研发文本生成，估值期望超10亿美元。微软对OpenAI的累计投入已超1000亿美元，但双方矛盾渐显，近期协议已放宽限制。收购竞争激烈，SpaceX等对手也在争夺同一标的。

行业微软 OpenAI 收购 AI初创企业扩散模型

推荐理由：微软的收购动向直接反映AI行业格局变化，做AI战略或投资的读者值得关注——这可能是微软自研模型的关键一步，也暗示OpenAI合作关系的松动。