全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

11:25

小互@imxiaohu

78°

Google 开源了 DiffusionGemma，一种基于扩散架构的语言模型，区别于逐词生成的 Transformer，它能一次性生成 256 个 tokens 的整块文本，再通过多轮迭代逐步优化。在 H100 上推理速度可达 1000+ tokens/s，RTX 5090 上 700+ tokens/s，26B 参数模型仅需 18GB 显存。其生成过程类似写草稿后反复修改，能自动修正前文错误，提升输出质量。这一开源模型为需要高吞吐、长文本生成的场景提供了新选择。

AI模型 Google DiffusionGemma 扩散模型开源/仓库文本生成

推荐理由：DiffusionGemma 解决了 Transformer 逐词生成速度慢、无法回头修改的痛点，做文本生成或长内容创作的开发者可以直接在消费级显卡上跑，体验 1000+ tokens/s 的生成速度。

原文

06:50

berryxia@berryxia

78°

Google 发布 DiffusionGemma，一种基于扩散模型的新型文本生成模型，速度可达 1000+ token/s，是传统自回归模型的 4 倍。它摒弃了逐词生成的方式，而是通过并行起草、纠错和精炼整段文本，实现高速生成。模型已以 Apache 2.0 协议开源，权重在 Hugging Face 上可获取，18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异，支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式，从串行生成转向并行炼句。

AI模型扩散模型文本生成开源/仓库 Google 并行生成

推荐理由：DiffusionGemma 把文本生成速度拉到 4 倍，还彻底开源，做本地部署或加速日常 workflow 的开发者可以直接拖权重玩。

原文

01:33

Patrick Loeber@patloeber

Google 发布了 DiffusionGemma，一种基于扩散模型的文本生成新方法，相比传统自回归模型实现了4倍的速度提升。该模型已在 Hugging Face 上以 Apache 2.0 许可证开源，允许自由使用和修改。这一突破有望大幅降低文本生成的计算成本，对需要快速响应的应用场景尤为重要。开发者可以立即下载并集成到自己的项目中。

AI模型文本生成扩散模型开源/仓库 Google DiffusionGemma

推荐理由：文本生成速度提升4倍，对需要低延迟推理的开发者来说是个直接可用的利器，建议试试这个开源模型。

原文

00:39

Google DeepMind@GoogleDeepMind

Google DeepMind 推出实验性开放模型 DiffusionGemma，采用块级文本生成技术，不再逐词预测，而是同时生成整段文本。该模型在专用 GPU 上输出速度提升高达 4 倍，并能实时自我修正和格式化复杂 Markdown。这标志着文本生成范式的转变，尤其适合需要快速、高质量输出的场景。

AI模型 DiffusionGemma 文本生成块级生成速度提升开放模型

推荐理由：做文本生成或需要快速格式化 Markdown 的开发者，可以试试这个块级生成模型，速度提升明显且能自我纠错，值得关注。

原文

00:33

elvis@omarsar0

Google DeepMind 推出 DiffusionGemma，一种基于扩散的新型开放模型，可在专用 GPU 上实现最高 4 倍的输出加速。与传统逐词预测不同，它同时生成整段文本，并能在生成过程中自我纠错和实时格式化复杂 Markdown。该模型权重已在 Hugging Face 上开放。这对于文本扩散领域的研究者来说是一个重要进展，因为该方向目前仍有大量未探索的研究问题。

AI模型扩散模型文本生成 Google DeepMind DiffusionGemma 开源/仓库

推荐理由：文本扩散模型的研究者终于有了一个强大的开放基线——DiffusionGemma 同时生成整段文本并支持实时纠错，做生成式 AI 研究的团队值得下载权重试试。

原文

5月19日

12:01

Geek@geekbb

72°

阿里巴巴通义千问团队发布了 Qwen 3.7 预览版，包括 Max 和 Plus 两个版本，已在 LMSYS Arena 上线。该模型在文本和视觉任务上表现强劲，使阿里在 Arena 文本榜单升至第6、视觉榜单升至第5。官方表示完整系列模型即将发布，值得期待。

AI模型 Qwen Arena 多模态文本生成阿里

推荐理由：Qwen 3.7 预览版在 Arena 上表现亮眼，阿里排名大幅提升，做多模态或文本生成的应用开发者可以关注后续正式版发布。

原文

5月15日

23:12

AlphaSignal@AlphaSignalAI

精选73°

研究人员提出Embedded Language Flows方法，让扩散模型在文本生成任务上仅需传统方法十分之一的数据量即可达到更优性能。该方法全程在连续嵌入空间操作，仅在最后一步将向量转换为单词，无需单独的解码器。通过预测干净嵌入而非噪声，并在训练中应用无分类器引导，该方法在语言基准测试中困惑度更低，并在翻译和摘要任务上超越自回归模型。这一成果挑战了“连续扩散在语言领域行不通”的普遍认知。

论文扩散模型文本生成连续嵌入 Embedded Language Flows NLP

推荐理由：扩散模型终于能高效处理文本了，做NLP或生成式AI的团队可以关注这个新范式——数据需求降低10倍，性能反而更好，值得一试。

原文