全部 AI 动态 · AI 热点

6月30日

06:35

vLLM@vllm_project

vLLM 社区正在将 DeepSeek 的 DSpark 推测解码算法集成到 vLLM 推理引擎中。DSpark 是一种推测解码算法，能显著提升大语言模型的推理速度。该集成旨在为所有 vLLM 用户带来更快的推理性能，无需额外配置。目前社区正在积极开发中，预计将提升 vLLM 的吞吐量并降低延迟。

AI模型 vLLM DeepSeek DSpark 推理加速开源模型

推荐理由：vLLM 社区正在把 DeepSeek 的 DSpark 算法加进来，推理速度能再上一个台阶，用 vLLM 的朋友可以期待了。

原文

03:07

@koltregaskes@koltregaskes

Ethan Mollick根据Artificial Analysis的AA-Briefcase分数，绘制了AI模型在复杂多周咨询任务上的表现趋势。AA-Briefcase测试模型处理电子表格和策略规划等可交付成果。GLM-5.2等开源模型目前达到的水平，与闭源模型三个月前的分数一致。高端闭源模型仍保持明显领先，但差距在缩小。

AI模型 GLM-5.2 AA-Briefcase 开源模型智能体基准测试

推荐理由：开源模型GLM-5.2在AA-Briefcase智能体基准上只差闭源三个月了，做复杂任务时值得试试看。

原文

03:06

@koltregaskes@koltregaskes

79°

DeepSeek v4 将于 7 月中旬进入通用可用（GA）阶段，部分用户已收到相关邮件通知。该版本带来更多功能优化和性能改进。具体改进细节尚未完全公开，但用户可期待更优的模型能力。

AI模型 DeepSeek v4 DeepSeek 开源模型推理模型

推荐理由：DeepSeek v4 马上 GA 了，7 月中旬上线，性能有优化，想尝鲜的可以关注。

原文

01:17

01:17Simon Willison’s Weblog（博客/媒体）

精选

DeepReinforce 发布 Ornith-1.0，一款 MIT 许可的开源模型，基于 Gemma 4 和 Qwen 3.5 预训练。提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。在编码基准上达到同尺寸开源模型 SOTA。作者在 LM Studio 上测试 35B Q4_K_M GGUF 版本，能流畅运行代理工具调用并处理代码定位任务。

AI模型 Ornith-1.0 DeepReinforce Gemma 4 Qwen 3.5 开源模型

推荐理由：DeepReinforce 新出的开源编码模型，基于 Gemma 4 和 Qwen 3.5，在代理编码任务上表现不错，LM Studio 就能跑，值得试试。

原文

6月29日

17:55

Yangyi@Yangyixxxx

用户认为FunASR模型在大部分场景下可用，精度偶尔不足。建议套用LLM进行修复，可解决绝大多数问题。其被评价为中国版Whisper中性价比最高的方案。

AI模型 FunASR ASR 语音识别 LLM 开源模型

推荐理由：有实测用户说FunASR比Whisper更值，精度不够时加个LLM就能补上，做中文语音识别可以试试。

原文

16:27

Pandaily@contact@pandaily.com (Pandaily)

精选73°

DeepSeek 与北京大学联合开发的 DSpark 推理系统获得 PyTorch 核心维护者 Dmytro Dzhulgakov 的详细技术分析。他重点称赞 DSpark 的半并行草稿（semi-parallel drafting）机制，能提升推理吞吐量。分析指出该系统达到生产级工程水平（production-grade engineering），在特定负载下相比基线有显著加速。这一评测为开源推理系统提供了高含金量的第三方验证。

AI模型 DeepSeek DSpark PyTorch 推理模型开源模型

推荐理由：PyTorch 核心大佬亲自下场拆解 DeepSeek 的 DSpark，说它半并行草稿很牛、工程落地扎实，搞推理优化的必看。

原文

13:59

Ate-a-Pi@svpino

中国AI公司纷纷发布自己的SOTA（State-of-the-Art）模型，但所有公司都选择将其开源。与美国的封闭模式不同，中国企业在激烈竞争的同时，将模型权重和代码公开分享给全球社区。这种独特的生态让外界看到中国AI发展的另一条路径。

行业中国开源模型 SOTA AI生态

推荐理由：中国AI公司都在卷开源，跟美国完全不一样，看看他们怎么一边竞争一边分享的。

原文

13:52

EleutherAI@AiEleuther

EleutherAI在ICML 2024会议上发布了参会指南。指南包含了他们在会议期间的展位和演讲安排。参会者可通过链接获取详细位置信息。

技巧 EleutherAI ICML 开源模型活动指南

推荐理由：EleutherAI发了他们在ICML的定位指南，想去现场找他们的可以看看，免得错过。

原文

13:51

Together AI@togethercompute

精选

随着Token使用量爆发式增长，模型选择已从技术决策变为产品策略。团队正在测试GLM-5.2等新模型，追求前沿质量与更好的Token经济学。Together AI正在构建面向开源模型未来的推理层，以提供更可控的成本、数据和部署选项。

行业 GLM-5.2 Together AI 推理层开源模型 Token经济学

推荐理由：团队开始用GLM-5.2替换闭源模型？Together AI的推理层让开源模型更可控，想省钱又保质量可以看看。

原文

13:51

Together AI@togethercompute

精选

智谱AI的GLM-5.2模型在Together AI平台展示了端到端代码修复能力，可读取issue、推理场景并自动生成补丁。一年前这类任务还被认为是闭源模型（如GPT-4）的专属领域，如今开源模型已能胜任。该模型未公布具体基准分数，但实际演示表明其编程推理能力接近闭源水平。

AI模型 GLM-5.2 Together AI 推理模型编程助手开源模型

推荐理由：开源模型GLM-5.2能自己读代码问题、推理并修复，以前只有闭源模型才能做到，现在用Together AI就能跑。

原文

13:49

阶跃星辰 Stepfun@Stepfun_AI

精选

Step 3.7 Flash 是开源多模态推理模型，现已在 DeepInfra API 上线。该模型支持私有端点部署，适用于专用负载场景。它专为智能体编码、工具使用、搜索和视觉工作流设计。开发者可通过 DeepInfra 的 API 直接调用。

AI模型 Step 3.7 Flash DeepInfra 多模态推理模型开源模型

推荐理由：Step 3.7 Flash 开源多模态推理模型刚上线 DeepInfra，支持私有部署，适合智能体编程和视觉任务，开发者可以试试。

原文

13:49

Ethan Mollick@emollick

GLM-5.2是一款开源模型，其性能不及GPT-5.5和Opus 4.8，更远不及Mythos。但它表现扎实，表明开源模型持续追赶前沿。当前开源权重已触及GPT-5.2水平，在该能力区间表现显著。这一进展说明开源模型正在缩小与闭源前沿的差距。

AI模型 GLM-5.2 GPT-5.5 Opus 4.8 Mythos 开源模型

推荐理由：GLM-5.2虽然没追上GPT-5.5，但开源模型又往前迈了一大步，能力提升明显，值得关注。

原文

06:18

Gary Marcus@GaryMarcus

GLM 5.2 被称作开源界的 Claude 时刻，在 Databricks 平台上需求惊人。Yuchen Jin 指出，该模型遵循已知公式，导致技术壁垒消失、市场趋同、价格战开始，利润率趋小或为负。越来越多公司将转向基于开源模型进行后训练并拥有权重。GaryMarcus 认为这是其三年来论证的无技术护城河、价格战、低利润率趋势的最终体现。

AI模型 GLM 开源模型价格战 Databricks AI市场

推荐理由：GLM 5.2 开源版火了，Databricks 上抢着用，价格战要来了，想用低成本模型得看看这个趋势。

原文

00:16

量子位@听雨

Yuxinlu1在Hugging Face模型排行榜上击败多家大厂模型，登顶多个细分榜单。该账号发布的模型综合得分领先于Meta、Google等公司的开源项目。排行榜显示其推理效率与准确率均达到SOTA水平。

AI模型 yuxinlu1 Hugging Face 模型排行榜开源模型

推荐理由：一个个人开发者干翻大厂，看看yuxinlu1到底做了什么模型这么强

原文

00:01

Clement Delangue@ClementDelangue

精选

Hugging Face CEO Clement Delangue认为，当前最危险的AI系统是闭源前沿API模型（如通过编程助手分发的LLM），它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级：易于分析、能力较弱、传播更可控，且保护者与攻击者平等获取。监管前沿API只需针对少数巨头，成本低且容易执行；监管开源则会伤害小企业、研究者、大学等群体，并降低透明度。

行业 Hugging Face 开源模型 AI监管前沿模型

推荐理由：Hugging Face CEO直言政府该管闭源API而不是开源模型，点出了监管争论中被忽略的黑箱风险。

原文

6月28日

16:03

Decoder@Jonathan Kemper

精选

新浪微博发布开源模型VibeThinker-3B，仅30亿参数。在数学和编程基准上，它匹配了DeepSeek V3.2和Kimi K2.5，后两者参数规模大333倍。模型通过多阶段后训练实现高性能。研究人员假设：逻辑推理可压缩进小模型，但广泛世界知识不行。

AI模型 VibeThinker-3B 新浪推理模型开源模型

推荐理由：30亿参数的小模型推理能力居然能打千亿级大模型，新浪VibeThinker-3B在数学和编程上很强，而且开源了。

原文

14:34

量子位@林樾

百度在GitHub开源了全新OCR模型，模型名称暂未公开，但根据展示能一次性识别整本图书内容。该模型作者被社区推测为前DeepSeek研究员。项目已在GitHub托管，提供预训练权重和API文档。

AI模型百度 OCR 开源模型 DeepSeek

推荐理由：百度搞了个能扫整本书的OCR，还开源了，做文档处理的可以试试。

原文

13:01

marktechpost@Asif Razzaq

精选

Liquid AI 发布了 LFM2.5-230M，这是其最小的 230M 参数开源权重模型。该模型在 Galaxy S25 Ultra 上达到 213 tok/s，在 Raspberry Pi 5 上为 42 tok/s。基于 LFM2 架构，它专注于工具使用和数据提取，在指令遵循上击败了 Qwen3.5-0.8B 和 Gemma 3 1B 等更大模型。模型支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 框架。

AI模型 LFM2.5-230M Liquid AI 开源模型设备端推理推理框架

推荐理由：Liquid AI 出了个超小模型 LFM2.5-230M，手机跑 213 tokens 每秒，树莓派也能跑 42，指令遵循还比 Qwen3.5-0.8B 和 Gemma 3 1B 强。

原文

07:07

Suhail@Suhail

精选

Hamish Ivison等人发布了Tmax，一个基于强化学习的开源终端智能体模型。在默认设置和65k token预算下，Tmax优于之前的开源终端使用工作。团队公开了所有训练数据、模型权重和rollouts，方便复现和进一步研究。

AI模型 Tmax RL terminal agent 开源模型智能体

推荐理由：Tmax把终端智能体的RL训练配方全开源了，65k token里就跑赢之前的工作，想自己训智能体的可以抄作业。

原文

05:01

ollama@ollama

精选

Ollama 宣布支持运行 Ornith 1.0 系列模型，包括 9B、31B Dense、35B MoE 和 397B MoE 四个版本。该模型在 SWE-Bench verified 上达到 82.4，Terminal-Bench 2.1 得分 77.5，多语言 SWE-Bench 得分 78.9。它基于 Gemma4 和 Qwen3.5 后训练，采用强化学习联合优化 scaffold 和解决方案。所有模型以 MIT 许可证开源，支持商业和研究用途。

AI模型 Ollama Ornith SWE-Bench 编程助手开源模型

推荐理由：Ollama 现在可以直接跑 Ornith 编程智能体了，从 9B 到 397B 都有，SWE-Bench 拿了 82.4 分，本地搞智能体编码超方便。

原文

04:49

OpenRouter@OpenRouterAI

行业 OpenRouter 智能体开源模型

推荐理由：OpenRouter 发博说四个开源模型已经能跑真实 agent 流程了，搞智能体的朋友可以看看为什么公司选它们。

原文

00:49

Geek@geekbb

73°

DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩：LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%，超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文，并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署，引发社区期待。

AI模型 DeepSeek Pro Max 编码基准开源模型

推荐理由：DeepSeek 拿 Pro Max 模式在 LiveCodeBench 等三大编码基准上直接碾压 GPT-5.4 和 Claude Opus 4.6，分数拉满，但还没开放下载，先来围观一下。

原文

6月27日

21:54

AK@_akhaliq

hf-claude 工具允许用户在 Claude Code 中切换超过100个开源模型，包括 GLM 5.2、MiniMax-M3 和 DeepSeek v4 Pro。这一集成扩展了 Claude Code 的模型选择范围，用户无需离开 Claude Code 即可利用不同开源模型的能力。该功能主要面向需要灵活使用多种模型的开发者。目前该工具已在 X 上获得 1895 次浏览。

AI产品 hf-claude Claude Code GLM 5.2 MiniMax-M3 开源模型

推荐理由：想在 Claude Code 里用别的模型？hf-claude 能直接集成 100+ 开源模型，包括 GLM 5.2 和 DeepSeek v4 Pro，很方便。

原文

19:36

Sebastian Raschka: Ahead of AI@Sebastian Raschka, PhD

精选

本文介绍如何用aider和Continue等本地编码代理工具替代Claude Code与GitHub Codex订阅。这些工具可搭配Ollama部署的Llama 3和DeepSeek Coder等开源模型。本地运行能保护代码隐私，并节省每月订阅费用。作者给出了从安装Ollama到连接模型的完整配置步骤。

技巧 Claude Code Codex aider 编程助手开源模型

推荐理由：想省掉Claude Code的月费？Sebastian手把手教你用本地开源模型加aider和Continue自己搭编码代理，便宜又安全。

原文

15:51

15:51IT之家（博客/媒体）

76°

6月27日，北大与DeepSeek联合开源DSpark推理加速框架，已部署于DeepSeek-V4-Flash与V4-Pro预览版引擎。该框架相比单token推测解码基线MTP-1，在同等吞吐量下将单用户生成速度提升60%至85%。DSpark采用半自回归架构，在Qwen3-4B模型上平均接受长度比Eagle3提升约30.9%，比DFlash提升约16.3%。V4-Flash引擎实测中，80 token/s SLA下聚合吞吐量提升51%，120 token/s下提升661%。相关论文、训练代码及模型检查点已在GitHub DeepSpec项目开源。

AI模型 DeepSeek DSpark 北京大学推理模型开源模型

推荐理由：北大和DeepSeek开源了DSpark，能让高并发下大模型生成速度提升最多85%。想提速可以试试。

原文

13:13

elvis@omarsar0

84°

OpenAI 宣布了 GPT-5.6 系列，包括前沿模型 Sol、均衡模型 Terra 以及快速廉价模型 Luna。目前仅提供有限预览，少数用户可访问。评论者担忧这种策略不利于行业，呼吁开源AI取胜。

AI模型 GPT-5.6 OpenAI Sol Terra Luna 开源模型

推荐理由：OpenAI 刚出了三个 GPT-5.6 模型，有强有快有便宜，但只给少数人用，引起争议。

原文

13:06

lmarena.ai@lmarena_ai

精选72°

GLM-5.2 (Max) 在 Code Arena 前端排行榜上获得第2名，比 Claude Opus 4.7 (Thinking) 高出 29 分。在 React 子榜单排名第2，HTML 子榜单第4。在品牌营销、数据与分析、消费产品等6个子类别中均位列第一。该模型是开源模型中对 Kimi-K2.6 和 Minimax-M3 优势最大的。在社区投票的单次前端编码测试中展示了10个对比案例。

AI模型 GLM-5.2 Code Arena Claude Opus 4.8 开源模型编程助手

推荐理由：GLM-5.2 在社区投票的编码竞技场上压过 Claude Opus，你可以在前端任务中试试它的单次生成效果。

原文

12:53

lmarena.ai@lmarena_ai

AI模型 Agent Arena 智能体评测基准开源模型实验室

推荐理由：想看看谁家的智能体最强？Agent Arena排行榜刚上线，可以按开源模型和实验室筛选，挺方便。

原文

12:45

elvis@omarsar0

作者认为开源模型与前沿闭源模型同等重要，并提出了一个结合使用的框架：租用前沿模型的推理和智能能力，同时通过开源模型掌握上下文和知识，并利用开源模型作为验证器和评判器。这一策略让用户既能享受前沿模型的强大推理，又能保持对上下文和信息的控制权。该框架提供了一种实用的模型组合思路。

技巧开源模型推理模型模型集成

推荐理由：一个实用的使用策略：把前沿模型当脑子，开源模型当知识库，自己掌握上下文。

原文

6月26日

23:47

Ate-a-Pi@svpino

Santiago Valenzuela指出Claude Tag的粘性极高，会吸收公司全部信息。若停止付费，用户将被锁定无法获取数据。他呼吁采用开源方案，避免被单一AI公司绑架。开源能提供灵活切换模型和迁移数据的自由。

行业 Claude Tag 开源模型 AI安全厂商锁定

推荐理由：一句话敲警钟——别被Claude Tag这类闭源方案锁死，用开源才能随时换模型、带走数据。

原文

22:42

Gary Marcus@GaryMarcus

UBS调查显示，60%监控AI预算的企业已开始转向更便宜的模型和开源中国模型。企业面临极端账单，有用户每月花费高达35,000美元，团队超出配额200%，部分公司从5个AI内部工具削减至2个。企业通过模型路由策略，将简单任务分配给便宜模型，如Qwen、DeepSeek、MiniMax、GLM、Kimi，而保留高级模型用于推理、编程和长上下文任务。这些中国开源模型可以本地运行或通过云目录使用，符合企业成本曲线。

行业 UBS DeepSeek Qwen MiniMax 开源模型成本优化企业AI应用

推荐理由：大厂AI账单太高了，UBS说60%的企业已经在换更便宜的模型，像DeepSeek、Qwen这些中国开源模型成了新选择。想省钱的企业可以看看这个趋势。

原文

18:00

AI Will@FinanceYF5

一位独立研究者（沃尔玛应届程序员）用单张RTX 3090 Ti、零经费完成两项扩散模型研究，被SIGGRAPH 2026录用。InfiniteDiffusion实现无限图像生成，支持随机访问、可复现、可并行、零存储。Terrain Diffusion是首个学习型程序化地形生成器，单卡速度比卫星飞行快9倍，仅需1.5GB显存。该研究已发布Minecraft mod，代码已开源。

AI模型 InfiniteDiffusion Terrain Diffusion 图像生成程序化地形生成开源模型

推荐理由：一个人用一张3090 Ti发SIGGRAPH，InfiniteDiffusion无限图像生成、Terrain Diffusion比卫星快9倍，代码开源，快去试试Minecraft mod。

原文

13:00

量子位@鱼羊

英伟达开源了一款新的MoE加速库，只需一行import即可集成到Transformers v5中。微调速度提升3.7倍。该库支持专家并行技术，并整合了DeepEP和TransformerEngine组件。用户无需修改现有代码即可获取显著性能提升。

AI模型英伟达 MoE Transformers v5 DeepEP 开源模型

推荐理由：想让你HuggingFace上的MoE模型微调更快？英伟达这个新库一行代码就能加速3.7倍，直接用。

原文

10:51

arXiv cs.AI@Chi Cui, Yixin Wu, Yang Zhang

该论文对4chan上的AI非自愿合成色情图像（SNEACI）进行了大规模研究，识别出24,105条SNEACI内容。研究发现，非名人目标占比从先前研究的4.7%飙升至55.8%，表明AI裸化已从攻击公众人物转向伤害用户社交圈内的普通人。开源模型主导生产：Stable Diffusion系列生成42.7%的图像，Wan生成66.5%的视频，依赖数千个共享微调模型和教程。最活跃的内容生产者贡献了780条，推动社区参与并降低技术门槛。

论文 Stable Diffusion Wan 4chan AI安全开源模型

推荐理由：这篇论文用硬数据告诉你，AI脱衣已经从搞名人变成搞普通人了，而且Stable Diffusion和Wan是主要生产工具，4chan社区里几百条的高产作者在推波助澜。

原文

10:10

pandaily@contact@pandaily.com (Pandaily)

智谱AI和MiniMax两家中国AI公司的市场估值出现分化，前者估值约200亿元人民币，后者约150亿元。这一走势与全球市场Anthropic（估值约615亿美元）和OpenAI（估值约3000亿美元）的差距扩大相呼应。双方均聚焦于多模态大模型和智能体应用，但融资速度和商业化路径不同。智谱AI以技术开源和B端合作为主，MiniMax则侧重C端产品与海外市场拓展。

行业智谱AI MiniMax 估值行业格局开源模型

推荐理由：聊中国AI格局必看这篇，智谱AI和MiniMax谁更像Anthropic和OpenAI，估值数据和背后逻辑都讲清楚了。

原文

09:54

Gary Marcus@GaryMarcus

Ramez Naam在推文中警告，若前沿AI仅由少数美国公司掌控并受美国政府意志左右，将带来高反乌托邦风险。他认为应促进激烈竞争、开源模型（open weight models）以及不受白宫控制的AI发展。Gary Marcus转发了这一观点，引发对AI权力集中风险的讨论。

行业 Ramez Naam Gary Marcus 前沿AI 开源模型 AI治理

推荐理由：Ramez Naam和Gary Marcus在聊一个严肃话题：前沿AI被少数美国公司垄断，受政府支配，有反乌托邦风险。他们呼吁开源和竞争，值得看看。

原文

08:52

berryxia@berryxia

美国政府 reportedly 计划亲自审批谁能使用GPT-5.6，OpenAI仅向一小部分合作伙伴提供有限预览。Commerce Secretary Lutnick亲自警告OpenAI不要擅自发布，接近事实上的许可制。Yann LeCun此前警告，以安全为由限制AI系统会阻碍智能民主化。他主张开源才是让AI普及的正确路径。当最强闭源模型被政府按客户审批时，开源模型成为对抗技术集中控制的实际路径。

行业 GPT-5.6 OpenAI 美国政府 Yann LeCun 开源模型监管

推荐理由：美国商务部要管GPT-5.6的客户审批，开源模型成了对抗监管集中化的解法。Yann LeCun的观点值得看看。

原文

08:51

Viking@vikingmute

精选

Ornith-1.0 系列开源模型发布，专门用于 agentic coding，参数从9B Dense到397B MoE全覆盖。在 Terminal-Bench 2.1 上得分77.5，SWE-Bench verified 82.4，NL2Repo 48.2。397B MoE模型在多个基准上超过 Claude Opus 4.7。模型采用自改进训练策略，利用强化学习同时生成解决方案和 task-specific scaffold。基于 gemma4 和 qwen3.5 后训练，MIT 许可开源。

AI模型 Ornith-1.0 gemma4 qwen3.5 开源模型编程助手

推荐理由：Ornith-1.0 开源了从9B到397B的编程模型，在SWE-Bench等基准上超越Claude Opus 4.7，还能自己优化任务框架。

原文

01:24

lmarena.ai@lmarena_ai

精选

Zai_org的GLM系列在Code Arena: Frontend基准上持续增长，GLM-4.6得分1408，GLM-5.2 (Max)达到1595，超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型，在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。

AI模型 GLM Zai_org Code Arena 前端编码开源模型

推荐理由：Zai_org的GLM-5.2开源模型在前端编码上超过了Opus，离领先的Claude Fable只差一点，值得试试

原文

01:15

Hugging Face@huggingface

Hugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程，无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。

技巧 Hugging Face 开源模型本地部署推理

推荐理由：想自己跑开源模型？Hugging Face 这场直播手把手教你在本地部署，省去云端费用和延迟。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？