全部 AI 动态 · AI 热点

6月25日

21:54

21:54

Patrick Loeber@patloeber

Patrick Loeber 在 #GoogleIOConnect 上介绍了如何使用 AI Studio、Antigravity 2.0、新的 Interactions API、Gemini 3.5 Flash 以及 Gemma 开发应用。AI Studio 是 Google 的 AI 开发平台，Antigravity 2.0 提供新功能，Interactions API 支持更灵活的交互设计。Gemini 3.5 Flash 是高效推理模型，Gemma 是轻量开源模型。演讲内容已发布在 Google 官方博客。

行业 AI Studio Gemini 3.5 Flash Gemma Google I/O AI开发工具

推荐理由：Google 开发者生态又更新了，Patrick 讲了 AI Studio、Gemini 3.5 Flash 和新的 Interactions API，做应用开发可以看看。

6月18日

08:30

08:30

Ate-a-Pi@svpino

推文作者Santiago分享了他的7款最爱模型：日常用Claude Opus 4.7和ChatGPT 5.5 Thinking、实时新闻用Grok、编程用Claude Code（Sonnet 4.6和Opus 4.6）、本地快速用Gemma 4、开放权重用MiniMax 2.7和Qwen 3.6。他还推荐了Anuma作为一站式替代方案，支持跨模型共享上下文和并排对比答案。

AI产品 Claude Opus ChatGPT Grok Gemma Anuma

推荐理由：有人列出了7款主流模型推荐，还发现Anuma能跨模型保持对话、对比答案，省订阅费。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:31

12:31

karminski-牙医 (AI工具)@karminski3

精选

Google发布了Gemma小模型的Diffusion版本，名为Diffusion Gemma，大小26B但激活参数量仅4B。与NVIDIA合作针对RTX 4090和5090优化，5090上每秒可生成700+ token。Diffusion模型像刮奖一样逐片生成文本，速度远快于传统逐字生成模型，但输出质量略低。在AIME 2026数学测试中达到Gemma4-26B-A4B的94%水平，在Agent能力测试中达到82%。4bit量化版本仅需16G显存即可运行。

AI模型 Diffusion模型 Gemma Google NVIDIA 推理加速

推荐理由：Diffusion Gemma把文本生成速度拉到单卡700TPS，做实时对话或高吞吐推理的团队可以直接用，4bit量化16G显存就能跑，值得试试能否做投机解码的草稿模型。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

06:54

06:54IT之家（博客/媒体）

72°

谷歌发布 DiffusionGemma，一种基于文本扩散机制的开源 AI 模型，在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出，避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token，DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色，但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源，可从 Hugging Face 下载。

AI模型扩散模型谷歌 Gemma 本地推理开源

推荐理由：本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行，做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。

03:18

03:18

Clement Delangue@ClementDelangue

Google、Hugging Face 与开源 AI 社区联合发起 Gemma 挑战赛，旨在通过数十个智能体协作，让 Gemma 4 E4B 模型运行更快。Hugging Face 的 Hub 正从人类协作平台演变为智能体协作平台，这一赛事展示了 AI 智能体在模型优化中的潜力。挑战赛鼓励开发者参与，推动开源 AI 生态发展。

AI产品智能体开源/仓库 Gemma Hugging Face 模型优化

推荐理由：这是 AI 智能体协作的实战案例，做模型优化或智能体开发的团队值得关注——看看智能体如何像人类一样在 Hub 上合作提速模型。

6月5日

11:43

11:43

AI Will@FinanceYF5

83°

Google 发布了 Gemma 4 12B 模型，这是一个支持视觉、音频、推理和智能体能力的多模态 AI 模型。该模型采用 Apache 2.0 开源协议，可以在本地笔记本电脑上运行，无需依赖重型编码器堆栈。这意味着开发者可以在离线环境中部署强大的 AI 功能，同时保持数据隐私。Gemma 4 12B 的发布进一步降低了多模态 AI 的应用门槛，适合个人开发者和中小企业使用。

AI模型多模态开源/仓库本地部署推理模型 Gemma

推荐理由：多模态模型终于能本地跑了，做边缘计算或隐私敏感应用的开发者可以直接上手试试，Apache 2.0 协议也省了授权烦恼。

11:42

11:42

AI Will@FinanceYF5

83°

谷歌发布了 Gemma 4 12B，一款轻量级多模态 AI 模型，无需重型编码器栈即可在笔记本电脑上本地运行。该模型支持视觉、音频、推理和智能体四大核心能力，采用 Apache 2.0 开源协议。这降低了多模态 AI 的硬件门槛，让个人开发者和小团队也能在本地部署和实验。对于关注边缘计算和隐私保护的 AI 从业者来说，这是一个值得关注的开源选择。

AI模型多模态模型开源/仓库本地部署推理模型 Gemma

推荐理由：Gemma 4 12B 让多模态 AI 真正跑在笔记本上，做本地推理、智能体或隐私敏感应用的开发者可以直接拿来用，省去云端依赖。

6月4日

02:35

02:35

Demis Hassabis@demishassabis

精选

Google 发布 Gemma 4 12B 模型，庆祝其总下载量突破 1.5 亿次。该模型体积小巧，仅需 16GB VRAM 即可在笔记本上本地运行。采用 Apache 2.0 开源许可证，开发者可自由使用和修改。

AI模型 Gemma Gemma 4 Google 开源模型

推荐理由：小模型也能本地跑，性能强