21:54Patrick Loeber@patloeberPatrick Loeber 在 #GoogleIOConnect 上介绍了如何使用 AI Studio、Antigravity 2.0、新的 Interactions API、Gemini 3.5 Flash 以及 Gemma 开发应用。AI Studio 是 Google 的 AI 开发平台,Antigravity 2.0 提供新功能,Interactions API 支持更灵活的交互设计。Gemini 3.5 Flash 是高效推理模型,Gemma 是轻量开源模型。演讲内容已发布在 Google 官方博客。行业AI StudioGemini 3.5 FlashGemmaGoogle I/OAI开发工具推荐理由:Google 开发者生态又更新了,Patrick 讲了 AI Studio、Gemini 3.5 Flash 和新的 Interactions API,做应用开发可以看看。原文
08:30Ate-a-Pi@svpino推文作者Santiago分享了他的7款最爱模型:日常用Claude Opus 4.7和ChatGPT 5.5 Thinking、实时新闻用Grok、编程用Claude Code(Sonnet 4.6和Opus 4.6)、本地快速用Gemma 4、开放权重用MiniMax 2.7和Qwen 3.6。他还推荐了Anuma作为一站式替代方案,支持跨模型共享上下文和并排对比答案。AI产品Claude OpusChatGPTGrokGemmaAnuma1 个信源在谈推荐理由:有人列出了7款主流模型推荐,还发现Anuma能跨模型保持对话、对比答案,省订阅费。原文
12:31karminski-牙医 (AI工具)@karminski3精选Google发布了Gemma小模型的Diffusion版本,名为Diffusion Gemma,大小26B但激活参数量仅4B。与NVIDIA合作针对RTX 4090和5090优化,5090上每秒可生成700+ token。Diffusion模型像刮奖一样逐片生成文本,速度远快于传统逐字生成模型,但输出质量略低。在AIME 2026数学测试中达到Gemma4-26B-A4B的94%水平,在Agent能力测试中达到82%。4bit量化版本仅需16G显存即可运行。AI模型Diffusion模型GemmaGoogleNVIDIA推理加速10 个信源在谈推荐理由:Diffusion Gemma把文本生成速度拉到单卡700TPS,做实时对话或高吞吐推理的团队可以直接用,4bit量化16G显存就能跑,值得试试能否做投机解码的草稿模型。原文
06:54IT之家(博客/媒体)72°谷歌发布 DiffusionGemma,一种基于文本扩散机制的开源 AI 模型,在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出,避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token,DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色,但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源,可从 Hugging Face 下载。AI模型扩散模型谷歌Gemma本地推理开源6 个信源在谈推荐理由:本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行,做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。原文
03:18Clement Delangue@ClementDelangueGoogle、Hugging Face 与开源 AI 社区联合发起 Gemma 挑战赛,旨在通过数十个智能体协作,让 Gemma 4 E4B 模型运行更快。Hugging Face 的 Hub 正从人类协作平台演变为智能体协作平台,这一赛事展示了 AI 智能体在模型优化中的潜力。挑战赛鼓励开发者参与,推动开源 AI 生态发展。AI产品智能体开源/仓库GemmaHugging Face模型优化推荐理由:这是 AI 智能体协作的实战案例,做模型优化或智能体开发的团队值得关注——看看智能体如何像人类一样在 Hub 上合作提速模型。原文
11:43AI Will@FinanceYF583°Google 发布了 Gemma 4 12B 模型,这是一个支持视觉、音频、推理和智能体能力的多模态 AI 模型。该模型采用 Apache 2.0 开源协议,可以在本地笔记本电脑上运行,无需依赖重型编码器堆栈。这意味着开发者可以在离线环境中部署强大的 AI 功能,同时保持数据隐私。Gemma 4 12B 的发布进一步降低了多模态 AI 的应用门槛,适合个人开发者和中小企业使用。AI模型多模态开源/仓库本地部署推理模型Gemma推荐理由:多模态模型终于能本地跑了,做边缘计算或隐私敏感应用的开发者可以直接上手试试,Apache 2.0 协议也省了授权烦恼。原文
11:42AI Will@FinanceYF583°谷歌发布了 Gemma 4 12B,一款轻量级多模态 AI 模型,无需重型编码器栈即可在笔记本电脑上本地运行。该模型支持视觉、音频、推理和智能体四大核心能力,采用 Apache 2.0 开源协议。这降低了多模态 AI 的硬件门槛,让个人开发者和小团队也能在本地部署和实验。对于关注边缘计算和隐私保护的 AI 从业者来说,这是一个值得关注的开源选择。AI模型多模态模型开源/仓库本地部署推理模型Gemma推荐理由:Gemma 4 12B 让多模态 AI 真正跑在笔记本上,做本地推理、智能体或隐私敏感应用的开发者可以直接拿来用,省去云端依赖。原文
02:35Demis Hassabis@demishassabis精选Google 发布 Gemma 4 12B 模型,庆祝其总下载量突破 1.5 亿次。该模型体积小巧,仅需 16GB VRAM 即可在笔记本上本地运行。采用 Apache 2.0 开源许可证,开发者可自由使用和修改。AI模型GemmaGemma 4Google开源模型10 个信源在谈推荐理由:小模型也能本地跑,性能强原文