01:17Simon Willison’s Weblog(博客/媒体)精选DeepReinforce 发布 Ornith-1.0,一款 MIT 许可的开源模型,基于 Gemma 4 和 Qwen 3.5 预训练。提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。在编码基准上达到同尺寸开源模型 SOTA。作者在 LM Studio 上测试 35B Q4_K_M GGUF 版本,能流畅运行代理工具调用并处理代码定位任务。AI模型Ornith-1.0DeepReinforceGemma 4Qwen 3.5开源模型1 个信源在谈推荐理由:DeepReinforce 新出的开源编码模型,基于 Gemma 4 和 Qwen 3.5,在代理编码任务上表现不错,LM Studio 就能跑,值得试试。原文
08:59SuperTechFans(博客/媒体)精选76°作者在 2022 年 M2 Mac(64GB RAM)上测试 Mistral 7B、Gemma 3、OpenAI OSS-20B、Qwen 3 MOE 等多种模型,使用 llama.cpp、Ollama、LM Studio 等工具。她发现自从 GPT-OSS 发布后,本地模型在编程任务上已足够好用,尤其 Google 的 Gemma 4 系列(如 gemma-4-26b-a4b 和 gemma-4-12b-qat)在 Python 代码重构、类型提示修复、写单元测试等 agentic 任务中准确率和速度约为前沿模型的 75%。她分享了本地 agentic 设置:用 Pi 作 agent 框架、LM Studio 作推理服务器,所有操作放在 Docker 容器中以限制权限。本地模型仍有推理速度慢、上下文窗口受硬件限制等问题,但隐私友好、可自由调整参数。技巧M2 MacGemma 4PiLM Studio本地模型10 个信源在谈推荐理由:想试本地模型?这篇有 M2 Mac 上跑 Gemma 4 的详细配置,还有 Pi+LM Studio 的 agentic 设置,比云端省心。原文
09:37AWS Machine Learning Blog@Aris Tsakpinis精选Google DeepMind 发布的 Gemma 4 开源权重模型系列现已在 Amazon Bedrock 上可用。该系列包含三个指令调优变体:Gemma 4 31B(密集架构)、26B-A4B(MoE 架构,每次激活 4B 参数)和 E2B。所有变体均支持内置推理、原生函数调用以及文本和图像多模态输入。模型基于 Apache 2.0 许可发布,旨在多种部署场景下实现每参数智能最大化。AI模型Gemma 4Amazon BedrockGoogle DeepMind开源模型多模态4 个信源在谈推荐理由:Google DeepMind 把最新的 Gemma 4 放到 AWS 上了,三种规格可选,带推理和图文理解,正好拿来玩开源项目。原文
02:59marktechpost@Asif Razzaq精选Google DeepMind 推出 Gemma 4 的 QAT(量化感知训练)检查点,包含 Q4_0 格式(4-bit 量化)和新开发的移动格式。与 BF16 版本相比,Q4_0 可将模型内存占用降低约 75%,而移动格式进一步优化至适合手机等设备。这些检查点面向边缘计算场景,平衡了精度和推理速度。AI模型Gemma 4Google DeepMindQAT量化模型移动端10 个信源在谈推荐理由:Gemma 4 量化版来了,内存省 75%原文
11:16IT之家(博客/媒体)精选谷歌 AI Edge Gallery 实验性应用现已登陆 macOS,让苹果 Mac 用户能在本地离线运行 Gemma AI 模型,无需联网即可进行聊天、图像处理和语义理解。该应用仅提供 5 个谷歌自家模型,其中最受关注的是 Gemma 4 12B,可在 16GB 内存 Mac 上处理文本、视觉和音频,并具备代码能力,适合设备端数据分析和信息提取。同时,谷歌还推出了 Mac 版 AI Edge Eloquent 听写应用,支持离线语音转文字和轻度润色。AI产品谷歌AI Edge GalleryGemma 4Mac本地模型10 个信源在谈推荐理由:Mac 用户终于有了谷歌官方的本地 AI 工具,16GB 内存就能跑多模态模型,做本地数据分析和隐私敏感任务的开发者可以直接试试。原文
04:27Decoder@Matthias Bastian78°Google DeepMind 发布了 Gemma 4 12B 开源模型,原生支持文本、图像和音频处理,仅需 16GB 内存即可在笔记本上运行。该模型在基准测试中几乎与两倍大小的 26B 模型持平,并采用 Apache 2.0 许可证,允许商业使用。这标志着多模态 AI 在消费级硬件上的重大突破,降低了开发者和企业的使用门槛。AI模型多模态开源/仓库Gemma 4Google DeepMind本地推理10 个信源在谈推荐理由:多模态模型终于能跑在普通笔记本上了,做本地 AI 应用或边缘计算的开发者可以直接下载试试,性能还接近两倍大的模型。原文
01:46Nathan Lambert: Interconnects@Florian Brand76°过去一个月内,多个重磅开源模型密集发布,包括 Google 的 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5 和 GLM-5.1 等。这些模型在性能、架构和开源策略上各有突破,标志着开源 AI 生态进入新一轮竞争。CAISI 的 V4 评估报告对这些模型进行了横向对比,揭示了不同模型在推理、多模态和效率上的优劣。对于关注开源模型选型和趋势的开发者与研究者,这是重要的参考节点。AI模型开源模型Gemma 4DeepSeek V4Kimi K2.6模型评估1 个信源在谈推荐理由:开源模型一个月内连发五款旗舰,做模型选型或研究的团队可以直接参考 CAISI 的 V4 评估对比,省去自己跑 benchmark 的时间。原文
00:33Google Developers Blog(博客/媒体)Google DeepMind推出Gemma 4系列开源模型,专为在设备端实现多步规划和自主智能体工作流而设计。该系列包含Google AI Edge Gallery供开发者实验“Agent Skills”,以及LiteRT-LM库,提供显著的速度提升和结构化输出。Gemma 4采用Apache 2.0许可,支持140多种语言,兼容移动设备、桌面电脑和Raspberry Pi等IoT平台。AI模型智能体Gemma 4边缘计算开源/仓库多模态1 个信源在谈推荐理由:此发布将前沿的智能体能力带入低功耗设备,为边缘AI应用(如本地化助手和离线自动化)提供了新的可能性,对开发者社区和物联网领域具有实际参考价值。原文