Google DeepMind 于 2025 年 5 月发布的 Gemma 4 系列模型聚焦于边缘设备上的智能体能力,标志着开源小模型在安全对齐、长上下文和端侧部署方面的重要进展。
- 近期主要进展包括:
- 边缘设备智能体能力:Gemma 4 专为在笔记本电脑、手机等边缘设备上运行智能体任务而设计,支持工具使用、函数调用和多模态交互。(Google DeepMind发布Gemma 4,边缘设备也能运行智能体)
- 安全对齐研究:一篇 arXiv 论文实测 Gemma 4 等模型在自主安全智能体任务中的表现,评估了安全对齐对决策的影响。(安全对齐对自主安全智能体的影响:Gemma 4 等模型实测)
- 创意应用与生态:开发者使用 Gemma 4 实时生成 Web 应用,如在地牢游戏中动态创建交互界面,展示了模型在轻量级生成任务上的潜力。(AIventure:用Gemma 4在地牢游戏中实时生成Web App)
- 开源模型竞赛:Gemma 4 与 DeepSeek V4、Kimi K2.6 等密集发布,突显了开源小模型在性能和部署灵活性上的竞争。(开源模型爆发:Gemma 4、DeepSeek V4、Kimi K2.6 等密集发布)
当前焦点在于 Gemma 4 如何在保持轻量化的同时实现安全的智能体行为,以及其在长上下文任务(如推理)中的表现——类似 InsightReplay 的注意力机制优化或架构调整是否必要。未来需关注其在更多端侧场景中的实际部署效果,以及与同类模型(如 DeepSeek 系列)的性能对比。