全部 AI 动态 · AI 热点

6月30日

01:17

01:17Simon Willison’s Weblog（博客/媒体）

精选

DeepReinforce 发布 Ornith-1.0，一款 MIT 许可的开源模型，基于 Gemma 4 和 Qwen 3.5 预训练。提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。在编码基准上达到同尺寸开源模型 SOTA。作者在 LM Studio 上测试 35B Q4_K_M GGUF 版本，能流畅运行代理工具调用并处理代码定位任务。

AI模型 Ornith-1.0 DeepReinforce Gemma 4 Qwen 3.5 开源模型

推荐理由：DeepReinforce 新出的开源编码模型，基于 Gemma 4 和 Qwen 3.5，在代理编码任务上表现不错，LM Studio 就能跑，值得试试。

6月17日

08:59

08:59SuperTechFans（博客/媒体）

精选76°

作者在 2022 年 M2 Mac（64GB RAM）上测试 Mistral 7B、Gemma 3、OpenAI OSS-20B、Qwen 3 MOE 等多种模型，使用 llama.cpp、Ollama、LM Studio 等工具。她发现自从 GPT-OSS 发布后，本地模型在编程任务上已足够好用，尤其 Google 的 Gemma 4 系列（如 gemma-4-26b-a4b 和 gemma-4-12b-qat）在 Python 代码重构、类型提示修复、写单元测试等 agentic 任务中准确率和速度约为前沿模型的 75%。她分享了本地 agentic 设置：用 Pi 作 agent 框架、LM Studio 作推理服务器，所有操作放在 Docker 容器中以限制权限。本地模型仍有推理速度慢、上下文窗口受硬件限制等问题，但隐私友好、可自由调整参数。

技巧 M2 Mac Gemma 4 Pi LM Studio 本地模型

推荐理由：想试本地模型？这篇有 M2 Mac 上跑 Gemma 4 的详细配置，还有 Pi+LM Studio 的 agentic 设置，比云端省心。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

09:37

09:37

AWS Machine Learning Blog@Aris Tsakpinis

精选

Google DeepMind 发布的 Gemma 4 开源权重模型系列现已在 Amazon Bedrock 上可用。该系列包含三个指令调优变体：Gemma 4 31B（密集架构）、26B-A4B（MoE 架构，每次激活 4B 参数）和 E2B。所有变体均支持内置推理、原生函数调用以及文本和图像多模态输入。模型基于 Apache 2.0 许可发布，旨在多种部署场景下实现每参数智能最大化。

AI模型 Gemma 4 Amazon Bedrock Google DeepMind 开源模型多模态

推荐理由：Google DeepMind 把最新的 Gemma 4 放到 AWS 上了，三种规格可选，带推理和图文理解，正好拿来玩开源项目。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月6日

02:59

02:59

marktechpost@Asif Razzaq

精选

Google DeepMind 推出 Gemma 4 的 QAT（量化感知训练）检查点，包含 Q4_0 格式（4-bit 量化）和新开发的移动格式。与 BF16 版本相比，Q4_0 可将模型内存占用降低约 75%，而移动格式进一步优化至适合手机等设备。这些检查点面向边缘计算场景，平衡了精度和推理速度。

AI模型 Gemma 4 Google DeepMind QAT 量化模型移动端

推荐理由：Gemma 4 量化版来了，内存省 75%

6月4日

11:16

11:16IT之家（博客/媒体）

精选

谷歌 AI Edge Gallery 实验性应用现已登陆 macOS，让苹果 Mac 用户能在本地离线运行 Gemma AI 模型，无需联网即可进行聊天、图像处理和语义理解。该应用仅提供 5 个谷歌自家模型，其中最受关注的是 Gemma 4 12B，可在 16GB 内存 Mac 上处理文本、视觉和音频，并具备代码能力，适合设备端数据分析和信息提取。同时，谷歌还推出了 Mac 版 AI Edge Eloquent 听写应用，支持离线语音转文字和轻度润色。

AI产品谷歌 AI Edge Gallery Gemma 4 Mac 本地模型

推荐理由：Mac 用户终于有了谷歌官方的本地 AI 工具，16GB 内存就能跑多模态模型，做本地数据分析和隐私敏感任务的开发者可以直接试试。

04:27

04:27

Decoder@Matthias Bastian

78°

Google DeepMind 发布了 Gemma 4 12B 开源模型，原生支持文本、图像和音频处理，仅需 16GB 内存即可在笔记本上运行。该模型在基准测试中几乎与两倍大小的 26B 模型持平，并采用 Apache 2.0 许可证，允许商业使用。这标志着多模态 AI 在消费级硬件上的重大突破，降低了开发者和企业的使用门槛。

AI模型多模态开源/仓库 Gemma 4 Google DeepMind 本地推理

推荐理由：多模态模型终于能跑在普通笔记本上了，做本地 AI 应用或边缘计算的开发者可以直接下载试试，性能还接近两倍大的模型。

5月17日

01:46

01:46

Nathan Lambert: Interconnects@Florian Brand

76°

过去一个月内，多个重磅开源模型密集发布，包括 Google 的 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5 和 GLM-5.1 等。这些模型在性能、架构和开源策略上各有突破，标志着开源 AI 生态进入新一轮竞争。CAISI 的 V4 评估报告对这些模型进行了横向对比，揭示了不同模型在推理、多模态和效率上的优劣。对于关注开源模型选型和趋势的开发者与研究者，这是重要的参考节点。

AI模型开源模型 Gemma 4 DeepSeek V4 Kimi K2.6 模型评估

推荐理由：开源模型一个月内连发五款旗舰，做模型选型或研究的团队可以直接参考 CAISI 的 V4 评估对比，省去自己跑 benchmark 的时间。

5月13日

00:33

00:33Google Developers Blog（博客/媒体）

Google DeepMind推出Gemma 4系列开源模型，专为在设备端实现多步规划和自主智能体工作流而设计。该系列包含Google AI Edge Gallery供开发者实验“Agent Skills”，以及LiteRT-LM库，提供显著的速度提升和结构化输出。Gemma 4采用Apache 2.0许可，支持140多种语言，兼容移动设备、桌面电脑和Raspberry Pi等IoT平台。

AI模型智能体 Gemma 4 边缘计算开源/仓库多模态

推荐理由：此发布将前沿的智能体能力带入低功耗设备，为边缘AI应用（如本地化助手和离线自动化）提供了新的可能性，对开发者社区和物联网领域具有实际参考价值。