08:59SuperTechFans(博客/媒体)精选76°作者在 2022 年 M2 Mac(64GB RAM)上测试 Mistral 7B、Gemma 3、OpenAI OSS-20B、Qwen 3 MOE 等多种模型,使用 llama.cpp、Ollama、LM Studio 等工具。她发现自从 GPT-OSS 发布后,本地模型在编程任务上已足够好用,尤其 Google 的 Gemma 4 系列(如 gemma-4-26b-a4b 和 gemma-4-12b-qat)在 Python 代码重构、类型提示修复、写单元测试等 agentic 任务中准确率和速度约为前沿模型的 75%。她分享了本地 agentic 设置:用 Pi 作 agent 框架、LM Studio 作推理服务器,所有操作放在 Docker 容器中以限制权限。本地模型仍有推理速度慢、上下文窗口受硬件限制等问题,但隐私友好、可自由调整参数。技巧M2 MacGemma 4PiLM Studio本地模型10 个信源在谈推荐理由:想试本地模型?这篇有 M2 Mac 上跑 Gemma 4 的详细配置,还有 Pi+LM Studio 的 agentic 设置,比云端省心。原文
00:25Simon Willison’s Weblog(博客/媒体)Georgi Gerganov 在 Hacker News 评论中分享,过去一个半月他几乎每天都用 Qwen3.6-27B 模型处理编码任务,运行在 M2 Ultra 或 RTX 5090 上。他使用轻量级 pi agent(pi -nc --offline)搭配简短系统提示来适配个人编程风格。虽然主要用于 ggml-org 的琐碎维护任务,但认为该模型是高效的辅助工具。技巧Qwen3.6-27BGeorgi Gerganovpi本地模型编程助手推荐理由:Georgi Gerganov 亲测 Qwen3.6-27B 配合 pi agent,日常编程完全够用,本地运行无压力。原文
13:51IT之家(博客/媒体)76°谷歌 Magenta 团队发布 Magenta RealTime 2(MRT2),一款可在本地实时运行的 AI 音乐模型,支持与用户即兴合奏。MRT2 推出两种规模:24 亿参数的高质量模型 mrt2_base 和 2.3 亿参数的高速模型 mrt2_small,后者针对苹果 Apple Silicon 优化,可在 M1 及以上芯片的 Mac 上实时运行。相比前代,MRT2 将控制延迟从约 3 秒降至约 200 毫秒(降低至 1/15),采用逐帧生成(每帧 40 毫秒),更接近真实乐器演奏体验。模型支持文本、音频风格提示以及 MIDI 控制,并免费提供 Jam 应用和 DAW 插件。AI产品实时音乐生成Magenta RealTime 2本地模型苹果 Apple SiliconDAW 插件推荐理由:音乐创作者和 AI 爱好者终于有了能实时合奏的本地模型——延迟从 3 秒降到 200 毫秒,用 MacBook 就能跑,建议玩电子乐或编曲的人直接下载 Jam 试试。原文
07:19IT之家(博客/媒体)LM Studio 在 Mac 版应用中新增 LM Link 功能,允许 iPhone 等设备直接调用 Mac 上本地运行的大语言模型。用户需创建并登录同一账号,启用后设备间建立端到端加密的安全连接,请求由 Mac 处理并返回结果。该功能基于 Tailscale 网状 VPN,确保隐私安全,支持任意本地模型,包括 Apple Intelligence 基础模型。目前预览免费,未来将推出付费方案。这解决了移动设备无法直接使用本地大模型的痛点,尤其适合注重隐私的用户。AI产品LM Studio本地模型跨设备隐私安全iPhone2 个信源在谈推荐理由:对于想在手机上体验本地 AI 又不想牺牲隐私的 Mac 用户,LM Link 直接打通了跨设备调用——不用联网、数据不出设备,建议有 Mac 和 iPhone 的开发者或隐私敏感用户试试。原文
11:16IT之家(博客/媒体)精选谷歌 AI Edge Gallery 实验性应用现已登陆 macOS,让苹果 Mac 用户能在本地离线运行 Gemma AI 模型,无需联网即可进行聊天、图像处理和语义理解。该应用仅提供 5 个谷歌自家模型,其中最受关注的是 Gemma 4 12B,可在 16GB 内存 Mac 上处理文本、视觉和音频,并具备代码能力,适合设备端数据分析和信息提取。同时,谷歌还推出了 Mac 版 AI Edge Eloquent 听写应用,支持离线语音转文字和轻度润色。AI产品谷歌AI Edge GalleryGemma 4Mac本地模型10 个信源在谈推荐理由:Mac 用户终于有了谷歌官方的本地 AI 工具,16GB 内存就能跑多模态模型,做本地数据分析和隐私敏感任务的开发者可以直接试试。原文