06:54IT之家(博客/媒体)72°谷歌发布 DiffusionGemma,一种基于文本扩散机制的开源 AI 模型,在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出,避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token,DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色,但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源,可从 Hugging Face 下载。AI模型扩散模型谷歌Gemma本地推理开源6 个信源在谈推荐理由:本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行,做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。原文
08:57IT之家(博客/媒体)精选微软 Surface RTX Spark Dev Box 是一款面向本地 AI 开发的紧凑型桌面设备,专为模型微调、本地推理和智能体工作流设计。该设备搭载 NVIDIA Grace CPU 和 Blackwell RTX GPU,拥有 128GB 统一内存,AI 算力高达 1 Petaflop,可本地运行 120B 参数模型。其铝制外壳覆盖约 1000 个散热孔,兼顾散热与结构设计,整机功耗仅 100W。系统预装开发者优化版 Windows 11 Pro,并配置了 VS Code、GitHub Copilot、WSL 2 等开发工具,旨在减少环境搭建时间。该设备将于今年晚些时候发售。AI产品微软Surface RTX Spark Dev BoxAI 开发机本地推理NVIDIA10 个信源在谈推荐理由:本地跑 120B 模型终于有正经硬件了——Surface RTX Spark Dev Box 把 AI 开发环境打包成 100W 的桌面盒子,做模型微调或智能体开发的团队可以直接关注,省去搭服务器和配环境的麻烦。原文
04:27Decoder@Matthias Bastian78°Google DeepMind 发布了 Gemma 4 12B 开源模型,原生支持文本、图像和音频处理,仅需 16GB 内存即可在笔记本上运行。该模型在基准测试中几乎与两倍大小的 26B 模型持平,并采用 Apache 2.0 许可证,允许商业使用。这标志着多模态 AI 在消费级硬件上的重大突破,降低了开发者和企业的使用门槛。AI模型多模态开源/仓库Gemma 4Google DeepMind本地推理10 个信源在谈推荐理由:多模态模型终于能跑在普通笔记本上了,做本地 AI 应用或边缘计算的开发者可以直接下载试试,性能还接近两倍大的模型。原文
22:09Decoder@Jonathan KemperPerplexity 发布了一个编排器,能够结合本地计算机上的 AI 模型与强大的云端模型,并自动决定每个任务在何处处理。该系统旨在优化性能与成本,让用户无需手动选择运行环境。这一创新可能改变 AI 应用的部署方式,尤其对隐私敏感或需要低延迟的场景有重要意义。Perplexity 的混合系统为开发者提供了更灵活的 AI 使用方案。AI产品混合AIPerplexity本地推理云端模型编排器推荐理由:Perplexity 的混合 AI 系统解决了本地与云端资源分配难题,做 AI 应用开发或关注隐私与效率平衡的团队值得关注,可以直接尝试优化工作流。原文
14:45IT之家(博客/媒体)磐镭推出 YO2 迷你 AI 工作站,搭载 AMD 锐龙 AI Max+ 395 处理器,配备 128GB LPDDR5X-8000 内存和 2TB SSD,定价 21999 元。机身采用银色金属材质,正面有 RGB 灯带,支持 160W 峰值性能释放,可调节持续功耗。接口丰富,包括双 2.5GbE 网口、USB-C 40Gbps、DisplayPort 2.0 等,适合本地 AI 推理和内容创作。该产品定位高性能迷你主机,兼顾便携与算力需求。AI产品迷你主机AI工作站AMD锐龙本地推理高性能计算推荐理由:本地跑大模型或做 AI 渲染的团队,这台 128GB 内存的迷你工作站比同配置笔记本便宜不少,接口也够全,值得关注。原文
18:13IT之家(博客/媒体)雷神在AI工作站发布会上推出三款新品:专业级移动工作站M7000、全能本M6000和智能体笔记本aibook。M7000搭载AMD锐龙AI Max+ 395处理器,最高128GB内存,支持群联aiDaptiv+方案,可在64GB内存上流畅运行120B参数模型。M6000面向学生和创作者,配备锐龙9 9850HX和RTX 5070 Ti。aibook 14 Air Carbon仅重1kg,可本地运行35B MoE模型。三款产品均支持国补,价格从9999元到19999元不等。AI产品AI工作站雷神AMD锐龙本地推理aiDaptiv+推荐理由:雷神把本地大模型推理的门槛打下来了——M7000用SSD扩展显存跑120B模型,做AI开发或本地部署的团队可以直接考虑,性价比比传统工作站高出一截。原文
17:13IT之家(博客/媒体)ACEMAGIC 发布桌面级迷你主机 AI 工作站 G3A,体积仅 3.46L,支持第 13/14 代酷睿处理器和半高双槽专业显卡。该产品提供 NVIDIA RTX PRO 4000 Blackwell SFF Edition 等显卡选项,配备 DDR5 内存和双 M.2 插槽,整体性能释放达 135W。其抽屉式易维护设计和独立风道散热适合小型办公或 AI 推理场景。AI产品迷你主机AI 工作站桌面级显卡ACEMAGIC本地推理推荐理由:迷你主机终于能塞进桌面级显卡和处理器了,做本地 AI 推理或轻量渲染的开发者可以直接考虑,3.46L 体积放桌面不占地方。原文
09:05IT之家(博客/媒体)精选AMD 官方确认将于今年三季度推出基于锐龙 AI Max PRO 400 处理器的下一代锐龙 AI Halo 开发者迷你主机。该系列是全球首款能本地运行 300B 参数模型的 x86 客户端处理器,最大统一内存扩展至 192GB(160GB 可分配为显存)。新系列包含 PRO+ 495、PRO 490、PRO 485 三个型号,内存速度支持 8533MT/s。OEM 合作伙伴预计今年起推出搭载该系列处理器的开发者平台。这标志着本地大模型推理能力在 x86 平台上的重大突破。AI产品AMD锐龙 AI Max PRO 400AI Halo本地推理x86 处理器推荐理由:本地跑 300B 参数模型不再是梦,做 AI 推理和开发的团队可以直接关注这款 x86 平台,比依赖云端更灵活。原文
22:02IT之家(博客/媒体)AMD 宣布其 AI 开发迷你主机锐龙 AI Halo 定价 3999 美元,将于 6 月晚些时候开放预订。该设备搭载锐龙 AI Max+ 395 处理器,配备 128GB LPDDR5x 内存和 2TB SSD,支持万兆网卡和 Wi-Fi 7。AMD 声称该设备每月可为 AI 开发者节省 750 美元的云服务支出,强调其性价比。同时,AMD 还介绍了锐龙 AI Max 400 系列处理器,作为 300 系列的升级版,最高频率提升 0.1GHz,NPU 算力增加 5 TOPS,最大统一内存容量增至 192GB。AI产品AMD锐龙 AI HaloAI 开发主机本地推理处理器升级推荐理由:AMD 用 3999 美元硬件替代每月 750 美元云租金的算盘很实在,做本地 AI 推理或模型微调的开发者值得算一笔账——6 个月回本,之后就是纯赚。原文
11:55pandaily@contact@pandaily.com (Pandaily)摩尔线程推出AICUBE,一款面向家庭场景的统一AI中心设备,旨在作为单一设备入口点,整合多种AI功能。该产品预计2026年上市,将集成GPU算力,支持本地AI推理,降低对云端的依赖。此举标志着国产GPU厂商从硬件向消费级AI解决方案的延伸,可能推动家庭AI普及。AI产品摩尔线程AICUBE家庭AI中心本地推理国产GPU推荐理由:摩尔线程从GPU设计跨入家庭AI终端,做智能家居或本地AI应用的开发者值得关注——AICUBE可能成为国产替代的算力入口,2026年上市前建议提前了解生态兼容性。原文