全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

06:54

06:54IT之家（博客/媒体）

72°

谷歌发布 DiffusionGemma，一种基于文本扩散机制的开源 AI 模型，在本地推理速度上比传统自回归模型快 4 倍。该模型通过并行处理所有 token 并逐步去噪生成输出，避免了自回归模型在低带宽环境下的计算浪费。在单块 H100 GPU 上可达每秒 1000 token，DGX Station 上达每秒 2000 token。代码生成和数学推理能力出色，但科学推理等部分基准仍有短板。模型采用 Apache 2.0 开源，可从 Hugging Face 下载。

AI模型扩散模型谷歌 Gemma 本地推理开源

推荐理由：本地 AI 推理终于有了速度突破——DiffusionGemma 让低带宽设备也能高效运行，做边缘部署或本地应用的开发者可以直接从 Hugging Face 下载试试。

原文

6月4日

08:57

08:57IT之家（博客/媒体）

精选

微软 Surface RTX Spark Dev Box 是一款面向本地 AI 开发的紧凑型桌面设备，专为模型微调、本地推理和智能体工作流设计。该设备搭载 NVIDIA Grace CPU 和 Blackwell RTX GPU，拥有 128GB 统一内存，AI 算力高达 1 Petaflop，可本地运行 120B 参数模型。其铝制外壳覆盖约 1000 个散热孔，兼顾散热与结构设计，整机功耗仅 100W。系统预装开发者优化版 Windows 11 Pro，并配置了 VS Code、GitHub Copilot、WSL 2 等开发工具，旨在减少环境搭建时间。该设备将于今年晚些时候发售。

AI产品微软 Surface RTX Spark Dev Box AI 开发机本地推理 NVIDIA

推荐理由：本地跑 120B 模型终于有正经硬件了——Surface RTX Spark Dev Box 把 AI 开发环境打包成 100W 的桌面盒子，做模型微调或智能体开发的团队可以直接关注，省去搭服务器和配环境的麻烦。

原文

04:27

Decoder@Matthias Bastian

78°

Google DeepMind 发布了 Gemma 4 12B 开源模型，原生支持文本、图像和音频处理，仅需 16GB 内存即可在笔记本上运行。该模型在基准测试中几乎与两倍大小的 26B 模型持平，并采用 Apache 2.0 许可证，允许商业使用。这标志着多模态 AI 在消费级硬件上的重大突破，降低了开发者和企业的使用门槛。

AI模型多模态开源/仓库 Gemma 4 Google DeepMind 本地推理

推荐理由：多模态模型终于能跑在普通笔记本上了，做本地 AI 应用或边缘计算的开发者可以直接下载试试，性能还接近两倍大的模型。

原文

6月3日

22:09

Decoder@Jonathan Kemper

Perplexity 发布了一个编排器，能够结合本地计算机上的 AI 模型与强大的云端模型，并自动决定每个任务在何处处理。该系统旨在优化性能与成本，让用户无需手动选择运行环境。这一创新可能改变 AI 应用的部署方式，尤其对隐私敏感或需要低延迟的场景有重要意义。Perplexity 的混合系统为开发者提供了更灵活的 AI 使用方案。

AI产品混合AI Perplexity 本地推理云端模型编排器

推荐理由：Perplexity 的混合 AI 系统解决了本地与云端资源分配难题，做 AI 应用开发或关注隐私与效率平衡的团队值得关注，可以直接尝试优化工作流。

原文

14:45

14:45IT之家（博客/媒体）

磐镭推出 YO2 迷你 AI 工作站，搭载 AMD 锐龙 AI Max+ 395 处理器，配备 128GB LPDDR5X-8000 内存和 2TB SSD，定价 21999 元。机身采用银色金属材质，正面有 RGB 灯带，支持 160W 峰值性能释放，可调节持续功耗。接口丰富，包括双 2.5GbE 网口、USB-C 40Gbps、DisplayPort 2.0 等，适合本地 AI 推理和内容创作。该产品定位高性能迷你主机，兼顾便携与算力需求。

AI产品迷你主机 AI工作站 AMD锐龙本地推理高性能计算

推荐理由：本地跑大模型或做 AI 渲染的团队，这台 128GB 内存的迷你工作站比同配置笔记本便宜不少，接口也够全，值得关注。

原文

5月28日

18:13

18:13IT之家（博客/媒体）

雷神在AI工作站发布会上推出三款新品：专业级移动工作站M7000、全能本M6000和智能体笔记本aibook。M7000搭载AMD锐龙AI Max+ 395处理器，最高128GB内存，支持群联aiDaptiv+方案，可在64GB内存上流畅运行120B参数模型。M6000面向学生和创作者，配备锐龙9 9850HX和RTX 5070 Ti。aibook 14 Air Carbon仅重1kg，可本地运行35B MoE模型。三款产品均支持国补，价格从9999元到19999元不等。

AI产品 AI工作站雷神 AMD锐龙本地推理 aiDaptiv+

推荐理由：雷神把本地大模型推理的门槛打下来了——M7000用SSD扩展显存跑120B模型，做AI开发或本地部署的团队可以直接考虑，性价比比传统工作站高出一截。

原文

5月22日

17:13

17:13IT之家（博客/媒体）

ACEMAGIC 发布桌面级迷你主机 AI 工作站 G3A，体积仅 3.46L，支持第 13/14 代酷睿处理器和半高双槽专业显卡。该产品提供 NVIDIA RTX PRO 4000 Blackwell SFF Edition 等显卡选项，配备 DDR5 内存和双 M.2 插槽，整体性能释放达 135W。其抽屉式易维护设计和独立风道散热适合小型办公或 AI 推理场景。

AI产品迷你主机 AI 工作站桌面级显卡 ACEMAGIC 本地推理

推荐理由：迷你主机终于能塞进桌面级显卡和处理器了，做本地 AI 推理或轻量渲染的开发者可以直接考虑，3.46L 体积放桌面不占地方。

原文

5月21日

09:05

09:05IT之家（博客/媒体）

精选

AMD 官方确认将于今年三季度推出基于锐龙 AI Max PRO 400 处理器的下一代锐龙 AI Halo 开发者迷你主机。该系列是全球首款能本地运行 300B 参数模型的 x86 客户端处理器，最大统一内存扩展至 192GB（160GB 可分配为显存）。新系列包含 PRO+ 495、PRO 490、PRO 485 三个型号，内存速度支持 8533MT/s。OEM 合作伙伴预计今年起推出搭载该系列处理器的开发者平台。这标志着本地大模型推理能力在 x86 平台上的重大突破。

AI产品 AMD 锐龙 AI Max PRO 400 AI Halo 本地推理 x86 处理器

推荐理由：本地跑 300B 参数模型不再是梦，做 AI 推理和开发的团队可以直接关注这款 x86 平台，比依赖云端更灵活。

原文

5月20日

22:02

22:02IT之家（博客/媒体）

AMD 宣布其 AI 开发迷你主机锐龙 AI Halo 定价 3999 美元，将于 6 月晚些时候开放预订。该设备搭载锐龙 AI Max+ 395 处理器，配备 128GB LPDDR5x 内存和 2TB SSD，支持万兆网卡和 Wi-Fi 7。AMD 声称该设备每月可为 AI 开发者节省 750 美元的云服务支出，强调其性价比。同时，AMD 还介绍了锐龙 AI Max 400 系列处理器，作为 300 系列的升级版，最高频率提升 0.1GHz，NPU 算力增加 5 TOPS，最大统一内存容量增至 192GB。

AI产品 AMD 锐龙 AI Halo AI 开发主机本地推理处理器升级

推荐理由：AMD 用 3999 美元硬件替代每月 750 美元云租金的算盘很实在，做本地 AI 推理或模型微调的开发者值得算一笔账——6 个月回本，之后就是纯赚。

原文

11:55

pandaily@contact@pandaily.com (Pandaily)

摩尔线程推出AICUBE，一款面向家庭场景的统一AI中心设备，旨在作为单一设备入口点，整合多种AI功能。该产品预计2026年上市，将集成GPU算力，支持本地AI推理，降低对云端的依赖。此举标志着国产GPU厂商从硬件向消费级AI解决方案的延伸，可能推动家庭AI普及。

AI产品摩尔线程 AICUBE 家庭AI中心本地推理国产GPU

推荐理由：摩尔线程从GPU设计跨入家庭AI终端，做智能家居或本地AI应用的开发者值得关注——AICUBE可能成为国产替代的算力入口，2026年上市前建议提前了解生态兼容性。

原文