全部 AI 动态 · AI 热点

6月20日

17:42

17:42IT之家（博客/媒体）

74°

LM Studio 与苹果在 WWDC 2026 期间合作，用四台 Mac Studio 集群成功运行月之暗面万亿参数大模型 Kimi K2.6。Kimi K2.6 总参数达 1 万亿，采用 MoE 架构，激活参数 320 亿，支持长上下文、多模态输入和智能体任务。四台 Mac Studio 通过 Thunderbolt 5 RDMA 内存共享形成约 1.5TB 统一内存，实现模型推理。演示还展示 LM Link 功能，用户可从 MacBook Neo 或 iPhone 安全远程访问集群模型，数据保持本地处理。在类似配置下，模型生成速度约 28 tokens/s，功耗低于传统 GPU 集群。

AI模型 Kimi K2.6 LM Studio Mac Studio 本地部署推理模型

推荐理由：LM Studio 用四台 Mac Studio 跑起万亿参数的 Kimi K2.6，还能用 iPhone 远程调用，给消费级本地部署开了个好头。

6月18日

08:21

08:21IT之家（博客/媒体）

73°

苹果在WWDC26特别讲座中演示了在4台Mac Studio上通过LM Studio本地运行1万亿参数的Kimi K2.6模型。工程师仅用单条提示词生成了WWDC badge tracker应用，该应用具备3D动画和全息视觉效果。演示使用了低延迟RDMA over Thunderbolt技术，苹果在macOS Tahoe 26.2中引入。Kimi K2.6由月之暗面于2026年4月20日发布，升级了代码编写和Agent集群能力。

AI模型 Kimi K2.6 Mac Studio LM Studio 月之暗面本地部署

推荐理由：苹果用4台Mac Studio跑万亿参数Kimi K2.6，本地低延迟，一条提示词生成App，开发者必看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

13:52

13:52IT之家（博客/媒体）

NCASE 发布了其首款 ATX 兼容机箱 P1，采用 36L 紧凑设计，专为个人本地 AI 工作站装机需求打造。该机箱支持 SSI-CEB 主板，可容纳多张 4 槽超厚显卡，并支持 6 颗 180mm 大尺寸风扇及三组冷排，散热能力强劲。P1 提供三种前板版本（蜂窝、百叶防尘、百叶实木），定价分别为 355/275/315 美元。目前详细参数尚未公布，但已引发 AI 硬件爱好者关注。

AI产品 AI 工作站机箱 NCASE 紧凑设计本地部署

推荐理由：AI 工作站装机党终于有了紧凑型机箱选择——36L 体积塞进多张 4 槽显卡和 6 颗大风扇，散热和扩展性兼顾，做本地大模型部署的团队可以关注。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

02:51

02:51

marktechpost@Asif Razzaq

88°

Google DeepMind 发布了 Gemma 4 12B，一款无编码器的多模态模型，直接将视觉和音频输入送入 LLM 主干，无需传统视觉或音频编码器。该模型原生支持音频理解，可在 16GB 内存的笔记本电脑上本地运行，并采用 Apache 2.0 开源许可。这降低了多模态 AI 的硬件门槛，让开发者能在消费级设备上部署视觉和音频处理能力。Gemma 4 12B 的发布标志着多模态模型向轻量化和本地化迈出重要一步。

AI模型多模态模型开源/仓库 Gemma 4 12B 本地部署无编码器

推荐理由：多模态模型终于能跑在普通笔记本上了，做本地 AI 应用或边缘计算的开发者可以直接下载试用，16GB 内存就能跑视觉+音频推理，开源许可也友好。

6月3日

00:20

00:20IT之家（博客/媒体）

技嘉在台北电脑展2026上发布了“AI TOP”桌面生态系统，包括三款面向不同市场的AI台式整机：AI TOP 100 B850、AI TOP 100 Z890和AI TOP 500 TRX50。其中，AI TOP 100 B850最高可运行405B参数的大语言模型，兼容100多款AI应用，适合本地部署高智能模型。AI TOP 100 Z890配备雷电5接口，支持串联构建协同计算环境，性能提升最高1.6倍。AI TOP 500 TRX50定位旗舰，搭载24核48线程的AMD锐龙Threadripper PRO处理器，最高可选配768GB DDR5内存，可直接在CPU上运行大模型。这些产品旨在为AI开发者和企业提供高性能的本地AI计算解决方案。

AI产品 AI桌面生态系统技嘉大语言模型本地部署整机

推荐理由：本地部署大模型的门槛又降低了——技嘉这三款整机直接解决了硬件兼容和性能瓶颈问题，做AI推理或模型微调的团队可以省去自己攒机的麻烦，值得关注。

5月28日

18:03

18:03IT之家（博客/媒体）

雷神在AI工作站新品发布会上推出Master T系列塔式工作站，覆盖旗舰到入门产品线。旗舰级Master T9000系列可选96核AMD锐龙Threadripper PRO 9995WX处理器和四卡AMD Radeon AI PRO R9700，FP8稀疏算力达3096 TFLOPS，可满足70B模型全精度推理。Master T7000系列可选锐龙9 9950X3D2处理器，单卡提供766 TFLOPS AI算力。这些工作站面向AI开发和高性能计算场景，提供本地化部署能力。

AI产品 AI工作站雷神 AMD Radeon AI PRO R9700 本地部署

推荐理由：雷神这次把AI工作站的门槛拉高了——四卡R9700能跑70B模型全精度推理，做本地大模型部署的团队可以直接考虑，省去云端算力成本。

5月27日

14:05

14:05IT之家（博客/媒体）

PrismML 发布 Bonsai Image 4B 系列图像生成模型，包含 1-bit 和 Ternary 两个版本，专为本地设备优化。该模型基于 LUX.2 Klein 4B 构建，通过二值/三值权重大幅压缩体积，1-bit 版 Transformer 仅 0.93GB，内存占用降至 1.5GB。在 iPhone 17 Pro Max 上生成 512×512 图像仅需 9.4 秒，Mac M4 Pro 上约 6 秒，速度比全精度模型快 5.6 倍。质量方面，Ternary 版在 1.21GB 体积下保留约 95% 的准确性，1-bit 版在不足 1GB 下保留约 88%。这标志着高质量图像生成模型首次在手机上实现实时可用。

AI模型图像生成模型压缩本地部署 Bonsai Image 4B iPhone

推荐理由：手机端终于能跑正经的图像生成模型了，做移动端 AI 应用或创意工具的开发者可以直接在 iPhone 上体验，9.4 秒出图的速度已经可用。

5月26日

16:06

16:06

marktechpost@Michal Sutter

OmniVoice Studio 是一个完全本地运行的开源语音工具，无需 API 密钥、云账户或订阅。它支持语音克隆、视频配音、实时听写和说话人分离，覆盖 646 种语言的文本转语音。项目还提供 MCP 服务器，可与 Claude、Cursor 等客户端集成。这为追求隐私和低成本的语音处理需求提供了强大替代方案。

AI产品语音克隆开源/仓库 MCP/工具文本转语音本地部署

推荐理由：做语音应用或内容创作的团队终于有了本地可用的开源方案，隐私安全且零成本，建议试试集成到工作流中。

5月25日

10:16

10:16

Pandaily@contact@pandaily.com (Pandaily)

精选

字节跳动开源了原生多模态模型Lance，可在40GB显存上本地运行。该模型发布一天内登上了Hugging Face趋势榜。Lance支持图像、文本等多种模态的联合理解与生成。

AI模型 Lance ByteDance 多模态开源模型本地部署

推荐理由：字节开源40GB可跑的多模态模型

5月24日

03:37

03:37

marktechpost@Michal Sutter

精选72°

腾讯开源了 TencentDB Agent Memory，一个完全本地的 AI 智能体记忆系统，采用 MIT 许可证。该系统结合了符号短期记忆（将冗长的工具日志压缩为紧凑的 Mermaid 任务画布）和四层长期记忆金字塔（L0 对话 → L1 原子 → L2 场景 → L3 人格）。它作为 OpenClaw 插件和 Hermes Docker 镜像提供，默认在本地 SQLite + sqlite-vec 上运行，并使用混合 BM25 + 向量检索与 RRF 融合。腾讯自己的基准测试显示，在 WideSearch 上使用 OpenClaw 时，令牌减少 61.38%，相对通过率提升 51.52%，PersonaMem 准确率从 48% 提升到 76%。

AI产品智能体记忆系统开源/仓库腾讯本地部署

推荐理由：腾讯开源的四层本地记忆管线解决了智能体长期记忆的痛点，做本地 AI 应用或智能体开发的团队可以直接集成，建议试试这个 MIT 许可的方案。