AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:本地部署×
6月20日
17:42
17:42IT之家(博客/媒体)
74°
LM Studio 与苹果在 WWDC 2026 期间合作,用四台 Mac Studio 集群成功运行月之暗面万亿参数大模型 Kimi K2.6。Kimi K2.6 总参数达 1 万亿,采用 MoE 架构,激活参数 320 亿,支持长上下文、多模态输入和智能体任务。四台 Mac Studio 通过 Thunderbolt 5 RDMA 内存共享形成约 1.5TB 统一内存,实现模型推理。演示还展示 LM Link 功能,用户可从 MacBook Neo 或 iPhone 安全远程访问集群模型,数据保持本地处理。在类似配置下,模型生成速度约 28 tokens/s,功耗低于传统 GPU 集群。
AI模型Kimi K2.6LM StudioMac Studio本地部署推理模型

推荐理由:LM Studio 用四台 Mac Studio 跑起万亿参数的 Kimi K2.6,还能用 iPhone 远程调用,给消费级本地部署开了个好头。
原文
6月18日
08:21
08:21IT之家(博客/媒体)
73°
苹果在WWDC26特别讲座中演示了在4台Mac Studio上通过LM Studio本地运行1万亿参数的Kimi K2.6模型。工程师仅用单条提示词生成了WWDC badge tracker应用,该应用具备3D动画和全息视觉效果。演示使用了低延迟RDMA over Thunderbolt技术,苹果在macOS Tahoe 26.2中引入。Kimi K2.6由月之暗面于2026年4月20日发布,升级了代码编写和Agent集群能力。
AI模型Kimi K2.6Mac StudioLM Studio月之暗面本地部署

推荐理由:苹果用4台Mac Studio跑万亿参数Kimi K2.6,本地低延迟,一条提示词生成App,开发者必看。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
13:52
13:52IT之家(博客/媒体)
NCASE 发布了其首款 ATX 兼容机箱 P1,采用 36L 紧凑设计,专为个人本地 AI 工作站装机需求打造。该机箱支持 SSI-CEB 主板,可容纳多张 4 槽超厚显卡,并支持 6 颗 180mm 大尺寸风扇及三组冷排,散热能力强劲。P1 提供三种前板版本(蜂窝、百叶防尘、百叶实木),定价分别为 355/275/315 美元。目前详细参数尚未公布,但已引发 AI 硬件爱好者关注。
AI产品AI 工作站机箱NCASE紧凑设计本地部署

推荐理由:AI 工作站装机党终于有了紧凑型机箱选择——36L 体积塞进多张 4 槽显卡和 6 颗大风扇,散热和扩展性兼顾,做本地大模型部署的团队可以关注。
原文
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月4日
02:51
02:51marktechpost@Asif Razzaq
88°
Google DeepMind 发布了 Gemma 4 12B,一款无编码器的多模态模型,直接将视觉和音频输入送入 LLM 主干,无需传统视觉或音频编码器。该模型原生支持音频理解,可在 16GB 内存的笔记本电脑上本地运行,并采用 Apache 2.0 开源许可。这降低了多模态 AI 的硬件门槛,让开发者能在消费级设备上部署视觉和音频处理能力。Gemma 4 12B 的发布标志着多模态模型向轻量化和本地化迈出重要一步。
AI模型多模态模型开源/仓库Gemma 4 12B本地部署无编码器

推荐理由:多模态模型终于能跑在普通笔记本上了,做本地 AI 应用或边缘计算的开发者可以直接下载试用,16GB 内存就能跑视觉+音频推理,开源许可也友好。
原文
6月3日
00:20
00:20IT之家(博客/媒体)
技嘉在台北电脑展2026上发布了“AI TOP”桌面生态系统,包括三款面向不同市场的AI台式整机:AI TOP 100 B850、AI TOP 100 Z890和AI TOP 500 TRX50。其中,AI TOP 100 B850最高可运行405B参数的大语言模型,兼容100多款AI应用,适合本地部署高智能模型。AI TOP 100 Z890配备雷电5接口,支持串联构建协同计算环境,性能提升最高1.6倍。AI TOP 500 TRX50定位旗舰,搭载24核48线程的AMD锐龙Threadripper PRO处理器,最高可选配768GB DDR5内存,可直接在CPU上运行大模型。这些产品旨在为AI开发者和企业提供高性能的本地AI计算解决方案。
AI产品AI桌面生态系统技嘉大语言模型本地部署整机

推荐理由:本地部署大模型的门槛又降低了——技嘉这三款整机直接解决了硬件兼容和性能瓶颈问题,做AI推理或模型微调的团队可以省去自己攒机的麻烦,值得关注。
原文
5月28日
18:03
18:03IT之家(博客/媒体)
雷神在AI工作站新品发布会上推出Master T系列塔式工作站,覆盖旗舰到入门产品线。旗舰级Master T9000系列可选96核AMD锐龙Threadripper PRO 9995WX处理器和四卡AMD Radeon AI PRO R9700,FP8稀疏算力达3096 TFLOPS,可满足70B模型全精度推理。Master T7000系列可选锐龙9 9950X3D2处理器,单卡提供766 TFLOPS AI算力。这些工作站面向AI开发和高性能计算场景,提供本地化部署能力。
AI产品AI工作站雷神AMDRadeon AI PRO R9700本地部署

推荐理由:雷神这次把AI工作站的门槛拉高了——四卡R9700能跑70B模型全精度推理,做本地大模型部署的团队可以直接考虑,省去云端算力成本。
原文
5月27日
14:05
14:05IT之家(博客/媒体)
PrismML 发布 Bonsai Image 4B 系列图像生成模型,包含 1-bit 和 Ternary 两个版本,专为本地设备优化。该模型基于 LUX.2 Klein 4B 构建,通过二值/三值权重大幅压缩体积,1-bit 版 Transformer 仅 0.93GB,内存占用降至 1.5GB。在 iPhone 17 Pro Max 上生成 512×512 图像仅需 9.4 秒,Mac M4 Pro 上约 6 秒,速度比全精度模型快 5.6 倍。质量方面,Ternary 版在 1.21GB 体积下保留约 95% 的准确性,1-bit 版在不足 1GB 下保留约 88%。这标志着高质量图像生成模型首次在手机上实现实时可用。
AI模型图像生成模型压缩本地部署Bonsai Image 4BiPhone

推荐理由:手机端终于能跑正经的图像生成模型了,做移动端 AI 应用或创意工具的开发者可以直接在 iPhone 上体验,9.4 秒出图的速度已经可用。
原文
5月26日
16:06
16:06marktechpost@Michal Sutter
OmniVoice Studio 是一个完全本地运行的开源语音工具,无需 API 密钥、云账户或订阅。它支持语音克隆、视频配音、实时听写和说话人分离,覆盖 646 种语言的文本转语音。项目还提供 MCP 服务器,可与 Claude、Cursor 等客户端集成。这为追求隐私和低成本的语音处理需求提供了强大替代方案。
AI产品语音克隆开源/仓库MCP/工具文本转语音本地部署

推荐理由:做语音应用或内容创作的团队终于有了本地可用的开源方案,隐私安全且零成本,建议试试集成到工作流中。
原文
5月25日
10:16
10:16Pandaily@contact@pandaily.com (Pandaily)
精选
字节跳动开源了原生多模态模型Lance,可在40GB显存上本地运行。该模型发布一天内登上了Hugging Face趋势榜。Lance支持图像、文本等多种模态的联合理解与生成。
AI模型LanceByteDance多模态开源模型本地部署

推荐理由:字节开源40GB可跑的多模态模型
原文
5月24日
03:37
03:37marktechpost@Michal Sutter
精选72°
腾讯开源了 TencentDB Agent Memory,一个完全本地的 AI 智能体记忆系统,采用 MIT 许可证。该系统结合了符号短期记忆(将冗长的工具日志压缩为紧凑的 Mermaid 任务画布)和四层长期记忆金字塔(L0 对话 → L1 原子 → L2 场景 → L3 人格)。它作为 OpenClaw 插件和 Hermes Docker 镜像提供,默认在本地 SQLite + sqlite-vec 上运行,并使用混合 BM25 + 向量检索与 RRF 融合。腾讯自己的基准测试显示,在 WideSearch 上使用 OpenClaw 时,令牌减少 61.38%,相对通过率提升 51.52%,PersonaMem 准确率从 48% 提升到 76%。
AI产品智能体记忆系统开源/仓库腾讯本地部署

推荐理由:腾讯开源的四层本地记忆管线解决了智能体长期记忆的痛点,做本地 AI 应用或智能体开发的团队可以直接集成,建议试试这个 MIT 许可的方案。
原文
精选全部日报登录