18:50腾讯混元 Tencent Hunyuan@TencentCloud腾讯云宣布 EdgeOne Makers 将于2026年6月23日上线,这是一个在边缘构建和部署AI Agent的平台。直播注册现已开放,用户可通过链接预约。该平台旨在让开发者直接在边缘节点上构建、运行AI Agent,减少延迟。EdgeOne Makers 将提供边缘计算和AI Agent的集成能力。AI产品Tencent EdgeOne MakersEdgeOne腾讯云智能体边缘计算推荐理由:腾讯云要发新平台EdgeOne Makers,能在边缘直接跑AI Agent,6月23日直播,感兴趣可以提前注册看看。原文
23:31阿里云 Alibaba Cloud@alibaba_cloud阿里云推出EdgeAgent Arena竞赛,旨在将Qwen模型应用于机器人及IoT设备。参赛者需构建通过边缘传感器感知并本地行动的硬件系统。竞赛总奖金超过70,000美元,注册现已开放。该活动鼓励利用Qwen在边缘场景中实现智能决策与本地执行。行业QwenAlibaba CloudEdgeAgent Arena机器人边缘计算推荐理由:阿里云搞了个比赛,用Qwen做边缘机器人,奖金7万美元,想动手的可以报名试试。原文
11:11arXiv cs.AI@Taym Alshoghri, Deemah H. Tashman, Mohammad Reza Gerami, Soumaya CherkaouiIoMT设备资源受限且处理敏感健康数据,联邦学习中模型更新可能泄露隐私。量子计算威胁传统加密,需集成后量子密码(PQC)。该文提出基于Kubernetes的框架,在Raspberry Pi测试床上验证。分布式加密处理延迟比顺序设计低32%,资源开销可控。框架为联邦学习IoMT系统提供安全编排与通信方案。论文IoMT联邦学习后量子密码边缘计算推荐理由:联邦学习+后量子医疗数据保护原文
11:42IT之家(博客/媒体)日本企业 Analog Tech 发布紧凑型边缘 AI PC 系统 AironiA AIR-AD-AI-001,体积仅 5L,基于英特尔酷睿 Ultra 5 处理器 225,并通过 PCIe 扩展一颗 INT8 算力达 214 TOPS 的 dNPU 加速卡。该加速卡采用 AxeleraAI 的 Metis AIPU,基于三星 5nm 制程,功耗仅 8-15W,可同时处理 24 条 YOLOv5 视频流。设备支持后续升级至更强大的 AxeleraAI Europa AIPU,配备 32GB 内存、512GB SSD 及双网口,适合边缘 AI 推理场景。AI产品边缘计算AI PCdNPU视频分析AxeleraAI推荐理由:边缘 AI 开发者终于有了高算力低功耗的紧凑方案——214 TOPS 的 dNPU 在 5L 机箱里跑 24 路视频流,做安防或工业视觉的团队可以直接评估。原文
22:22IT之家(博客/媒体)铠侠宣布将在 HPE Discover 2026 大会上展示其 SSD 解决方案,并透露这些技术未来将用于月球探索任务。铠侠与慧与科技合作,曾为国际空间站的 HPE 星载计算机 2 号项目提供 130 TB 存储,测试 SSD 在极端环境下的性能。此次大会将重点展示 SSD 如何支持月球探索、AI 负载及边缘计算。展品包括 LC9 系列 NVMe SSD、CM 系列 SAS SSD 等,覆盖高容量 AI 存储、关键任务负载及虚拟化方案。铠侠认为月球数据中心只是时间问题,其 SSD 技术正从太空验证走向月球部署。AI产品铠侠SSD月球数据中心HPE星载计算机边缘计算推荐理由:铠侠把数据中心从国际空间站推向月球,做太空计算或极端环境存储的团队值得关注——SSD 在零重力下跑 AI 负载的测试结果,可能改写未来边缘计算的部署逻辑。原文
22:17Qdrant@qdrant_engine精选该项目利用 Qdrant Edge 的向量搜索和边缘 RAG 技术,在不训练自定义机器学习模型的情况下实现火灾检测。系统将实时传感器读数与本地已知模式进行比对,实现快速、隐私优先的本地推理。这种方法避免了训练和维护专用模型的负担,适合资源受限的环境。项目展示了边缘计算与向量搜索在实时异常检测中的创新应用。AI产品Qdrant Edge向量搜索边缘计算火灾检测RAG推荐理由:做物联网或边缘计算的开发者可以省去模型训练的麻烦——Qdrant Edge 的向量搜索直接匹配已知模式就能检测火灾,隐私和效率都兼顾,值得试试。原文
14:00IT之家(博客/媒体)83°英伟达CEO黄仁勋在2026台北国际电脑展上指出,未来计算将收敛为一套面向AI智能体的统一模式,从云端延伸到PC、汽车、机器人等边缘设备。该模式覆盖AI训练和推理,旨在让所有边缘设备具备自主运行能力。黄仁勋强调,自动驾驶、类人机器人和通信基站本质上都是同类智能体系统。英伟达新推出的88核Arm处理器Vera已全面量产,专为AI智能体生成词元设计,注重单线程速度和内存带宽。行业AI智能体边缘计算英伟达自动驾驶统一架构推荐理由:黄仁勋的演讲为AI基础设施的未来画出了清晰路线图——所有设备都将成为智能体,做边缘计算或自动驾驶的开发者值得关注这一架构变化。原文
07:26OpenAI Blog(博客/媒体)Wasmer 利用 OpenAI 的 Codex(基于 GPT-5.5)构建了一个专为边缘计算优化的 Node.js 运行时。通过 Codex 的代码生成能力,开发效率提升了 10 到 20 倍,原本需要数月的工作在几周内完成。这一成果展示了 AI 辅助编程在基础设施级项目中的实际价值,尤其适合需要快速迭代的边缘计算场景。AI产品CodexGPT-5.5边缘计算Node.jsAI 辅助编程10 个信源在谈推荐理由:边缘计算和 Node.js 开发者可以看看 Wasmer 如何用 Codex 把数月工期压缩到几周——AI 辅助编程在基础设施层落地了,值得借鉴。原文
04:21Satya Nadella@satyanadella微软CEO Satya Nadella在Build大会上感谢NVIDIA CEO Jensen Huang的参与,强调双方在云端和边缘计算领域的深度合作。Jensen Huang从台北连线,展示了从Windows设备到AI工厂的全面合作,标志着智能体AI时代的到来。此次合作旨在推动AI基础设施的规模化部署,为开发者提供更强大的计算能力。行业微软NVIDIA智能体AI云端合作边缘计算10 个信源在谈推荐理由:微软和NVIDIA联手推进智能体AI,从设备到云端全面覆盖,做AI基础设施和边缘计算的开发者值得关注这一合作动向。原文
23:48Qdrant@qdrant_engineQualcomm 的 Alan Zhu 将在 Vector Space Day 上分享边缘端运行生成式 AI 的挑战与经验。他强调,在设备端推理中,延迟不是可以权衡的指标,而是直接影响用户每一次交互感受的关键。活动将聚集 300 多位 AI 构建者,讨论智能体、生产中的记忆、从云到边缘的检索以及多模态 AI。这反映了行业对边缘 AI 实用化、低延迟体验的重视。行业边缘计算GenAIQualcomm延迟优化AI 活动推荐理由:做边缘 AI 或端侧推理的开发者,这场分享点出了延迟对用户体验的直接影响,值得关注 Qualcomm 的实战经验。原文
20:09pandaily@contact@pandaily.com (Pandaily)Moffett AI 发文批评当前 AI 硬件行业“堆算力”的惯性思维,认为万亿参数模型并不总是需要同等规模的昂贵基础设施。他们提出,推理成本优化应聚焦于“匹配任务需求”,避免过度配置。文章以“别用大炮打蚊子”比喻,强调针对不同场景选择合适算力,而非一味追求高端 GPU。这一观点挑战了 NVIDIA 主导的高性能硬件路线,为中小企业和边缘计算场景提供了更经济的 AI 部署思路。行业推理成本硬件优化Moffett AI算力匹配边缘计算7 个信源在谈推荐理由:Moffett AI 戳破了“算力越大越好”的行业泡沫,做 AI 部署和成本控制的团队看完会重新审视自己的硬件采购清单,值得点开反思。原文
15:09IT之家(博客/媒体)精选瑞昱半导体在 COMPUTEX 2026 上展示了两款新芯片:PCIe 桥接扩充芯片 RTL9151AS 和边缘端 AI 加速芯片 RTD2811。RTL9151AS 类似“小南桥”,通过 PCIe Gen4 ×1 上行扩展出以太网口、USB 和 SATA,适合通道紧缺的平台。RTD2811 拥有 20TOPS 算力 NPU,支持多种数据格式和 Transformer 模型,可兼作加速芯片和主 SoC。这两款芯片分别解决了扩展性和边缘 AI 推理需求,对硬件开发者和边缘计算场景有实际价值。AI产品瑞昱PCIe桥接芯片AI加速芯片边缘计算COMPUTEX推荐理由:做嵌入式或边缘计算的开发者会感兴趣——RTD2811 的 20TOPS 算力能跑 Transformer,且可当主 SoC 用,省掉额外芯片;RTL9151AS 则帮 PCIe 通道紧张的平台解决扩展难题,值得关注。原文
10:55IT之家(博客/媒体)微星推出基于 NVIDIA RTX Spark 超级芯片的迷你主机 EdgeMesa N AI+,具备 20 核 CPU、6144 CUDA 核心和 1 Petaflop FP4 稀疏 AI 算力,支持最高 128GB 统一内存。该主机外观工业风,后置 4 个 USB-C、1 个 HDMI 和 1 个 10GbE 网口,支持四屏输出。微星称其适用于医疗、零售、金融、机器人和智慧城市等场景,紧凑设计适合空间有限环境,高负载下仍能稳定安静运行。这是继 EdgeXpert 后微星在 AI 迷你主机领域的又一布局,专为智能体和 AI 应用打造。AI产品RTX Spark迷你主机AI 算力智能体边缘计算10 个信源在谈推荐理由:RTX Spark 芯片将桌面级 AI 算力塞进迷你主机,做边缘 AI 部署或智能体开发的团队可以直接考虑这个紧凑方案,省空间又省电。原文
09:39arXiv cs.AI@Ranulfo Bezerra, Satoshi Tadokoro, Kazunori Ohno这篇综述论文系统梳理了人工智能、物联网与机器人三者融合的现状与挑战。尽管AIoT和IoRT(物联网机器人)已有进展,但缺乏统一的设计框架。论文强调了小语言模型(SLM)在边缘端和大语言模型(LLM)在云端的协同作用,用于分布式认知与自主决策。作者提出模块化系统架构,分析了互操作性和反馈控制方面的持续缺口,并按集成深度对现有工作分类。该工作为构建下一代模块化、可解释、能动态学习的AI-IoT-机器人生态系统提供了概念和技术路线图。论文AI-IoT-机器人融合小语言模型大语言模型边缘计算连接机器人推荐理由:做机器人或物联网系统架构的开发者,这篇综述帮你理清AI、IoT和机器人三者如何真正融合,避免重复造轮子,值得收藏作为技术路线参考。原文
11:30Jerry Liu@jerryjliu0LlamaIndex 推出 LiteParse WASM 包,可在浏览器、Cloudflare Workers 等边缘环境毫秒级解析 PDF。该包轻量、最小化,基于 WebAssembly,25 行代码即可实现 PDF 文本提取和页数统计。开发者可直接在 Cloudflare Workers 上运行,无需后端服务器。项目已在 GitHub 开源,并提供 Cloudflare 入门模板。AI产品PDF解析WASM边缘计算Cloudflare WorkersLlamaIndex推荐理由:做浏览器端或边缘计算 PDF 处理的开发者,终于有了一个轻量、快速、可随处部署的解析方案,建议直接试试 Cloudflare 模板。原文
19:02IT之家(博客/媒体)谷歌在 2026 年 I/O 大会上发布了 Coral Board,一款专为本地运行 AI 模型设计的小型单板计算机。它搭载了自研的 Coral NPU(基于 RISC-V 架构),配合 Synaptics Astra SL2619 芯片(2GHz 双核处理器、2GB 内存、1 TOPS 算力),可在网络受限或隐私敏感场景下处理 AI 任务。现场演示了实时翻译、语音控制和生成式音乐表演,其中 YOLOv8 模型追踪水母运动并转化为音乐。这款设备面向边缘计算和嵌入式 AI 开发者,降低了本地部署门槛。AI产品谷歌Coral Board单板计算机边缘计算Gemma 31 个信源在谈推荐理由:Coral Board 让边缘 AI 开发有了更轻量的选择,做嵌入式或物联网的开发者可以直接用它跑 Gemma 3 模型,值得关注。原文
22:50Decoder@Jonathan KemperGoogle 在 Google I/O 上发布了 Coral Board,一款紧凑型单板计算机,专为设备端 AI 设计。该板卡能够本地运行 Gemma 3 模型,无需依赖云端。这为边缘计算和物联网设备提供了强大的 AI 能力,降低了延迟并增强了隐私保护。开发者可以将其用于智能家居、工业自动化等场景,实现实时推理。AI产品GoogleCoral BoardGemma 3边缘计算单板计算机1 个信源在谈推荐理由:边缘 AI 终于有了官方硬件方案——Coral Board 让 Gemma 3 在本地跑起来,做嵌入式或物联网的开发者可以直接用它部署模型,省去云端依赖。原文
11:44berryxia@berryxia76°Google发布新一代Coral板,搭载Gemma系列模型,支持板载语音翻译、自然语言控制硬件、视觉+声音生成音乐等实时任务,完全无需云端或联网。此举解决了本地AI延迟、隐私和成本问题,将AI战场从云端拉回设备端。Coral板将于今年夏天上线,标志着本地AI从实验性玩具转向实际生产力工具。AI产品本地AI边缘计算Gemma模型Coral板硬件推荐理由:做边缘计算或隐私敏感应用的开发者终于有了靠谱的硬件+模型方案,延迟和成本痛点一次解决,建议关注今年夏天的上线动态。原文
18:17IT之家(博客/媒体)硅谷 AI 芯片初创企业 TetraMem 宣布其 22nm SoC MLX200 在台积电制程上完成芯片验证,评估套件预计 2026 年下半年推出。该芯片采用“模拟内存计算”技术,通过 RRAM 阵列直接在内存中完成向量矩阵乘法,大幅缩短数据传输距离,实现低功耗低延迟的 AI 推理。TetraMem 瞄准可穿戴设备、边缘 IoT、传感器和嵌入式系统等细分场景,为边缘 AI 提供高效能解决方案。这一进展标志着存内计算从概念走向实际产品化,有望改变边缘设备的 AI 部署方式。AI产品存内计算AI 芯片边缘计算低功耗TetraMem推荐理由:存内计算是突破冯·诺依曼瓶颈的关键路径,做边缘 AI 或低功耗设备的开发者值得关注——TetraMem 的 22nm SoC 验证意味着这项技术离量产又近了一步。原文
00:49NVIDIA AI@NVIDIAAI76°NVIDIA AI 官方账号展示了一个本地AI部署方案:使用两台 DGX Spark 服务器和 MiniMax M2.7 NVFP4 模型,实现了16个本地AI智能体同时运行。所有推理都在本地完成,无需调用云端API。这展示了在本地硬件上运行多个AI智能体的可行性,对于需要低延迟、高隐私或离线环境的AI应用场景具有重要意义。AI产品NVIDIADGX SparkMiniMax M2.7本地智能体边缘计算推荐理由:本地同时跑16个AI智能体,做边缘计算或隐私敏感型AI应用的团队可以直接参考这个方案,无需依赖云API。原文
11:46IT之家(博客/媒体)精选英特尔规划了一款特殊设计的 Nova Lake 处理器,采用 8 个能效核(无性能核)和 12 个 Xe 核心的配置,GPU 规模与家族最大型号持平。该设计特化了 GPU 性能,更适合 SLM 本地推理部署等边缘 AI 应用场景。英特尔此前也曾为边缘应用推出过无客户端对应型号的处理器,如 Bartlett Lake 12P。AI产品英特尔Nova Lake边缘计算GPU 推理SLM 部署推荐理由:边缘 AI 推理场景的开发者终于有了更对口的硬件——GPU 特化设计直接利好本地 SLM 部署,做边缘计算的团队值得关注这款新规划。原文
14:22IT之家(博客/媒体)精选英伟达发布2027财年第一财季报告,营收816.15亿美元,同比增长85%。财报将原本独立统计的游戏业务(64亿美元)并入边缘计算分类,涵盖AI PC、RTX显卡、机器人等。英伟达称此举更能反映当前增长驱动力。行业英伟达财报边缘计算游戏业务推荐理由:英伟达财报调整业务分类原文
13:03IT之家(博客/媒体)英伟达在 2027 财年第一财季首次将数据中心收入拆分为超大规模客户和 ACIE(AI 云、工业、企业)两类。ACIE 收入约 370 亿美元,环比增长 31%,其中 AI 云收入同比增长超 3 倍,连接全球约 25 万家客户。黄仁勋认为,由于工业和企业可触达经济活动规模达 50-80 万亿美元,ACIE 增速有望长期快于超大规模客户。边缘计算收入 64 亿美元,环比增长 10%,主要来自 Blackwell 工作站需求。英伟达还提到与 Uber 合作,计划 2028 年前支持近 30 个城市的 Robotaxi 车队。行业英伟达ACIEAI 云数据中心边缘计算推荐理由:英伟达首次披露 ACIE 业务细节,AI 云收入暴增 3 倍,做企业级 AI 部署或云服务的团队值得关注这个新增长点。原文
08:00Julien Chaumond@julien_cHuggingFace 联合创始人 Julien Chaumond 在 X 上发起讨论,探讨 Apple Silicon 是否是本地 AI 的最佳平台。该话题引发社区热议,目前已有 7 个点赞和 715 次浏览。讨论聚焦于 Apple Silicon 在运行本地 AI 模型时的性能、能效和生态优势,与 NVIDIA GPU 等传统方案形成对比。这反映了本地 AI 部署正从云端向边缘设备迁移的趋势,Apple Silicon 的 M 系列芯片因其统一内存架构和高效能而备受关注。行业Apple Silicon本地AIHuggingFace边缘计算芯片对比推荐理由:本地 AI 部署正在从云端走向桌面,Apple Silicon 的 M 系列芯片可能是最佳选择——做本地推理或边缘 AI 的开发者值得关注这场讨论。原文
07:59Y Combinator@ycombinator精选General Instinct 公司成功将前沿 AI 模型部署到 Jetson、移动 NPU 和 ARM CPU 等受限边缘硬件上,使机器人及物理 AI 团队能够在离线环境下运行低延迟模型。这一突破解决了边缘设备算力不足的痛点,让 AI 模型在资源受限的场景中也能高效推理。该技术由 Bill Jiao 和 Guanming 领导,已获得 Y Combinator 支持。AI产品边缘计算机器人AI模型部署JetsonARM CPU推荐理由:做机器人或边缘 AI 的开发者终于有了靠谱的离线推理方案——General Instinct 让 Jetson 和 ARM 设备也能跑前沿模型,建议做嵌入式 AI 的团队点开看看。原文
12:21pandaily@contact@pandaily.com (Pandaily)精选72°清华大学与阿里巴巴联合发表论文,提出ViT³(Vision Test-Time Training)架构,这是一种纯Transformer模型,在视觉任务中实现了线性计算复杂度。该架构使得在边缘设备上进行高分辨率图像理解成为可能,解决了传统Transformer在视觉应用中计算量过大的问题。该论文已被CVPR 2026接收为Oral论文,标志着视觉Transformer在效率上取得重要突破。论文视觉Transformer线性复杂度边缘计算高分辨率图像清华/阿里推荐理由:视觉Transformer终于突破了计算瓶颈,做边缘计算或高分辨率图像处理的开发者可以直接关注,这可能是部署到手机等设备的关键技术。原文
09:40IT之家(博客/媒体)精选AMD在2月宣布EPYC 8005系列,5月19日博客公开完整参数。该处理器采用SP6插槽,提供8至84个Zen 5核心,支持6通道DDR5-6400内存,拥有96条PCIe 5.0通道,默认TDP范围70-225W。相比上代EPYC 8004,单核整数性能提升30%,单核能效提升6.4%;旗舰型号整数性能提升40%,旗舰能效提升9.5%。官网表格中最低TDP为95W。行业AMDEPYC 8005Zen 5服务器处理器边缘计算推荐理由:比上代性能高40%原文
01:45Pandaily@contact@pandaily.com (Pandaily)精选地平线机器人开源HoloMotion-1,这是一个4B参数的机器人小脑模型,专为全身类人机器人控制设计。该模型在边缘设备上实现300FPS的实时推理,显著提升了响应速度。HoloMotion-1通过开源发布,旨在推动机器人领域研究与应用。AI模型Horizon RoboticsHoloMotion-1机器人控制开源模型边缘计算推荐理由:地平线开源4B参数机器人小脑模型,300FPS跑在设备上原文
01:10IT之家(博客/媒体)SNUC 发布了 NUC 15 Pro Fanless 被动散热迷你主机,基于华硕 NUC 15 Pro 设计,但采用被动散热系统并全面加固,适用于恶劣环境。该主机搭载第二代英特尔酷睿 Ultra 处理器,AI 算力达 99 TOPS,支持最高 96GB DDR5 内存和 PCIe Gen5 SSD。它获得 MIL-STD-810H 军规认证,可在宽温下稳定运行,外部 I/O 与标准版一致。这款产品为工业、户外或静音需求场景提供了高性能无风扇计算方案。AI产品迷你主机被动散热英特尔酷睿 UltraMIL-STD-810H边缘计算推荐理由:工业或户外部署的团队终于有了高性能无风扇选择——NUC 15 Pro Fanless 在严苛环境下也能稳定运行,做边缘计算或静音办公的可以直接考虑。原文
14:43IT之家(博客/媒体)GEEKOM 发布了 2026 款 A9 Max 迷你主机,主要升级为 AMD 锐龙 AI 9 HX 470 处理器,属于 Gorgon Point 家族。该机型采用全金属机身和 IceBlast 3.0 散热系统,支持 DDR5 内存、双 M.2 PCIe Gen4 盘位、Wi-Fi 7 和蓝牙 5.4。接口丰富,包括多个 USB-A/C、HDMI 2.1 和 2.5GbE 网口。2025 款 32GB+2TB 版本当前售价约 11636 元人民币。AI产品迷你主机AMD锐龙AI处理器GEEKOM边缘计算推荐理由:迷你主机玩家和 AI 工作负载用户值得关注——锐龙 AI 9 HX 470 的 NPU 性能提升,适合本地运行轻量 AI 模型或边缘计算,建议对比 2025 款价格后入手。原文
00:33Google Developers Blog(博客/媒体)Google DeepMind推出Gemma 4系列开源模型,专为在设备端实现多步规划和自主智能体工作流而设计。该系列包含Google AI Edge Gallery供开发者实验“Agent Skills”,以及LiteRT-LM库,提供显著的速度提升和结构化输出。Gemma 4采用Apache 2.0许可,支持140多种语言,兼容移动设备、桌面电脑和Raspberry Pi等IoT平台。AI模型智能体Gemma 4边缘计算开源/仓库多模态1 个信源在谈推荐理由:此发布将前沿的智能体能力带入低功耗设备,为边缘AI应用(如本地化助手和离线自动化)提供了新的可能性,对开发者社区和物联网领域具有实际参考价值。原文
00:33Google Developers Blog(博客/媒体)Google推出LiteRT生产级框架,帮助开发者调用NPU(神经网络处理器)运行AI模型,突破CPU/GPU在性能和续航上的限制。LiteRT通过统一API抽象硬件复杂性,已被Google Meet和Epic Games用于实时视频、动画和语音识别场景,效率显著提升。该平台还提供基准测试工具并支持跨平台部署,覆盖手机、AI PC和工业IoT设备。AI产品移动AINPULiteRT边缘计算Google推荐理由:LiteRT为移动端和边缘设备AI部署提供了标准化的NPU调用方案,对需要低延迟、高能效AI应用的开发者具有实际参考价值。原文