AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 841 条中筛出 51 条
全部模型产品行业论文技巧
标签:HBM4×
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月5日
09:55
09:55IT之家(博客/媒体)
精选72°
AMD 在 2026 台北国际电脑展上展示了其首个机架级 AI 平台 Helios,定位高端 AI 基础设施市场,直接对标英伟达的 NVL72 VR200。该平台搭载第 6 代 EPYC Venice 处理器(最多 256 核)和 72 颗 Instinct MI455X 加速器,配备 31TB HBM4 显存和 1400TB/s 带宽,FP4 稠密精度下理论算力达 2900 PFLOPS。虽然算力略逊于英伟达 VR200 NVL72,但 HBM4 显存容量更大,更适合大语言模型等显存密集型任务。互联方面采用 UALink-over-Ethernet,scale-up 带宽达 260TB/s,并配备支持 Ultra Ethernet 的 800GbE 网卡。首批方案由合作伙伴展示,计划 2026 年内供货。
AI产品AMDHelios机架级AI平台HBM4英伟达NVL72

推荐理由:AMD 终于拿出了机架级 AI 平台,显存容量优势对大模型训练团队很关键,做 AI 基础设施选型的值得关注。
原文
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
5月28日
09:43
09:43IT之家(博客/媒体)
精选
韩国 AI 芯片企业 FuriosaAI 宣布与博通合作开发第三代 AI 推理加速器,采用 2nm 制程、HBM4 内存和博通 SUE 以太网互连技术。该芯片基于 FuriosaAI 自研的 TCP 架构,专注于高带宽数据传输和大规模张量运算,而非管理细线程。博通认为推理性能越来越依赖数据重用和通信效率,而非单纯的计算能力。产品目标 2028 年上半年出样,以机架级系统形式出货。
AI产品AI芯片推理加速器2nm制程HBM4博通

推荐理由:FuriosaAI 的 TCP 架构和博通的互连技术直击大规模 AI 推理的通信瓶颈,做数据中心或 AI 基础设施的团队值得关注,这可能是 2028 年推理加速的新方向。
原文
5月25日
22:31
22:31IT之家(博客/媒体)
精选
美光科技宣布其第六代高带宽内存 HBM4 正在顺利扩大产能,量产爬坡速度是去年 HBM3E 的两倍,良率提升更快。HBM4 主要面向英伟达 Vera Rubin AI 计算平台,得益于 HBM3 和 HBM3E 的经验积累、1-beta 工艺的稳定性以及优化的基础裸片设计。下一代 HBM4E 将改用 1-gamma 工艺,基础裸片由台积电代工,美光计划明年启动量产。三星和 SK 海力士也在推进 HBM4E 开发,分别计划今年第二季度和下半年提供样品。
行业美光HBM4HBM4EAI 芯片存储技术

推荐理由:美光 HBM4 产能翻倍提速,直接利好英伟达下一代 AI 平台,做 AI 基础设施或关注存储芯片的团队值得关注。HBM4E 转向台积电代工,产业链格局正在变化,建议点开了解具体策略。
原文
精选全部日报登录