精选 AI 资讯 · AI 热点

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月5日

09:55

09:55IT之家（博客/媒体）

精选72°

AMD 在 2026 台北国际电脑展上展示了其首个机架级 AI 平台 Helios，定位高端 AI 基础设施市场，直接对标英伟达的 NVL72 VR200。该平台搭载第 6 代 EPYC Venice 处理器（最多 256 核）和 72 颗 Instinct MI455X 加速器，配备 31TB HBM4 显存和 1400TB/s 带宽，FP4 稠密精度下理论算力达 2900 PFLOPS。虽然算力略逊于英伟达 VR200 NVL72，但 HBM4 显存容量更大，更适合大语言模型等显存密集型任务。互联方面采用 UALink-over-Ethernet，scale-up 带宽达 260TB/s，并配备支持 Ultra Ethernet 的 800GbE 网卡。首批方案由合作伙伴展示，计划 2026 年内供货。

AI产品 AMD Helios 机架级AI平台 HBM4 英伟达NVL72

推荐理由：AMD 终于拿出了机架级 AI 平台，显存容量优势对大模型训练团队很关键，做 AI 基础设施选型的值得关注。

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？

5月28日

09:43

09:43IT之家（博客/媒体）

精选

韩国 AI 芯片企业 FuriosaAI 宣布与博通合作开发第三代 AI 推理加速器，采用 2nm 制程、HBM4 内存和博通 SUE 以太网互连技术。该芯片基于 FuriosaAI 自研的 TCP 架构，专注于高带宽数据传输和大规模张量运算，而非管理细线程。博通认为推理性能越来越依赖数据重用和通信效率，而非单纯的计算能力。产品目标 2028 年上半年出样，以机架级系统形式出货。

AI产品 AI芯片推理加速器 2nm制程 HBM4 博通

推荐理由：FuriosaAI 的 TCP 架构和博通的互连技术直击大规模 AI 推理的通信瓶颈，做数据中心或 AI 基础设施的团队值得关注，这可能是 2028 年推理加速的新方向。

5月25日

22:31

22:31IT之家（博客/媒体）

精选

美光科技宣布其第六代高带宽内存 HBM4 正在顺利扩大产能，量产爬坡速度是去年 HBM3E 的两倍，良率提升更快。HBM4 主要面向英伟达 Vera Rubin AI 计算平台，得益于 HBM3 和 HBM3E 的经验积累、1-beta 工艺的稳定性以及优化的基础裸片设计。下一代 HBM4E 将改用 1-gamma 工艺，基础裸片由台积电代工，美光计划明年启动量产。三星和 SK 海力士也在推进 HBM4E 开发，分别计划今年第二季度和下半年提供样品。

行业美光 HBM4 HBM4E AI 芯片存储技术

推荐理由：美光 HBM4 产能翻倍提速，直接利好英伟达下一代 AI 平台，做 AI 基础设施或关注存储芯片的团队值得关注。HBM4E 转向台积电代工，产业链格局正在变化，建议点开了解具体策略。