09:46IT之家(博客/媒体)AMD在COMPUTEX 2026宣布,Radeon RX 7000系列显卡通过INT8 AI加速全面适配FSR超分辨率4.1,质量与FP8版本持平。RX 6000系列因缺乏专用AI加速器,需利用传统流处理器单元优化,减少着色器周期占用难度大,发布时间推迟至明年初。FSR 4.1的开发流程使用Instinct MI显卡训练,Radeon PRO优化,并在数十万种PC配置中测试验证。AI模型FSR 4.1RX 7000RDNA 3INT8超分辨率推荐理由:AMD确认了,RX 7000用INT8跑FSR 4.1画质不输FP8,RX 6000得等到明年。想玩新超分可以关注。原文
11:11arXiv cs.LG@Ali Asaria, Tony Salomone, Deep Gandhi精选论文发现消费级Ampere GPU上扩散Transformer的INT8量化常因反量化回bf16而无法利用INT8张量核心。作者为Ideogram 4.0线性层设计了一个融合Triton INT8 GEMM内核,在Ampere张量核心上执行int8×int8→int32,并在epilogue中折叠逐token×逐通道反量化和偏置。该内核实现2.8-4.2倍于bf16的GEMM加速,并保持余弦相似度1.0且无NaN。端到端测试中,在单张RTX 3090上768px分辨率获得约9-10%提速,1024px生成耗时156.5秒,优于NF4(164.5秒)和FP8(172.9秒)基线,且PickScore/CLIPScore无质量损失。论文Ideogram 4.0RTX 3090INT8GEMM推理加速Triton2 个信源在谈推荐理由:INT8反超FP8,单卡RTX 3090跑1024px扩散模型原文