精选理由
富士通新架构PHOTON在多查询任务上比Transformer快475倍,1.2B小模型实测,省内存省GPU。
富士通发布了PHOTON架构,在多查询场景下性能最高可达Transformer架构的475倍。该架构通过语义分层处理替代词元级分割,降低计算复杂度并提升并行性。测试显示,在600M、900M和1.2B参数模型上,PHOTON实现了更高的迭代吞吐量和更低的内存占用。其中1.2B模型性能提升475倍,但质量略有下降。
AI 翻译 · 中文
富士通发布了PHOTON架构,在多查询场景下性能最高可达Transformer架构的475倍。该架构通过语义分层处理替代词元级分割,降低计算复杂度并提升并行性。测试显示,在600M、900M和1.2B参数模型上,PHOTON实现了更高的迭代吞吐量和更低的内存占用。其中1.2B模型性能提升475倍,但质量略有下降。
IT之家 6 月 25 日消息,富士通 (Fujitsu) 日本当地时间昨日介绍了其开发的 PHOTON(自上而下网络并行分层计算)架构,宣称其在多查询 (生成多个备选结果并在此基础上给出最终答案) 场景下性能至高可达主流 Transformer 架构的 475 倍。 富士通表示,Transformer 架构的一大弊病是其在长上下文输入或多线程同步处理的场景下会执行大量访存操作来保留历史信息,这往往会导致处理速度下降。 PHOTON 能…