Multiverse Computing 用小块量子电路为 Llama 3.1 8B 扩容，仅加 6000 参数

精选理由

这项研究为 AI 模型扩容提供了非传统路径——用量子电路替代参数堆叠，做模型压缩或效率优化的研究者值得关注，它可能开启低资源提升模型性能的新方向。

AI 摘要

西班牙 Multiverse Computing 的 Aizpurua 团队提出一种新方法，利用小块量子电路为预训练大模型扩容，而非堆叠参数。他们仅给 Llama 3.1 8B 模型增加约 6000 个参数（不到原模型万分之一），便使困惑度降低 1.4%。量子部分运行在 IBM 156 比特处理器上。团队表示增益尚小，但已证明该方法的可行性，为未来量子与经典模型结合提供了新思路。

AI 翻译 · 中文

AI Will西班牙 Multiverse Computing 的 Aizpurua 团队提出用小块量子电路为预训练大模型扩容：不堆参数，而把复杂数学关系压进量子电路。给 Llama 3.1 8B 只加约 6000 个参数（不到原模型万分之一），困惑度便降 1.4%；量子部分跑在 IBM 156 比特处理器。团队称增益尚小但已证可行。 💬 1 🔄 0 ❤️ 0 👀 279 📊 1 ⚡ Powered by xgo.ing

查看原推