AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 657 条中筛出 46 条
全部模型产品行业论文技巧
标签:参数高效微调×
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月9日
12:36
12:36arXiv cs.LG@Alexander Chulzhanov, Soeren Eberhardt, Arjun Mukherjee
精选
该研究针对数字低资源土著语言的神经机器翻译(NMT)数据极度稀缺问题,提出了一种无需抓取目标语言平行文本的数据合成方法。以Q'eqchi'玛雅语为例,研究者将社区词典转化为大规模合成语料,并采用LoRA适配器对mT5-base模型进行参数高效微调(PEFT)。域内评估显示模型能有效学习复杂黏着形态和VOS语序(BLEU 42.02),但面对自然语言时存在结构-语义鸿沟(BLEU 0.59),模型过度拟合合成模板的结构约束。消融实验表明多任务学习导致负迁移,LoRA适配器参数容量有限,辅助任务与主任务竞争。最终结论是合成引导是高效的结构入门,但需要真实数据进行课程学习以完善语义。
论文低资源NMT数据合成参数高效微调LoRAQ'eqchi'玛雅语

推荐理由:低资源语言NMT研究者终于有了一个不依赖网络爬虫的可行方案——用社区词典合成数据+LoRA微调就能启动翻译模型,做濒危语言数字化的团队值得关注。
原文
6月5日
13:22
13:22arXiv cs.LG@Marius Dragoi, Ioana Pintilie, Alexandra Dragomir, Antonio Barbalau, Florin Brad
精选
TailLoR 是一种基于谱分解的参数高效微调方法,专为持续学习设计。它利用预训练权重的奇异基 U 和 V 作为固定参考框架,学习对奇异值矩阵的低秩更新。通过软谱惩罚抑制与主导奇异方向对齐的更新,减少干扰,同时将细粒度适应引导到高度灵活的长尾谱坐标中。该方法在持续学习场景中有效平衡了旧知识保留与新任务适应。
论文持续学习参数高效微调谱分解低秩更新TailLoR

推荐理由:持续学习是让模型不断吸收新知识而不遗忘旧知识的关键技术,做模型微调或增量学习的开发者可以关注 TailLoR 如何用谱分解优雅解决灾难性遗忘问题。
原文
6月1日
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
5月25日
11:19
11:19arXiv cs.AI@Ming Yang, Tao Yu, Feng Li, Hua Chen
精选
全身跟踪(WBT)模型是人形机器人模仿多样动作的关键基础,但从头训练需要大量数据和计算资源。Any2Any 提出一种新范式,通过运动学对齐和轻量级参数高效微调(PEFT),将预训练的 WBT 模型快速迁移到新的人形机器人本体上。实验表明,仅需 1% 的计算和数据量,Any2Any 就能将基于 Unitree G1 预训练的 Sonic 模型成功迁移到 LimX Oli 和 LimX Luna 上,性能与从头训练相当甚至更优。这为快速部署人形机器人全身控制提供了可扩展的路径。
论文人形机器人全身跟踪迁移学习参数高效微调Any2Any

推荐理由:人形机器人开发者终于有了低成本复用预训练模型的方法——Any2Any 用 1% 的数据和算力就能迁移全身跟踪能力,做机器人部署的团队可以直接参考。
原文
5月21日
10:22
10:22arXiv cs.LG@Yongkang Liu, Xing Li, Mengjie Zhao, Shanru Zhang, Zijing Wang, Qian Li, Shi Feng, Feiliang Ren, Daling Wang, Hinrich Schütze
精选
SMoA(频谱调制适配器)是一种新的参数高效微调方法,旨在解决LoRA在低秩设置下表达能力受限的问题。理论表明,LoRA微调仅能捕获预训练权重矩阵的前r个奇异值,而增大秩虽能提升性能但会增加计算成本。SMoA通过将层划分为多个对齐的频谱块,并在每个对角块内应用Hadamard调制的低秩分支,从而在更小的参数预算下覆盖更广的预训练频谱方向。实验结果显示,在低预算设置下,SMoA在多项任务上的平均性能优于LoRA及其他同类基线方法。该方法为资源受限场景下的模型微调提供了更高效的解决方案。
论文参数高效微调LoRA频谱调制低秩适配SMoA

推荐理由:做模型微调的开发者如果受限于LoRA的低秩瓶颈,SMoA提供了一种在更少参数下覆盖更广频谱方向的新思路,值得在资源敏感任务中尝试。
原文
5月15日
09:54
09:54arXiv cs.AI@Paolo Mandica, Michał Brzozowski, Zuzanna Dubanowska, Neo Christopher Chung
精选
GPart 提出一种全新的参数高效微调方法,通过全局等距分区矩阵直接将低维可训练向量映射到模型全权重空间,完全去除了低秩瓶颈。与 LoRA 等现有方法不同,GPart 保持了映射的距离保持性(等距性),避免了优化景观扭曲问题。该方法仅需一个随机投影、一个超参数(维度 d)和 d+1 个存储值(向量加随机种子),极其简洁高效。实验表明,GPart 在自然语言理解、计算机视觉和数学推理任务上达到或超越现有 PEFT 方法的性能。这项工作为参数高效微调提供了更优雅的理论基础和实践路径。
论文参数高效微调LoRA等距映射GPart大模型

推荐理由:GPart 用极简设计解决了 LoRA 等方法的优化扭曲问题,做模型微调的研究者和工程师可以直接参考其理论框架,尤其适合追求极致参数效率的团队。
原文
精选全部日报登录