LLM 统一描述多维核性质：DeepSeek-R1-1.5B 微调实现高精度

精选理由

核物理研究者终于有了一个统一的多任务预测工具——用 LLM 微调替代传统多模型方案，精度提升显著且效率更高，做核数据分析和理论验证的团队值得关注。

AI 摘要

研究人员提出了一种基于大语言模型的多任务学习框架，用于统一描述多个核物理可观测量。通过低秩适配（LoRA）微调预训练的 DeepSeek-R1-1.5B 模型，在保留通用参数的同时引入轻量适配器。该模型在因果语言建模范式下，对实验值与理论值的偏差进行自回归训练，在电荷半径、质量、结合能、分离能和衰变能等七个可观测量的预测上实现了显著精度提升，训练损失在所有任务中下降超过 98%。这项工作展示了基于 LLM 的框架通过结构化先验嵌入，为核物理基础属性的多任务回归提供了一种高效且共享的方法。

AI 翻译 · 中文

arXiv: DeepSeekA prior-informed large language model (LLM) driven multi-task learning framework is proposed for the unified description of multiple nuclear observables. By fine-tuning the pre-trained DeepSeek-R1-1.5B model with Low-Ran…

阅读原文