精选理由
剪掉90%参数还不丢演技
Persona-Pruner 是一种通过隔离特定角色子网络来剪枝 LLM 的框架,在 RoleBench 上使性能下降比最强基线减少 93.8%(LLM-as-a-judge 分数),同时保持通用能力。实验表明,相比现有剪枝技术,它能更有效地保留给定角色的对话风格与知识。该方法无需全参数模型即可支持众多非玩家角色(NPC)的实时交互。
AI 翻译 · 中文
Persona-Pruner 是一种通过隔离特定角色子网络来剪枝 LLM 的框架,在 RoleBench 上使性能下降比最强基线减少 93.8%(LLM-as-a-judge 分数),同时保持通用能力。实验表明,相比现有剪枝技术,它能更有效地保留给定角色的对话风格与知识。该方法无需全参数模型即可支持众多非玩家角色(NPC)的实时交互。
Language Models (LMs) have shown remarkable potential as role-playing chatbots, delivering consistent, stylized interactions when given a specification of a character or user persona. However, applying these capabilities…