大模型“叫不出人名”背后：低频token退化与FaceMind的SLoW方法

精选理由

做AI应用或数据工程的团队，这篇把低频token退化讲透了——FaceMind的SLoW方法直接给出了解决方案，值得点开看看怎么从模型规律里建立产品差异。

AI 摘要

本文揭示大模型在生成低频词汇（如冷门人名）时表现不佳，并非小bug，而是底层偏好高频表达所致。作者串联了“马嘉祺”事件、Anthropic tokenizer调整以及FaceMind团队的SLoW和Adam's Law研究，指出频率是大模型数据工程的关键变量。FaceMind早于大众关注低频token退化问题，将其写成论文并落地产品场景。文章还解释了为何prompt并非越多越好，以及高频同义表达更稳定。最后介绍了FaceMind的动态弹幕产品，暗示其可能应用于世界杯等场景。

AI 翻译 · 中文

岚叔一个人名叫不出来，背后不是小 bug。它暴露的是大模型的底层偏好：更熟悉高频表达，更容易忽略低频词。这篇文章把“马嘉祺”事件、Anthropic tokenizer 调整，以及 FaceMind 陆弘远团队的 SLoW 和 Adam’s Law 串在一起，讲清楚一件事：频率，可能是大模型数据工程里的关键变量。 FaceMind 早在大众关注低频 token 之前，就把问题写成论文、做成方法，并进一步落到产品场景。读完这篇，你会理…

berryxia05-29 05:08原文
Claude05-28 17:07原文
Simon Willison’s Weblog05-28 23:59原文
IT之家05-27 06:29原文
Alex Albert05-28 16:59原文
Mike Krieger05-28 17:10原文
Jerry Liu05-28 17:17原文
lmarena.ai05-28 17:30原文
宝玉05-28 17:30原文
AI SDK05-28 17:40原文

查看原推