10:20berryxia@berryxia菲尔兹奖得主、数学家陶哲轩在访谈中指出,当前大模型背后的数学原理其实非常简单,仅涉及线性代数、矩阵乘法和微积分,本科生就能完全掌握。然而,真正令人困惑的是模型行为不可预测:它们在某些任务上表现惊人,在另一些任务上却突然翻车,且无法提前预判。陶哲轩认为,核心原因在于现实世界的自然语言数据处于“部分有序、部分随机”的中间地带,而数学界对此区域的理论还很薄弱。这一“简单机制 vs 不可预测行为”的矛盾,是当前AI最核心的谜题。AI模型LLM数学基础陶哲轩模型行为不可预测性推荐理由:陶哲轩把LLM的底层数学和核心矛盾说透了,做AI研究或对模型能力边界好奇的人看完会恍然大悟,建议点开原文感受顶级数学家的洞察。原文