AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
AI 自动挑选的高价值内容
全部模型产品行业论文技巧
标签:陶哲轩×
5月17日
09:37
rohanpaul_ai@rohanpaul_ai
精选63
著名数学家陶哲轩指出,当前大语言模型(LLM)的训练和运行主要依赖线性代数、矩阵乘法和微积分,这些是本科生就能掌握的数学工具。然而,真正令人困惑的是为什么这些模型在某些任务上表现出色,而在其他任务上却失败,且无法提前预测。他认为,自然文本介于完全随机和完全结构化之间,而数学对中间状态的理解非常薄弱,类似于物理学在原子和连续介质之间的介观尺度面临的挑战。因此,尽管我们能描述LLM的机制,但无法解释能力跃迁或给出可靠的任务级预测。
论文LLM数学基础可解释性陶哲轩模型行为

推荐理由:陶哲轩点出了AI领域最核心的认知盲区——我们能用简单数学造出强大模型,却无法解释其行为,做AI研究或应用的开发者看完会重新思考“理解”的含义。