全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月2日

00:27

00:27

rohanpaul_ai@rohanpaul_ai

哈德斯菲尔德大学发布了一份178页的调查报告《生成式AI基础小书》，旨在帮助读者复习数学和生成式AI的基础知识。该书覆盖了从线性代数、概率论到生成模型、Transformer架构等核心主题，适合AI初学者或需要系统梳理知识体系的研究者。这份资源以通俗易懂的方式呈现，降低了入门门槛，是自学或教学的有益补充。

论文生成式AI 数学基础入门指南哈德斯菲尔德大学学习资源

推荐理由：想系统补数学和AI基础但怕啃论文的读者有福了——这份178页的指南把生成式AI的核心概念讲得明明白白，做AI入门或教学设计的团队可以直接拿来当教材。

5月17日

10:20

10:20

berryxia@berryxia

菲尔兹奖得主、数学家陶哲轩在访谈中指出，当前大模型背后的数学原理其实非常简单，仅涉及线性代数、矩阵乘法和微积分，本科生就能完全掌握。然而，真正令人困惑的是模型行为不可预测：它们在某些任务上表现惊人，在另一些任务上却突然翻车，且无法提前预判。陶哲轩认为，核心原因在于现实世界的自然语言数据处于“部分有序、部分随机”的中间地带，而数学界对此区域的理论还很薄弱。这一“简单机制 vs 不可预测行为”的矛盾，是当前AI最核心的谜题。

AI模型 LLM 数学基础陶哲轩模型行为不可预测性

推荐理由：陶哲轩把LLM的底层数学和核心矛盾说透了，做AI研究或对模型能力边界好奇的人看完会恍然大悟，建议点开原文感受顶级数学家的洞察。

09:37

09:37

rohanpaul_ai@rohanpaul_ai

精选

著名数学家陶哲轩指出，当前大语言模型（LLM）的训练和运行主要依赖线性代数、矩阵乘法和微积分，这些是本科生就能掌握的数学工具。然而，真正令人困惑的是为什么这些模型在某些任务上表现出色，而在其他任务上却失败，且无法提前预测。他认为，自然文本介于完全随机和完全结构化之间，而数学对中间状态的理解非常薄弱，类似于物理学在原子和连续介质之间的介观尺度面临的挑战。因此，尽管我们能描述LLM的机制，但无法解释能力跃迁或给出可靠的任务级预测。

论文 LLM 数学基础可解释性陶哲轩模型行为

推荐理由：陶哲轩点出了AI领域最核心的认知盲区——我们能用简单数学造出强大模型，却无法解释其行为，做AI研究或应用的开发者看完会重新思考“理解”的含义。