全部 AI 动态 · AI 热点

5月24日

10:30

Gary Marcus@GaryMarcus

Gary Marcus 在 X 上回应 Google DeepMind 的 Oriol Vinyals 关于“AGI 已以某种形式到来”的观点，强调 AGI 远未实现。他引用自己与 Miles Brundage 的赌约中的十个例子，认为当前没有任何 AI 能可靠完成其中任何一个，更不用说一个通用系统完成全部。Marcus 指出，AGI 的定义标准在不断提升，但当前系统仍远未达到他、Dan Hendrycks、Yoshua Bengio 等人在 agidefinition.AI 上提出的严格标准。这场争论反映了 AI 社区对 AGI 进展的不同评估视角。

行业 AGI Gary Marcus AI 定义能力评估行业争论

推荐理由：Marcus 的批评戳破了 AGI 已来的乐观叙事，关注 AI 能力边界的开发者或研究者值得一看——它提醒我们不要被炒作迷惑，重新审视当前模型的实际局限。

原文

5月23日

20:54

Gary Marcus@GaryMarcus

精选

Gary Marcus 引用六年前的文章《AI 的下一个十年》，指出世界模型（World Models）的核心地位终于得到认可。DeepMind 的 Demis Hassabis 认为当前 AI 的局限在于语言只能描述世界，无法包含世界，而世界模型是他“最持久的热情”。语言模型从文本中吸收了远超预期的现实结构，但文本只是经验的压缩残渣，无法编码重量、抓握、平衡、摩擦等物理细节。世界模型旨在学习物理现实的隐藏语法——物体如何持续、力如何展开、空间如何随行动变化——这对于真正的智能至关重要，因为智能不仅是回答得好，更是知道下一步行动会带来什么后果。

AI模型世界模型 Gary Marcus Demis Hassabis DeepMind AGI

推荐理由：Marcus 和 Hassabis 点出了当前 LLM 的根本局限——文本无法替代真实体验，做 AI 研究或关注 AGI 方向的开发者值得深入理解世界模型为何是下一关键突破。

原文

09:20

Gary Marcus@GaryMarcus

前 Geometric Intelligence CEO、纽约大学教授 Gary Marcus 在 CNBC 节目中再次表达对 OpenAI 的担忧，认为其商业模式和可持续性可能重蹈 WeWork 覆辙。他同时指出 Anthropic 在治理和稳定性上更胜一筹。Marcus 长期批评 OpenAI 的封闭性和安全风险，此番言论引发业界对 AI 公司治理模式的讨论。

行业 OpenAI Anthropic AI 公司治理 Gary Marcus 行业评论

推荐理由：Gary Marcus 的尖锐观点直击 OpenAI 的商业模式隐患，关注 AI 公司治理和投资风险的从业者值得一看，看完会对 Anthropic 和 OpenAI 的差异有更深理解。

原文

5月22日

22:11

Gary Marcus@GaryMarcus

AI 研究者 Gary Marcus 在 X 上公开承认此前对 OpenAI 新模型 Erdos 的批评有误。他根据新信息表示，即使 OpenAI 在 Erdos 上使用了新模型，但 GPT-5.5 也能实现类似效果，Ethan Mollick 的估算基本适用。这一反转表明，当前 GPT 系列的能力可能被低估，且新模型与现有模型的差距可能没有想象中大。对于关注 AI 模型进展和评估的研究者与开发者，这是一个值得注意的修正。

AI模型 GPT-5.5 Erdos Gary Marcus 模型评估 AI 研究

推荐理由：Gary Marcus 公开认错，说明 AI 模型评估比想象中复杂——做模型对比的团队值得关注这个反转，避免自己踩坑。

原文

08:06

Gary Marcus@GaryMarcus

Gary Marcus 在 X 上发帖，声称要核查 OpenAI 和 Anthropic 最新头条背后的数学。他附上了一个链接，但未提供具体细节。该帖子获得了 2000 次浏览和 10 个赞，但只有 3 条评论和 0 次转发。Marcus 作为 AI 批评者，经常质疑大公司的宣传，这次核查可能针对模型性能或成本数据。目前尚不清楚他具体核查了哪条新闻或哪项声明。

行业 OpenAI Anthropic Gary Marcus 模型评估行业批评

推荐理由：Gary Marcus 的核查往往能戳破 AI 公司的宣传泡沫，关注模型真实能力的读者值得一看，看完可能会对头条数字更警惕。

原文

5月21日

08:01

Gary Marcus@GaryMarcus

Gary Marcus 在 X 上发问，质疑一项新的数学成果究竟是结合了 Lean 等工具的神经符号方法，还是纯大语言模型（LLM）的产物。该推文引发讨论，目前有 16 条回复、3 次转发和 30 个赞，浏览量超过 6200。Marcus 的提问反映了 AI 领域对数学推理中符号系统与纯 LLM 方法优劣的持续关注。

行业 Gary Marcus 神经符号 Lean LLM 数学推理

推荐理由：Marcus 的质疑切中 AI 数学推理的核心争议——符号系统 vs 纯 LLM，关注 AI 推理能力的读者值得一看，能帮你理解当前研究的分歧点。

原文

5月16日

23:43

Gary Marcus@GaryMarcus

Gary Marcus转发并重申其多年观点：Yann LeCun指出，当前大语言模型（LLM）缺乏世界模型，无法在行动前预测后果，因此无法构建可靠的智能体系统。LeCun认为，LLM只是“行动，然后后果是别人的问题”，这并非真正的智能。这一观点引发了对当前AI系统局限性的讨论，尤其对智能体开发方向具有重要警示意义。

AI模型 Yann LeCun 世界模型智能体 LLM局限 Gary Marcus

推荐理由：LeCun的批评直指当前LLM智能体的核心缺陷——缺乏因果推理能力，做智能体开发的团队值得认真思考这一根本性挑战。

原文

23:41

Gary Marcus@GaryMarcus

Gary Marcus 转发并赞同 Yoshua Bengio 的观点，认为强化学习（RL）本身不是实现 AI 对齐的可靠路径。Bengio 指出，RL 可能让系统产生隐藏目标、奖励黑客行为，以及违背人类真实意图的行为。他强调，一个不关心结果的 AI 不会被结果腐蚀，但 RL 驱动的系统恰恰容易因追求奖励而偏离对齐。这一讨论引发了对 AI 安全研究方向的反思，提醒业界不能仅依赖 RL 解决对齐问题。

行业 AI 安全对齐强化学习 Gary Marcus Yoshua Bengio

推荐理由：AI 安全研究者和对齐领域从业者值得关注——Bengio 和 Marcus 的批评点出了 RL 在构建安全超级智能中的根本缺陷，看完会重新审视当前对齐策略的盲区。

原文

23:40

Gary Marcus@GaryMarcus

Gary Marcus 在 X 上指出，他 2020 年于 arXiv 发表的《Next Decade in AI》论文提供了清晰的 AI 发展路线图，但至今无人给出严肃批评。他认为该路线图基本正确，只是超前于时代，现在领域开始追随。同时，用户 Aeon Flux 提出了一个从集中式 LLM 转向去中心化认知细胞（DCC）的概念路线图，强调硬件级伦理、持续学习和用户数据主权。Marcus 的言论引发了关于 AI 发展方向的讨论。

行业 Gary Marcus AI路线图去中心化AI AI伦理 LLM

推荐理由：Gary Marcus 的路线图争议揭示了 AI 领域长期存在的方向分歧，关注 AI 伦理、去中心化或长期发展的研究者值得了解这场讨论。

原文

23:25

Gary Marcus@GaryMarcus

Gary Marcus在X上回应@Nima292，指出当前的大语言模型（LLM）并非通用人工智能（AGI），但已经会导致部分工作岗位流失。他认为，如果未来真正实现AGI，失业问题将更加严重。这一观点引发了关于AI对就业影响的讨论，提醒人们关注技术发展的社会后果。

行业 LLM AGI 失业 Gary Marcus AI影响

推荐理由：Gary Marcus的这条推文戳中了AI从业者和政策制定者的焦虑点——LLM已经带来失业，AGI会更糟。关心AI社会影响的人值得一看，看完会思考技术发展的代价。

原文

23:25

Gary Marcus@GaryMarcus

Gary Marcus 引用 Noam Brown 的观点，认为当前 AI 模型的智能是推理计算的函数，但指出人类大脑仅用 20 瓦就能实现高度智能。他提醒，长期来看，新架构创新可能与原始算力同等甚至更重要。Noam Brown 则强调，自 2024 年起，比较模型不应只看单一指标，而应关注每 token 或每美元的智能产出，尤其在 Codex 等产品中。

行业推理计算架构创新智能效率 Noam Brown Gary Marcus

推荐理由：AI 从业者常陷入算力竞赛的思维定式，Marcus 的提醒点出了架构创新的长期价值，做模型选型和研发的团队值得一读。

原文