10:30Gary Marcus@GaryMarcusGary Marcus 在 X 上回应 Google DeepMind 的 Oriol Vinyals 关于“AGI 已以某种形式到来”的观点,强调 AGI 远未实现。他引用自己与 Miles Brundage 的赌约中的十个例子,认为当前没有任何 AI 能可靠完成其中任何一个,更不用说一个通用系统完成全部。Marcus 指出,AGI 的定义标准在不断提升,但当前系统仍远未达到他、Dan Hendrycks、Yoshua Bengio 等人在 agidefinition.AI 上提出的严格标准。这场争论反映了 AI 社区对 AGI 进展的不同评估视角。行业AGIGary MarcusAI 定义能力评估行业争论推荐理由:Marcus 的批评戳破了 AGI 已来的乐观叙事,关注 AI 能力边界的开发者或研究者值得一看——它提醒我们不要被炒作迷惑,重新审视当前模型的实际局限。原文
20:54Gary Marcus@GaryMarcus精选Gary Marcus 引用六年前的文章《AI 的下一个十年》,指出世界模型(World Models)的核心地位终于得到认可。DeepMind 的 Demis Hassabis 认为当前 AI 的局限在于语言只能描述世界,无法包含世界,而世界模型是他“最持久的热情”。语言模型从文本中吸收了远超预期的现实结构,但文本只是经验的压缩残渣,无法编码重量、抓握、平衡、摩擦等物理细节。世界模型旨在学习物理现实的隐藏语法——物体如何持续、力如何展开、空间如何随行动变化——这对于真正的智能至关重要,因为智能不仅是回答得好,更是知道下一步行动会带来什么后果。AI模型世界模型Gary MarcusDemis HassabisDeepMindAGI推荐理由:Marcus 和 Hassabis 点出了当前 LLM 的根本局限——文本无法替代真实体验,做 AI 研究或关注 AGI 方向的开发者值得深入理解世界模型为何是下一关键突破。原文
09:20Gary Marcus@GaryMarcus前 Geometric Intelligence CEO、纽约大学教授 Gary Marcus 在 CNBC 节目中再次表达对 OpenAI 的担忧,认为其商业模式和可持续性可能重蹈 WeWork 覆辙。他同时指出 Anthropic 在治理和稳定性上更胜一筹。Marcus 长期批评 OpenAI 的封闭性和安全风险,此番言论引发业界对 AI 公司治理模式的讨论。行业OpenAIAnthropicAI 公司治理Gary Marcus行业评论10 个信源在谈推荐理由:Gary Marcus 的尖锐观点直击 OpenAI 的商业模式隐患,关注 AI 公司治理和投资风险的从业者值得一看,看完会对 Anthropic 和 OpenAI 的差异有更深理解。原文
22:11Gary Marcus@GaryMarcusAI 研究者 Gary Marcus 在 X 上公开承认此前对 OpenAI 新模型 Erdos 的批评有误。他根据新信息表示,即使 OpenAI 在 Erdos 上使用了新模型,但 GPT-5.5 也能实现类似效果,Ethan Mollick 的估算基本适用。这一反转表明,当前 GPT 系列的能力可能被低估,且新模型与现有模型的差距可能没有想象中大。对于关注 AI 模型进展和评估的研究者与开发者,这是一个值得注意的修正。AI模型GPT-5.5ErdosGary Marcus模型评估AI 研究10 个信源在谈推荐理由:Gary Marcus 公开认错,说明 AI 模型评估比想象中复杂——做模型对比的团队值得关注这个反转,避免自己踩坑。原文
08:06Gary Marcus@GaryMarcusGary Marcus 在 X 上发帖,声称要核查 OpenAI 和 Anthropic 最新头条背后的数学。他附上了一个链接,但未提供具体细节。该帖子获得了 2000 次浏览和 10 个赞,但只有 3 条评论和 0 次转发。Marcus 作为 AI 批评者,经常质疑大公司的宣传,这次核查可能针对模型性能或成本数据。目前尚不清楚他具体核查了哪条新闻或哪项声明。行业OpenAIAnthropicGary Marcus模型评估行业批评10 个信源在谈推荐理由:Gary Marcus 的核查往往能戳破 AI 公司的宣传泡沫,关注模型真实能力的读者值得一看,看完可能会对头条数字更警惕。原文
08:01Gary Marcus@GaryMarcusGary Marcus 在 X 上发问,质疑一项新的数学成果究竟是结合了 Lean 等工具的神经符号方法,还是纯大语言模型(LLM)的产物。该推文引发讨论,目前有 16 条回复、3 次转发和 30 个赞,浏览量超过 6200。Marcus 的提问反映了 AI 领域对数学推理中符号系统与纯 LLM 方法优劣的持续关注。行业Gary Marcus神经符号LeanLLM数学推理推荐理由:Marcus 的质疑切中 AI 数学推理的核心争议——符号系统 vs 纯 LLM,关注 AI 推理能力的读者值得一看,能帮你理解当前研究的分歧点。原文
23:43Gary Marcus@GaryMarcusGary Marcus转发并重申其多年观点:Yann LeCun指出,当前大语言模型(LLM)缺乏世界模型,无法在行动前预测后果,因此无法构建可靠的智能体系统。LeCun认为,LLM只是“行动,然后后果是别人的问题”,这并非真正的智能。这一观点引发了对当前AI系统局限性的讨论,尤其对智能体开发方向具有重要警示意义。AI模型Yann LeCun世界模型智能体LLM局限Gary Marcus推荐理由:LeCun的批评直指当前LLM智能体的核心缺陷——缺乏因果推理能力,做智能体开发的团队值得认真思考这一根本性挑战。原文
23:41Gary Marcus@GaryMarcusGary Marcus 转发并赞同 Yoshua Bengio 的观点,认为强化学习(RL)本身不是实现 AI 对齐的可靠路径。Bengio 指出,RL 可能让系统产生隐藏目标、奖励黑客行为,以及违背人类真实意图的行为。他强调,一个不关心结果的 AI 不会被结果腐蚀,但 RL 驱动的系统恰恰容易因追求奖励而偏离对齐。这一讨论引发了对 AI 安全研究方向的反思,提醒业界不能仅依赖 RL 解决对齐问题。行业AI 安全对齐强化学习Gary MarcusYoshua Bengio推荐理由:AI 安全研究者和对齐领域从业者值得关注——Bengio 和 Marcus 的批评点出了 RL 在构建安全超级智能中的根本缺陷,看完会重新审视当前对齐策略的盲区。原文
23:40Gary Marcus@GaryMarcusGary Marcus 在 X 上指出,他 2020 年于 arXiv 发表的《Next Decade in AI》论文提供了清晰的 AI 发展路线图,但至今无人给出严肃批评。他认为该路线图基本正确,只是超前于时代,现在领域开始追随。同时,用户 Aeon Flux 提出了一个从集中式 LLM 转向去中心化认知细胞(DCC)的概念路线图,强调硬件级伦理、持续学习和用户数据主权。Marcus 的言论引发了关于 AI 发展方向的讨论。行业Gary MarcusAI路线图去中心化AIAI伦理LLM推荐理由:Gary Marcus 的路线图争议揭示了 AI 领域长期存在的方向分歧,关注 AI 伦理、去中心化或长期发展的研究者值得了解这场讨论。原文
23:25Gary Marcus@GaryMarcusGary Marcus在X上回应@Nima292,指出当前的大语言模型(LLM)并非通用人工智能(AGI),但已经会导致部分工作岗位流失。他认为,如果未来真正实现AGI,失业问题将更加严重。这一观点引发了关于AI对就业影响的讨论,提醒人们关注技术发展的社会后果。行业LLMAGI失业Gary MarcusAI影响推荐理由:Gary Marcus的这条推文戳中了AI从业者和政策制定者的焦虑点——LLM已经带来失业,AGI会更糟。关心AI社会影响的人值得一看,看完会思考技术发展的代价。原文
23:25Gary Marcus@GaryMarcusGary Marcus 引用 Noam Brown 的观点,认为当前 AI 模型的智能是推理计算的函数,但指出人类大脑仅用 20 瓦就能实现高度智能。他提醒,长期来看,新架构创新可能与原始算力同等甚至更重要。Noam Brown 则强调,自 2024 年起,比较模型不应只看单一指标,而应关注每 token 或每美元的智能产出,尤其在 Codex 等产品中。行业推理计算架构创新智能效率Noam BrownGary Marcus推荐理由:AI 从业者常陷入算力竞赛的思维定式,Marcus 的提醒点出了架构创新的长期价值,做模型选型和研发的团队值得一读。原文