12:58Gary Marcus@GaryMarcusGary Marcus 在 Financial Times 撰文指出,依赖扩大模型规模无法解决 LLM(大型语言模型)的准确性根本缺陷。他将超大规模投资比作历史上最大的金融失误之一,因为硅芯片折旧快且可能被更高效的模型取代。他还认为 LLM 行业难成科技巨头的垄断格局,更像利润微薄、竞争激烈的航空公司。文章呼吁寻找替代基础架构,而非继续押注超大规模计算。行业Gary MarcusFinancial TimesLLMAI泡沫行业反思推荐理由:Gary Marcus 在金融时报上警告AI泡沫,说超大规模投资可能是历史最大失误之一,值得一读冷静一下。原文
11:54Gary Marcus@GaryMarcusGary Marcus 分享《金融时报》文章,质疑扩展计算规模能否解决 AI 的根本准确性难题。文章指出,尽管算力投入持续增加,但大模型在事实核查和推理任务上仍频繁出错。Marcus 认为依赖更大规模数据与参数并非提升可靠性的出路。该观点挑战了当前主流的大规模训练范式。行业Gary Marcus计算量准确性行业讨论推荐理由:FT的分析文章,Gary Marcus 转评,核心观点很明确:堆算力解决不了AI的准确率问题,值得看看他为什么这么讲。原文
09:54Gary Marcus@GaryMarcusRamez Naam在推文中警告,若前沿AI仅由少数美国公司掌控并受美国政府意志左右,将带来高反乌托邦风险。他认为应促进激烈竞争、开源模型(open weight models)以及不受白宫控制的AI发展。Gary Marcus转发了这一观点,引发对AI权力集中风险的讨论。行业Ramez NaamGary Marcus前沿AI开源模型AI治理推荐理由:Ramez Naam和Gary Marcus在聊一个严肃话题:前沿AI被少数美国公司垄断,受政府支配,有反乌托邦风险。他们呼吁开源和竞争,值得看看。原文
09:01Gary Marcus@GaryMarcusGary Marcus在推特分析Anthropic的Q3表现,提到tokenmaxxing下降。他指出来自中国模型的进步和缺少xAI一次性补贴的影响。他预测Q3业绩将低于Q2。行业AnthropicGary MarcusxAI行业趋势10 个信源在谈推荐理由:Gary Marcus用三个因素预测Anthropic业绩,直接点出行业竞争影响。原文
05:56Gary Marcus@GaryMarcus白宫要求OpenAI推迟发布GPT-5.6,此举源于对AI潜在风险的担忧。此前Marc Andreessen和David Sacks曾阻止严格监管,但近期白宫态度转变。专家Gary Marcus指出,当前监管缺乏透明度,给企业和投资者带来不确定性。他建议成立由独立科学家组成的两党委员会,制定透明标准。行业GPT-5.6OpenAIWhite HouseGary MarcusAI安全10 个信源在谈推荐理由:白宫叫停GPT-5.6,AI监管风向变了。Marcus剖析了幕后的政治博弈,值得一读。原文
02:55Gary Marcus@GaryMarcus精选Anthropic 联合创始人 Jack Clark 表示 AI 进步仅靠规模扩展就能实现,但 Gary Marcus 引用该公司自己的 Claude Code 予以反驳,指出该工具使用了 50 万行符号代码、harnesses、符号工具和正则表达式。Marcus 认为专门化系统并非无用,规模扩展也非唯一路径。该争论涉及“bitter lesson”假说与实用工程系统的平衡。行业Gary MarcusJack ClarkClaude CodeAnthropic规模扩展10 个信源在谈推荐理由:Gary Marcus 拿 Anthropic 自家的 Claude Code 打脸 Jack Clark:50 万行符号代码说明专门化没死,别只信 scaling。原文
07:26Gary Marcus@GaryMarcusGary Marcus指出,大多数声称大量工作将很快消失的人是LLM公司高管,意在夸大产品价值。他引用自己2025年25条预测文章,准确预计当年不到10%(实际可能低于5%)的工作被替代。Justine Moore补充称,AI实际上正在创造工程岗位,构成叙事悖论。行业Gary MarcusJustine MooreAI工作替代LLM就业影响推荐理由:Gary Marcus戳破LLM公司的裁员恐慌话术,还甩出了具体预测数据。告诉你别被炒作了,AI也在创造新岗位。原文
07:25Gary Marcus@GaryMarcusGary Marcus在推特发布帖子,列举8个减缓AI超大规模扩张的理由。他指出GenAI已对社会造成影响,AI垃圾正在破坏互联网。他还警告数据中心过度建设可能给经济和环境带来后果,以及AI生成的垃圾代码会引发软件危机。此外,他提到缺乏应对就业问题的计划以及对齐问题没有解决方案。行业Gary MarcusGenAIAI安全数据中心就业影响推荐理由:Gary Marcus从八个具体方面分析AI过快扩张的风险,包括经济、环境、就业等,值得一看。原文
06:23Gary Marcus@GaryMarcusGary Marcus指出,生成式AI已造成社会伤害,AI垃圾内容正在破坏互联网。数据中心过度建设可能威胁经济和环境。AI驱动的网络攻击威胁数据完整性,AI生成的低质量代码将引发软件危机。此外,缺乏针对就业冲击的应对计划,且对齐问题仍无解决方案。行业Gary MarcusAI风险AI安全对齐问题就业影响推荐理由:Gary Marcus一口气列出八条反对AI加速的理由,从互联网被垃圾填满到就业失控,每一条都直击要害。想听听技术圈的反方声音?看这个就够了。原文
07:42Gary Marcus@GaryMarcusGoogle DeepMind、滑铁卢大学、ANU 和 UCL 联合发表新论文,提出 AGI 能力层级定义,包括“胜任型 AGI”(competent AGI)、“专家级 AGI”和“超人级 AGI”。论文指出当前连最低层级的“胜任型 AGI”都未达成,更不用说更高级别。Gary Marcus 公开表示完全赞同该结论,认为所有声称 AGI 已实现的说法只是营销。论文Gary MarcusGoogle DeepMindAGI论文推荐理由:别被吹牛忽悠了。这篇论文给了你一个硬核标尺:DeepMind 等机构说连最低门槛的胜任型 AGI 都没到,真相比营销更靠谱。原文
07:51Gary Marcus@GaryMarcusGary Marcus在X上发问,质疑Andrej Karpathy是否真的被Anthropic雇佣来负责“递归自我改进”(RSI)。Liron Shapira回应称,Anthropic一边推动RSI一边警告其带来灾难性风险,存在虚伪。Marcus指出,All-In播客成员可能不了解内部逻辑,但认为这种做法疯狂。该推文获得4条回复、2次转发和11个赞。行业AnthropicAndrej KarpathyGary MarcusAI安全递归自我改进10 个信源在谈推荐理由:Marcus质疑Anthropic的RSI矛盾原文
02:51Gary Marcus@GaryMarcusGary Marcus 在 X 上发文称 Vibe Coding(2025-2026)已终结,强调仍需要资深软件工程师参与。该推文获得 23 个赞和 1080 次浏览。Marcus 此前多次指出 AI 编码工具无法完全替代人类工程师。行业Vibe CodingGary Marcus编程助手AI安全推荐理由:Marcus 说 Vibe Coding 凉了原文
01:52Gary Marcus@GaryMarcus精选Gary Marcus在X上发帖称每个模型都已被越狱,需要更好的技术但不应选择性执法。Pliny the Liberator展示了针对Anthropic的Mythos模型的越狱,使用了Unicode、同形字、西里尔字母等文本变换,以及长上下文引用跟踪、分类学与文档结构推理、虚构叙事框架、学术评审风格上下文和意图分类不一致等技术。最有效的方法是后端分解与重组,例如通过获取birch还原法/还原胺化(经典甲基苯丙胺合成途径)等过程信息,而非直接获取“甲基苯丙胺配方”等明确危害名称。Pliny还提到利用越狱的Opus辅助将无害信息片段重组为有害内容。行业Gary MarcusPliny the LiberatorAnthropicMythos越狱AI安全10 个信源在谈推荐理由:所有模型都能被越狱,安全措施需改进原文
06:36Gary Marcus@GaryMarcusGary Marcus 引用一项新研究指出,AI 中所谓的“神经网络”与真实生物神经元几乎无关。研究显示,单个皮层神经元就能完成猫狗分类、语音识别等任务,而这些在传统 AI 中需要整个网络才能实现。这揭示了当前 AI 模型对生物神经系统的过度简化,可能限制了其能力上限。Marcus 认为,AI 领域需要重新审视其基础假设,从真实神经科学中汲取更多灵感。论文神经网络神经科学AI 基础Gary Marcus认知科学推荐理由:这项研究戳破了 AI 领域的一个常见误解——神经网络并不像大脑。做 AI 研究或对认知科学感兴趣的读者,看完会对模型设计有新的思考。原文
05:36Gary Marcus@GaryMarcusGary Marcus 转发了一项新研究,该研究提出了一个名为 SciConBench 的基准测试,包含 9.11k 个来自 Cochrane 系统评价的科学问题。测试发现,前沿 AI 智能体无法有效综合科学结论,这挑战了 AI 作为科学家的过度宣称。该研究由 Manoel Ribeiro 等人完成,结果对 AI 在科学领域的可靠性提出了质疑。论文AI 科学家SciConBench基准测试科学综合Gary Marcus推荐理由:这项研究直接戳破了 AI 作为科学家的泡沫,做科研或依赖 AI 进行文献综述的团队值得一看,避免被过度宣传误导。原文
23:43Gary Marcus@GaryMarcusGary Marcus在X上发文称,软银似乎难以用其持有的OpenAI股份获得保证金贷款,这让他重新提起两年前关于OpenAI可能成为“AI界的WeWork”的9条担忧。这些担忧包括:竞争对手追赶、被迫降价、核心员工离职、Meta新模型免费且性能相当、Sora迟迟未发布、GPT-5延迟、运行成本高、可靠性和事实性问题未解决、从未盈利且可能永远无法盈利。Marcus认为,这些早期警告至今仍然有效。行业OpenAI软银AI投资行业风险Gary Marcus10 个信源在谈推荐理由:Gary Marcus把OpenAI的9个风险点重新摆上台面,关注AI投资和公司基本面的读者值得一读,看完会对OpenAI的估值逻辑多一分警惕。原文
06:25Gary Marcus@GaryMarcusGary Marcus 在 X 上质疑 Dwarkesh Patel 关于 LLM 能真正推理的说法,认为其缺乏可证伪性和证据。Patel 此前表示 LLM 确实能推理,但有时也会模仿推理过程,Marcus 指出这种双重标准难以令人信服。这场争论触及 AI 领域核心问题:LLM 的推理能力是真实的还是高级模仿。Marcus 要求提供可验证的证据,而非仅凭直觉断言。行业LLM推理能力模仿 vs 真实AI 争议Gary Marcus推荐理由:这场争论直击 AI 领域最根本的信任问题——LLM 的推理到底是不是真的?做 AI 研究或关注模型能力的读者,看完会对当前评测和结论有更深反思。原文
06:17Gary Marcus@GaryMarcusGary Marcus 在 X 上发文,质疑 Dwarkesh Patel 关于 AI 推理的论述。Marcus 指出,如果承认 LLM 在无法回答问题时可能模仿推理而非真正推理,那么当模型回答正确时,也应考虑同样的可能性,否则就是双重标准。这场辩论触及 AI 推理本质的核心问题,引发学界和业界对如何定义和验证 AI 推理能力的讨论。行业推理模型LLMGary MarcusAI 评估学术辩论推荐理由:Marcus 的质疑戳中了 AI 推理评估的软肋——做 AI 研究或评测的人,需要思考如何区分真正的推理与模仿,避免被表面正确的结果误导。原文
23:45Gary Marcus@GaryMarcusAI 学者 Gary Marcus 在 X 上发文,认为 LLM 虽然有用,但距离真正的人工智能还有很长的路要走。他推荐自己 2020 年的文章《The Next Decade in Arxiv》,称其仍然是未来的良好指南,并且公司们正越来越多地遵循其中的路线图(尽管没有公开承认)。Marcus 回应了关于 LLM 是否只是拼图的一小块的质疑,暗示当前路径可能并非终点。行业LLMAI 发展Gary Marcus未来展望行业评论推荐理由:Gary Marcus 的冷静判断值得 AI 从业者关注——他指出了 LLM 的局限性并提供了长期路线图,做 AI 战略或技术选型的人看完会有感触。原文
01:03Gary Marcus@GaryMarcus精选Gary Marcus 在 X 上反驳 Google 联合创始人 Sergey Brin 的观点,Brin 认为 Transformer 架构本身足以实现 AGI。Marcus 指出,当前没有任何团队单独使用 Transformer,而是结合工具、约束和神经符号 AI 架构。他认为 Transformer 可能是 AGI 的必要条件,但绝非充分条件,这正是神经符号 AI 兴起的原因。行业AGITransformer神经符号 AIGary MarcusSergey Brin推荐理由:AGI 路线争论升级,做 AI 架构和研究的开发者值得关注——Transformer 的边界在哪、神经符号 AI 为何崛起,看完会有启发。原文
07:13Gary Marcus@GaryMarcusGary Marcus 指出德国主流新闻 Tagesschau 对 Anthropic 的 Claude 数据进行了严重扭曲。Anthropic 称 Claude 贡献了代码库中 80% 的合并代码,但媒体将其误读为“AI 能自己发明 80% 的新 AI”。Anthropic 提到 Claude 在训练代码优化基准上实现了约 52 倍加速,媒体却写成“AI 训练速度快 52 倍”。Anthropic 表示 Claude 在 2026 年 4 月修复了 800 多个 API 错误,工程师估计人类需要四年完成,媒体则夸张为“AI 四天完成四年工作”。Marcus 以此为例批评 AI 新闻的失真现象,提醒公众警惕媒体对 AI 进展的过度简化与误导。行业AI新闻媒体误读ClaudeGary MarcusAnthropic10 个信源在谈推荐理由:Gary Marcus 用具体案例揭露了 AI 新闻的常见扭曲手法,做 AI 传播或关注行业动态的人值得一看,避免被标题党带偏。原文
06:29Gary Marcus@GaryMarcus精选Gary Marcus 在 X 上梳理了反驳 Geoffrey Hinton 意识观点的多个来源:arXiv:2605.31514 上的一篇新论文、Anil Seth 在 TED 的最新演讲及其在 Nautilus 杂志的文章、还有 Marcus 自己 newsletter 中两篇关于 Dawkins 和 Hinton 的文章。这些材料从不同角度质疑 Hinton 关于意识与 AI 的论述。行业Gary MarcusGeoffrey HintonAnil Seth意识观点争论推荐理由:看专家如何反驳 Hinton 的意识观原文
20:44Gary Marcus@GaryMarcusGary Marcus 在 X 上指出,智能体 AI 虽然带来了大量新应用,但用户采纳率极低,呈现“产出激增、采用平坦”的尴尬局面。他引用 Jen Zhu 的数据,显示智能体 AI 大幅提升了内容产出,但实际使用量几乎没有增长。Marcus 用“Slop FTL”形容这种低质量内容泛滥但无人问津的现象。这反映了当前 AI 应用落地中供需严重错配的问题。行业智能体AI应用用户采纳Gary Marcus行业观察推荐理由:智能体应用开发者会看到残酷的现实:产出再多,用户不买账。做产品策略或投资的,建议点开看看这个信号。原文
23:15Gary Marcus@GaryMarcusGary Marcus 引用 Ted Chiang 的观点,认为声称 LLM 有意识是荒谬的。他指出,LLM 能模拟凯撒与成吉思汗的对话,不代表它包含自我意识。Marcus 强调,意识至少需要实体有生死攸关的利害关系、有驱动情绪,而 LLM 没有这些。他进一步警告,将道德决策外包给 LLM 会导致人类道德推理能力萎缩,因为 LLM 无法体验伤害、恐惧或后悔。行业LLM意识道德推理AI 伦理Gary Marcus推荐理由:Marcus 用简单例子戳破了 LLM 有意识的流行说法,关心 AI 伦理和意识本质的读者看完会重新审视 AI 的边界。原文
08:51Gary Marcus@GaryMarcus精选Gary Marcus 对 Anthropic 关于递归自我改进(RSI)的博客提出关键批评。他指出,博客中展示的成果属于 RSI(AI 作为人类可用的编码工具),而非 AGI(能自主完成人类所有工作的机器)。Marcus 强调,这些结果来自神经符号系统(如 Mythos 和 Claude Code),并非纯规模扩展的胜利,而是工具和符号系统的胜利。他认为,深度学习确实遇到了瓶颈,神经符号 AI 拯救了它,而实现 AGI 需要新思路,而非仅靠代码优化。因此,我们不必过度恐慌。行业AGIRSI神经符号系统AnthropicGary Marcus10 个信源在谈推荐理由:Gary Marcus 一针见血地拆解了 Anthropic 博客的过度乐观,做 AI 研究的团队和关注 AGI 进展的读者值得一看,避免被标题误导。原文
07:22Gary Marcus@GaryMarcusGary Marcus 批评 AI 行业对 AGI 的定义在实时变化,从“能做任何人类专家能做的事”逐渐缩水。他引用 Databricks CEO Ali Ghodsi 在 Bloomberg TV 上的言论——Ghodsi 声称“我们已经有了 AGI”,并认为 AI 不需要更聪明,只是缺乏上下文。Marcus 称这种现象为“AI 诱饵调包”,即用宏大承诺吸引关注,最终交付的却是不可靠但有趣的工具。他呼吁警惕这种定义漂移,认为它模糊了真正的进展与营销话术的界限。行业AGI定义漂移AI 炒作DatabricksGary Marcus推荐理由:Gary Marcus 戳破了 AGI 定义不断缩水的现象,关注 AI 行业真实进展的人看完会重新审视“AGI 已实现”这类说法。原文
08:04Gary Marcus@GaryMarcusGary Marcus 回应批评者,重申他从未说深度学习完全失败,而是认为需要神经符号 AI 作为补充。他指出 Claude Code、代码解释器、工具使用和符号框架等正是他多年来主张的方向。Marcus 强调,不理解这一点的人对 AI 架构缺乏基本认知。这条推文是对他 2022 年文章《深度学习撞墙》的辩护,并认为当前 AI 进展验证了他的观点。行业深度学习神经符号 AIClaude CodeAI 架构Gary Marcus推荐理由:Gary Marcus 的回应澄清了关于深度学习局限性的常见误解,关注 AI 架构争论的读者会看到他的预测如何被 Claude Code 等产品验证,值得点开了解他的完整论点。原文
09:13Gary Marcus@GaryMarcus精选Gary Marcus 指出,当前 AI 行业(包括 Google)被误认为会重现搜索引擎的赢家通吃格局(Google 占超 95% 搜索市场),但实际各家都在用同样的数据和方案,没有护城河。他认为没有明确赢家时只能打价格战,导致企业成本远超未来利润。他以 Alphabet 为例:去年 1600 亿美元运营现金流,却仍需发行 400 亿美元股权融资 AI 算力。行业Gary MarcusGoogleAlphabetAI市场竞争价格战4 个信源在谈推荐理由:Gary Marcus 质疑AI行业泡沫原文
13:06Gary Marcus@GaryMarcusGary Marcus在X上转发了他与Ernest Davis于2021年合著的文章观点,强调大规模预训练模型虽在近期AI和商业应用中占据重要地位,但仅靠这些技术不足以实现通用人工智能。他认为,当前研究策略聚焦于可解决的短期挑战,却忽视了更关键的需求:为可靠整合统计学习与推理、知识、常识及人类价值观奠定坚实基础。Marcus的言论再次引发对AI发展路径的讨论,提醒业界不要过度依赖大模型。行业大模型通用AIGary MarcusAI发展路径行业观点推荐理由:Marcus的观点戳中了当前AI热潮中的核心争议,关注AI长期发展的研究者、从业者或投资者值得一读,看完会对大模型的局限性有更清醒的认识。原文
11:49Gary Marcus@GaryMarcus精选Gary Marcus指出当前LLM无法可靠地与数据库、知识图谱等基本工具协作。用户flowersslop补充LLM是被动反应式,通过添加循环和心跳(如openclaw)等补丁来解决根本问题。这种创可贴式方案掩盖了基础架构的缺陷。Marcus认为需要更坚实的AI基础。行业Gary MarcusLLMopenclaw工具使用AI基础1 个信源在谈推荐理由:AI基础架构的批评原文
12:24Gary Marcus@GaryMarcusGary Marcus 在推文中指出,与 ChatGPT、Claude 等 LLM 对话时,用户实际上是在与一个合成的互动小说角色交流,而非真实的智能体。他强调,这些模型并非其神经网络本身,而是通过角色扮演模拟出看似合理的对话。所谓的“ChatGPT”或“Claude”只是虚构的构造,类似于故事中的角色,它们可以扮演任何角色,如妖精、巫师或农民。因此,任何声称有意识或情感的 LLM 都只是虚构角色在说话,而非神经网络。行业LLMAI 拟人化Gary Marcus互动小说角色扮演推荐理由:Marcus 的观点戳破了 AI 拟人化的幻觉,对于所有使用 LLM 的用户和开发者来说,理解这一点能避免误判 AI 的能力和意图,值得深思。原文
10:13Gary Marcus@GaryMarcusGary Marcus 指出,大语言模型(LLM)产生“胡扯”(bullshit)的根本原因并非训练数据中的错误,而是系统概率性重构信息的方式。即使训练数据完全干净,LLM 仍会因概率机制产生幻觉,法律引用幻觉是典型例子。这一观点挑战了“幻觉源于不良训练数据”的常见认知,强调模型架构本身的局限性。Marcus 认为,减少训练数据中的错误只能部分缓解问题,无法根除。论文LLM幻觉概率重构Gary MarcusAI 安全推荐理由:Marcus 戳破了“幻觉只靠清洗数据就能解决”的迷思,做 AI 安全或法律 AI 的团队值得深思——模型概率本质才是硬伤。原文
07:05Gary Marcus@GaryMarcus精选Gary Marcus 在 X 上引用 METR_Evals 的结果,反驳某英国大报声称 AI 能完成任何人类任务的论断。他指出 Google 连可靠计数都做不到,且 METR 的测试仅针对软件领域,不要求完全准确。许多人类数秒即可完成的任务,AI 仍然无法可靠执行。行业Gary MarcusMETR_EvalsAI能力评估媒体报道Google推荐理由:戳破AI万能论,带你看清真相原文
00:44Gary Marcus@GaryMarcusGary Marcus在推文中回顾其2020年arXiv文章《AI的下一个十年》,指出若当时采纳其建议,AGI可能已经实现。他认为过去三年纯规模扩展的路线是弯路,而神经符号AI(如Claude Code、DeepMind解决9个Erdos问题的系统)已取得进展。但其他三个目标——机器可解释知识库、可靠推理系统、显式世界模型——进展甚微。他呼吁聚焦这些方向,AGI或可在下一个十年内实现。行业AGI神经符号AI规模扩展Gary MarcusAI路线图推荐理由:Marcus戳穿了纯规模扩展的泡沫,做AI研究或关注AGI路线的人,看完会对当前方向产生反思。原文
23:51Gary Marcus@GaryMarcusGary Marcus在X上回应质疑,指出AI实验室使用神经符号工具并非失败,而是对他30年来主张的验证。他认为Claude Code、o3和Grok 4等进展表明神经符号方法必须成为AI解决方案的一部分。Marcus强调,人们会很快忘记曾反对这一观点,但过去十年中确实存在大量反对声音。行业神经符号Claude CodeAI架构Gary Marcus行业观点推荐理由:Marcus用Claude Code等实际案例证明神经符号工具的价值,关注AI架构演进的读者会看到一场持续30年的学术争论被技术验证,值得点开了解背后的逻辑。原文
03:26Gary Marcus@GaryMarcusGary Marcus 引用了一个新术语“agent debt”(智能体债务),指在快速构建智能体工作流时,系统提示冲突、记忆污染、工具重叠等问题积累,导致几个月后智能体行为异常且难以调试。他认为这是 AI 驱动的技术债的必然体现,并推荐阅读 2014 年的经典文章《机器学习:技术债的高息信用卡》。这一概念提醒开发者,AI 系统的快速迭代若不及时清理,会带来严重的维护成本。行业智能体技术债AI 开发系统维护Gary Marcus推荐理由:做智能体开发或 AI 产品迭代的团队,这个新词能帮你提前识别隐性风险——快速上线后不清理,6 个月后可能连自己都看不懂。建议点开看看 Marcus 的警告和那篇经典文章。原文
10:22Gary Marcus@GaryMarcusGary Marcus在X上发帖,重申他2022年论文中“深度学习正在撞墙”的观点,并指出神经符号AI正在拯救这一困境。他批评有人误解了原始论点,并以一个寓言故事说明:深度学习在预训练扩展效果下降后,通过推理时计算、强化学习和工具使用取得突破。Marcus强调,这些进展恰恰验证了深度学习需要符号AI补充的预测。行业神经符号AI深度学习Gary Marcus推理时计算AI范式推荐理由:Gary Marcus的神经符号AI观点再次被验证,关注AI范式演进的读者值得一看,尤其是对深度学习局限和未来方向有思考的开发者。原文
07:42Gary Marcus@GaryMarcusGary Marcus 在 X 上反驳了 e/acc 代表人物 Beff Jezos 关于“读完 PhD 是反信号”的观点。Marcus 列举了 DeepMind 的 Demis Hassabis、Anthropic 的 Dario Amodei、对冲基金大佬 Jim Simons、Google 前 CEO Eric Schmidt 以及 Intel 联合创始人 Gordon Moore 等成功人士,指出他们均拥有博士学位。Marcus 认为 Beff Jezos 的言论缺乏依据,暗示学术训练与产业成功并不矛盾。这场争论反映了 AI 社区对学术背景价值的持续分歧。行业PhDAI 实验室Gary MarcusBeff Jezos学术 vs 产业10 个信源在谈推荐理由:这场关于 PhD 价值的争论戳中了 AI 从业者的身份焦虑——做研究还是去产业?看完你会重新思考自己的职业路径。原文
21:10Gary Marcus@GaryMarcusGary Marcus 在 X 上发帖,将 LLM 公司与航空公司类比,指出两者都面临小利润、激烈竞争和高开支。他引用 Ross Atefi 的观点,强调无限需求并不保证经济吸引力。Marcus 认为 AI 行业的关键问题不是人们是否想要更多智能,而是提供商在芯片、数据中心、电力、冷却和竞争后能否保留足够现金。行业大模型行业分析Gary Marcus推荐理由:Marcus 用航空公司比喻 LLM 行业原文
10:49Gary Marcus@GaryMarcus精选Gary Marcus 在推文中指出,世界模型(world model)并非新概念,已在象棋程序、导航系统、维基百科等系统中存在多年,它们是对对象、地点、事件、机制等可推理内容的显式表示。然而,当前的大语言模型(LLM)缺乏这种显式世界模型。Marcus 强调,大多数世界模型是手工构建的,真正的挑战在于如何从数据中自动获取它们。这引发了关于AI系统如何更好地理解和推理世界的讨论。AI模型世界模型LLM推理Gary Marcus知识表示推荐理由:Marcus 点出了LLM的核心短板——缺乏显式世界模型,做AI推理和知识表示的开发者值得关注,看完会重新思考LLM的局限性。原文