2016年AlphaGo击败李世石,开启了人工智能在围棋领域的统治。十年来,AlphaGo及其后继者AlphaZero、MuZero等系统不仅改变了围棋的竞技生态,也深刻影响了AI研究的方向。近期,围绕AlphaGo代表的“搜索+强化学习”范式与当前主流的“大规模预训练生成式AI”范式之间的对比成为焦点。
一方面,AlphaGo的奠基人之一、图灵奖得主Richard Sutton在访谈中强调,纯生成式AI(如LLM)缺乏评估和搜索能力,难以进行真正的科学发现;他认为科学需要基于模型、搜索和评估的循环,而这正是AlphaGo的核心(图灵奖得主萨顿:普通生成式AI缺乏评估能力,难做科学发现)。与此呼应,DeepMind首席科学家David Silver在最新思想实验中也指出,LLM受限于训练数据中的统计模式,无法像AlphaGo那样通过自我对弈实现超人类突破(David Silver思想实验:LLM困在数据框架里,无法突破)。
另一方面,谷歌DeepMind CEO Demis Hassabis在AlphaGo十周年之际回顾了其影响,并预测AGI最快三年内到来,强调研发速度远超预期(谷歌 DeepMind CEO 哈萨比斯:AGI 最快三年内到来,研发速度远超预期)。在围棋圈,棋手李昌镐等也回顾了AI对棋艺的颠覆性改变(AlphaGo十周年:李昌镐与棋手回顾变革)。
当前焦点在于:AlphaGo所代表的“搜索+学习”路线是否仍是AGI的关键路径,还是会被GPT等生成式模型取代?Sutton和Silver的观点构成了对主流LLM范式的有力质疑,而Hassabis的乐观则暗示DeepMind可能正在融合两条路线。未来值得观察:生成式AI能否引入类似AlphaGo的搜索与价值评估机制,以及围棋AI的技术遗产是否会以新形态回归。