AlphaGo

§ 01综述

2016年AlphaGo击败李世石，开启了人工智能在围棋领域的统治。十年来，AlphaGo及其后继者AlphaZero、MuZero等系统不仅改变了围棋的竞技生态，也深刻影响了AI研究的方向。近期，围绕AlphaGo代表的“搜索+强化学习”范式与当前主流的“大规模预训练生成式AI”范式之间的对比成为焦点。

一方面，AlphaGo的奠基人之一、图灵奖得主Richard Sutton在访谈中强调，纯生成式AI（如LLM）缺乏评估和搜索能力，难以进行真正的科学发现；他认为科学需要基于模型、搜索和评估的循环，而这正是AlphaGo的核心（图灵奖得主萨顿：普通生成式AI缺乏评估能力，难做科学发现）。与此呼应，DeepMind首席科学家David Silver在最新思想实验中也指出，LLM受限于训练数据中的统计模式，无法像AlphaGo那样通过自我对弈实现超人类突破（David Silver思想实验：LLM困在数据框架里，无法突破）。

另一方面，谷歌DeepMind CEO Demis Hassabis在AlphaGo十周年之际回顾了其影响，并预测AGI最快三年内到来，强调研发速度远超预期（谷歌 DeepMind CEO 哈萨比斯：AGI 最快三年内到来，研发速度远超预期）。在围棋圈，棋手李昌镐等也回顾了AI对棋艺的颠覆性改变（AlphaGo十周年：李昌镐与棋手回顾变革）。

当前焦点在于：AlphaGo所代表的“搜索+学习”路线是否仍是AGI的关键路径，还是会被GPT等生成式模型取代？Sutton和Silver的观点构成了对主流LLM范式的有力质疑，而Hassabis的乐观则暗示DeepMind可能正在融合两条路线。未来值得观察：生成式AI能否引入类似AlphaGo的搜索与价值评估机制，以及围棋AI的技术遗产是否会以新形态回归。

§ 02相关报道05 条在档

§ 03邻近话题