从游戏到生物学及其他领域:AlphaGo 10年的影响
从游戏到生物学及其他领域:AlphaGo 10年的影响十年前,我们的人工智能系统AlphaGo成为第一个在复杂的围棋游戏中击败世界冠军的程序--比许多专家认为的可能早了十年,就达到了该领域的一个里程碑。
这一成就预示着现在被认为是人工智能(AI)现代时代的开始。AlphaGo通过著名的“Move 37”这一创意玩法展示了人工智能的潜力,并表明我们现在拥有了开始解决现实世界科学问题的技术。如今,这一突破继续为我们在人工通用智能(AGI)道路上构建系统的工作提供信息。
我们相信AGI将成为有史以来发明的最深奥的技术,并可能成为推进科学、医学和生产力的终极工具。创意火花2016年,超过2亿人在首尔观看了AlphaGo对阵世界冠军围棋选手Lee Sae Dol。
这场比赛的定义是第二场比赛中的“第37步”,这是一个非常规的比赛,以至于专业评论员最初认为这是一个错误。但事实证明这是决定性的。一百多步后,石头的位置正好适合AlphaGo赢得比赛。这展示了令人难以置信的远见和人工智能系统超越模仿人类专家并找到全新策略的能力。
由于游戏的复杂性,围棋长期以来一直是人工智能研究的试验场。
木板上有10170个可能的位置--远远超过了可观测宇宙中原子的数量。为了使游戏易于操作,AlphaGo使用了深度神经网络与高级搜索和强化学习相结合--这是DeepMind首创的人工智能方法。
AlphaGo首先从人类专家玩的游戏中学习,然后与自己玩数十万场游戏,随着最强的制胜策略得到加强,AlphaGo学习了一个看似合理的围棋棋步模型。然后,该系统只考虑最有可能富有成效的路径,并从较小的移动子集中找到最有可能导致其获胜的路径。
在AlphaGo之后,我们建立了AlphaGo Zero,它从完全随机的游戏中学习游戏,并成为历史上最强的玩家。然后,我们用AlphaZero进一步推广了这个系统,它从头开始自学掌握任何2人完美信息游戏,包括围棋、国际象棋和将棋。
从没有任何先验知识开始,除了游戏规则,AlphaZero能够在几个小时内学会掌握国际象棋,不仅击败了顶尖的人类选手,而且击败了当时最好的专业国际象棋程序,如Stockfish。
尽管国际象棋已经在这些程序的帮助下进行了大量的分析,就像围棋一样,AlphaZero仍然能够提出有趣的新策略。
这进一步证明了我在首尔赢得比赛的那一刻所知道的--这项技术已经准备好应用于我们加速科学突破的真正目标。我相信AlphaGo提供的最大教训是对人工智能时代的明确预览--证明这不是某个遥远、模糊的未来,而是即将到来的现实。
它是“来自未来的路线图”,向人类发出了世界即将如何改变的明确信号。催化科学突破通过证明它可以在围棋棋盘的巨大搜索空间中导航,AlphaGo展示了人工智能帮助我们更好地理解物理世界的巨大复杂性的潜力。
我们从试图解决蛋白质折叠问题开始,这是一个长达50年的预测蛋白质3D结构的巨大挑战-这些信息对于理解疾病和开发新药至关重要。2020年,我们终于用AlphaFold 2系统解决了这个长期存在的科学问题。
从那时起,我们折叠了科学界已知的所有2亿种蛋白质的结构,并在开源数据库中向科学家免费提供它们。如今,全球超过300万研究人员使用AlphaFold数据库来加速他们在从疟疾疫苗到食塑料酶等各个领域的重要工作。
2024年,John Jumper和我因代表整个AlphaFold团队领导这个项目而获得诺贝尔化学奖,这是我一生的荣幸。
自从AlphaGo获胜以来,我们将其开创性的方法应用于科学和数学的许多其他领域,包括:数学推理:AlphaProof是AlphaGo架构的最直接后裔,学会了使用语言模型和AlphaZero的强化学习和搜索算法的组合来证明正式数学陈述。
与AlphaCurve 2一起,它成为第一个在国际数学奥林匹克竞赛(IMO)上获得奖牌标准(银牌)的系统,证明AlphaGo的方法可以解开高级数学推理,并为我们最强大的通用模型奠定基础。双子座是我们最大、最有能力的车型,最近走得更远。
其Deep Think模式的高级版本采用受AlphaGo启发的方法,在2025年国际海事组织上获得了金牌级别的性能。从那时起,深度思考已被应用于科学和工程领域更复杂、开放式的挑战。
算法发现:正如AlphaGo在游戏中搜索最佳棋一样,我们的编码代理AlphaEvolve探索计算机代码空间以发现更有效的算法。它有自己的Move 37时刻,当时它发现了一种新颖的矩阵相乘方法,这是几乎所有现代神经网络的基本数学运算。
AlphaEvolve目前正在接受从数据中心优化到量子计算等问题的测试。
科学合作:我们正在将AlphaGo首创的搜索和推理原则整合到人工智能联合科学家中。通过让代理人“辩论”科学思想和假设,该系统充当协作者,能够执行识别数据模式和解决复杂问题所需的严格思维。
在伦敦帝国理工学院的验证研究中,它分析了数十年的文献,并独立得出了研究人员花了数年时间开发和实验验证的有关抗菌药物耐药性的相同假设。我们还使用人工智能来更好地了解基因组、推进融合能源研究、改进天气预测等等。
尽管我们的科学模型令人印象深刻,但它们是高度专业化的。为了实现根本性突破,例如创造无限的清洁能源或解决我们今天不理解的疾病,我们需要通用的人工智能系统,它能够找到不同学科领域之间的潜在结构和联系,并帮助我们像最好的科学家那样提出新的假设。
智力未来为了让人工智能真正具有通用性,它需要了解物理世界。我们从一开始就把Gemini打造成多模态的,这样它不仅能理解语言,还能理解音频、视频、图像和代码,从而构建一个世界模型。
为了思考和推理这些模式,最新的双子座模型使用了我们在AlphaGo和AlphaZero中首创的一些技术。
下一代人工智能系统还需要能够调用专门的工具。例如,如果模型需要知道蛋白质的结构,它可以使用AlphaFold来实现这一点。我们认为双子座的世界模型、AlphaGo的搜索和规划技术以及专业人工智能工具使用的结合对于AGI至关重要。
真正的创造力是这样一个AGI系统需要展示的关键能力。第37步让我们看到了人工智能在盒子外思考的潜力,但真正的原创发明需要更多的东西。它不仅需要像AlphaGo令人印象深刻的那样提出一种新颖的围棋策略,而且还需要真正发明一种像围棋一样深刻、优雅、值得研究的游戏。
AlphaGo取得传奇胜利十年后,我们的最终目标是