聊聊DeepMind创始人哈萨比斯:一个科学家与失控的AI竞赛
4 小时前 / 阅读约37分钟
来源:36kr
哈萨比斯是DeepMind创始人,AlphaGo、AlphaFold背后的大脑,2024年诺贝尔化学奖得主。文章探讨了他的成长经历、DeepMind的发展历程、AGI理念及对AI未来的看法。

他是霍金口中“地球上最聪明的人之一”,4岁下国际象棋,13岁获大师称号,却在一场对弈中突然顿悟,转身奔向人工智能。

他是DeepMind创始人,AlphaGo、AlphaFold背后的大脑,2024年诺贝尔化学奖得主。他也是那个因执念于强化学习险些错失大语言模型时代,又率领谷歌Gemini逆袭,成功回到牌桌的“孤傲天才”。

我们想聊聊哈萨比斯,不仅因为他的天才传奇,更想了解:发明终极技术的那一小撮人,他们的思想从何而来,动机又是什么?在他的传记中,作者塞巴斯蒂安·马拉比抛出一个问题:哈萨比斯一直想做正确的事,但他能做到吗?

本期播客,我们邀请到了《哈萨比斯:谷歌AI之脑》译者周健工,他也是中国最早当面采访哈萨比斯的媒体人。我们从哈萨比斯的少年往事聊起,复盘DeepMind被谷歌收购的博弈,以及错失大模型的战略失误,也追问了那个绕不开的问题:当一个科学家手握可能改变人类命运的技术,他的理想、执念与野心,会把我们带向何方?

以下是这次对话内容的精选:

01 打造人类终极智能的人,内心是什么样子的?

泓君:周老师,我知道您也是国内第一批当面去采访哈萨比斯的中国媒体人。您要不要讲一下,您对他的第一印象?

周健工:AlphaGo战胜李世石是2016年,我是在2017年,对哈萨比斯进行了一场大概一个小时的电视专访。

他这个人非常的瘦小,当时大概40岁,有些秃顶。我觉得他非常像一个普普通通的中国研究所里搞科研的人。他母亲是新加坡的华人,所以有一点文化上的亲切感。

当时还在世的物理学家霍金说,哈萨比斯是世界上最聪明的人之一。我觉得那次交流得非常愉快,他没有摆出那种神童、世界上最聪明的人的架子,他跟人交流是非常平和的。

但是他的语速是比较快的,表达的思想极其流畅、清晰,甚至非常犀利。你问他任何问题,他都能给你一个非常清晰的逻辑,在不同的知识之间的切换可以说是运用自如。你就感觉到任何智力上的挑战,对这个人是没有任何障碍的。这是我最深的一个印象。

他讲话不是那种一套一套的、很多人被训练出公关的那种讲话。我觉得黄仁勋有一点点这个味道。他讲话非常具体地针对你问的这个问题,他能贡献出最新鲜的一个想法。你觉得这东西不是说就像放了无数遍的一个PPT一样,不停地给你播放。我觉得这是一种智慧。

泓君:您刚刚也提到了,他跟黄仁勋是非常不一样的人。这两本传记也都是您翻译的。哈萨比斯和黄仁勋,作为两个创始人,对AI的发展都有着非常重大的影响,他们身上最核心的特质会有什么不一样的地方?

周健工:在哈萨比斯身上能感觉到更多真诚的东西。在《哈萨比斯》这本书里面,作者马拉比用了大量的对话,这是跟马拉比其他书不同的地方。你可以从他跟哈萨比斯私下里大概有30多个小时的对话,感觉到哈萨比斯发自内心的很多想法。

所以我在翻译的过程中,对他的对话也非常认真仔细地去处理,怎么可以从对话中看到这个人内心深处的真实的、微妙的一些想法。

《哈萨比斯:谷歌AI之脑》(The Infinity Machine:Demis Hassabis, DeepMind, and the Quest for Superintelligence)作者:[美]塞巴斯蒂安·马拉比(Sebastian Mallaby)译者:周健工

泓君:对,我觉得这点也是我自己对哈萨比斯这个选题非常感兴趣的一个原因。我们现在这期节目的录制时间是在春节前夕。最近的这两周,从OpenClaw出来了以后,我整个人处在一种非常震惊的状态中,我觉得它可能已经开始冲击到很多人类的工作了。

哈萨比斯,包括我们说像Anthropic的Dario Amodei,他们都是这些AI的建造者。在整个《哈萨比斯》的书中,作者用奥本海默的例子去做对比。我记得那本书它的结尾,也包含一个疑问:哈萨比斯一直想做正确的事情,但是他能不能做到?这是一个问号。

所以我还挺感兴趣,就是我们今天在探讨这样一个——我更愿意把他定位成AI科学家,他在建成一个非常强大的AI的过程中,他到底自己是怎么去看待技术,包括是怎么看这些“AI威胁论”,以及到底我们会把这个技术带向何方……这一系列都是我很感兴趣的讨论点。

周健工:马拉比是一个写作的高手,他写这本书的立意我觉得也是非常高的。从头到尾读完之后,我有一个突出的感受:马拉比驱动这本书的叙事最底层的那个力量是什么?AGI是威力无比强大的一个技术,也可能是人类的一个终极技术,就像他的这本书的原名《The Infinity Machine》,它是一个上帝的机器。对人类未来的福祉,甚至对人类的文明影响这么大,它作恶的可能性也是有的。

那么发明这些技术的这一小撮人究竟是什么样的人?他们带着什么样的动机来发明这些技术?他们的动机可能会直接影响到这个技术对人类的未来究竟意味着什么。他认为哈萨比斯可能是里面的一个最关键的人物。因为在ChatGPT出现10年之前,AGI这个运动就已经开始了,就源自于哈萨比斯他们这个团队。所以他找到哈萨比斯,是非常非常准确的一个选择。

02 象棋、游戏、人工智能……是什么塑造了哈萨比斯?

泓君:我们说到这里,要不要给我们的听众简单介绍一下哈萨比斯这个人,以及他在创建DeepMind以前到底是一个什么样的经历?

周健工:他的第一个标签是神童。4岁时看大人下国际象棋,5岁就开始自己下,13岁的时候是国际象棋大师,而且他的积分在全球同年龄段是排名第二。所以在童年时期他经常,跟成人一起下棋,经常是屁股底下垫两个厚厚的书,他才能看着棋盘,一下就是8个小时以上,下着下着就睡着了,因为他太小了。

幼年的哈萨比斯 图片来源:The Thinking Game

他是非常典型的移民家庭,母亲是一个华人,父亲是希腊塞浦路斯人。两个人都是在伦敦勤勤恳恳抚养孩子。他的父母认为他将来走上国际象棋这条路肯定会成功的,但是最关键的两个顿悟点,我觉得完全是哈萨比斯自己在身上促成的。

第一个,他在11岁的时候,我记得书里面写到,他在列支敦士登跟丹麦的一个国际象棋冠军在对弈的时候,一口气下了10个小时。按照他的水平,这局棋很可能是和棋,但是可能还要纠结下去。这个时候对方在思考,他看着对方,然后又看着大厅里到处都是下棋的人。他突然想到一个问题:难道我就在下棋中度过这一辈子吗?

然后他又想一个问题:这个屋子里所有的人,都是世界上可能最聪明的人,他们难道把自己的智力全部用在下棋这一件小事上吗?他突然感觉下棋对他的意义没有那么重大了,而且胜负对他来说也不重要了。从那以后,他还在下棋,但是对下象棋这件事情就不再那么执念了。

第二件事,是他父亲带他去伦敦的一个号称世界上最大的书店。他看到了一本薄薄的小册子,是英国国际象棋大师大卫·利维(David Levy)写的一本书,关于怎么编程国际象棋程序。里边就讲了用计算机怎么去下国际象棋,怎么去战胜对手,它的原理是什么。哈萨比斯就一口气把这本书读完了。这本书立刻把他从国际象棋这个世界连接到了计算机的这个世界。

而且这本书里提到了一个非常关键的人叫香农(Claude Shannon)。香农是信息论的发明者,香农在现代意义上比较成熟计算机出现之前,在1950年就写过一篇关于如何编程象棋的文章,并提出了一个当时非常有预见性的观点:如果我们能编程下象棋,那么我们这个编程也可能完成其他的非常多的智力和认知方面的任务。它可能具有通用性,可能是一个通用计算机。这些理论探索,对当时幼小的哈萨比斯产生了极大的一次启蒙,可以说是给他打开了另外一个更加广阔的世界。

泓君:他16岁被剑桥录取,因为当时他的年龄太小了,剑桥就要求他推迟一年入学。在这一年的等待时间里面,他是去游戏公司工作了一段时间,表现也非常的突出。我记得他在创建DeepMind以前,自己也做了一个游戏公司,是有两段游戏公司经历的。

周健工:这两段游戏公司经历对哈萨比斯的影响很大。第一次是在牛蛙公司(Bullfrog),是当时欧洲和全球非常知名的一家游戏公司。哈萨比斯在游戏中增加了许多后来所谓智能体的一些初步的概念,比如设计一个角色,你先给他吃很咸的食物,他之后就会产生口渴的感觉。所以这个时候他产生了朦胧的智能体的感觉。

哈萨比斯在牛蛙公司《主题公园》游戏中融入了早期的智能体概念 图片来源:The Thinking Game

后来他在剑桥毕业之后自己就创业,当时找了大卫·西尔弗(David Silver),就是“强化学习”那面旗帜。他们俩一起搞了万灵药工作室(Elixir Studios)。这应该说是一个失败的创业项目。因为他给自己立的标准太高了,一定要做一个世界上最牛的游戏。然后他把自己所有能想到的游戏中间那种复杂的故事情节、人物之间的互动,还有玩家的这种参与,想全部都设计进去。但是因为他们的算力有限、资源有限,最后没有能够兑现他们的承诺。

这个叫《共和国》这款游戏,也可以说是一个史诗级的游戏。当时冷战刚刚结束,它是以苏联的崩溃作为背景来设计的一个游戏。所以对于当时这么年轻的人来说,设计这么复杂的一款游戏,我觉得真的是非常有野心的。但是最后这款游戏,到美国的一个游戏的博览会上,在演示的时候就掉链子了,让西尔弗当时就放鸽子跑了。哈萨比斯凭自己的三寸不烂之舌,勉强应付,把大家糊弄过去了。但后来这个游戏迟迟不能推出,推出之后大家已经对它不感兴趣了。

这次失败对于哈萨比斯也是非常有意义的。我觉得这本书里面写的有一个点很好:一方面,对于AGI,对于科学发现,对于智能,哈萨比斯有自己的很深的一些哲思和理论;但另外一方面,他又非常崇尚费曼的一句话:“如果你不能把一个东西造出来,你就不能真正理解它。”所以他是一个知行合一的人。他如果想到一个通用的机器、一个智能体,他一定要把它造出来。我觉得打工和创业的这段经历,就奠定了他实际上不是一个空谈的科学家,他是一个实践的科学家。

泓君:您刚刚讲的这段在万灵药工作室的创业经历过程中,我觉得有两点跟现在我们对AI的判断还是非常的息息相关的。

第一个他设计了极其超前的《共和国》这款游戏,他想在一个城市里同时模拟上千个独立思维的角色。但是那个是在2003年,那个时候的电脑不光是显卡、CPU,还有内存,可能都跟不上这个野心。这件事情给了哈萨比斯一个非常深刻的教训:你拥有再好的算法和想法,如果没有足够的算力支撑,它还是只能是停在纸面上的。

《共和国:革命》万灵药工作室2003年发布 图片来源:Wikipedia

另外一个点就是,您刚刚提到了他从环境的反馈中去学习。这个最近也非常火,有一个词叫做“强化学习”。这跟DeepMind的最开始为什么落后于OpenAI,后面又反超的关系是很大的。比如说大家都知道,其实Transformer是谷歌的另外一个部门Google Brain发明的。DeepMind它虽然当时也是被谷歌收购了,但是其实DeepMind最强的是强化学习,这也是它刻在DNA里的东西。因为哈萨比斯是一直坚信,光靠大语言模型是到达不了AGI的,而且还需要有类似于AlphaGo的那种规划和推理的能力。

所以我们说虽然DeepMind很早就被谷歌收购了,而且谷歌手里一边是Transformer,一边是强化学习,这个手里有两张“王牌”,但他们其实就是各干各的,早期也没有融合。这是我们看到为什么OpenAI早期去抢了风头。但我觉得现在一个有意思的事情是,过去OpenAI的o1,包括DeepSeek的R1,都是在往前强化学习的方向去回摆,反过来也在借鉴AlphaGo的思路。现在其实强化学习,它的整个优势也开始显现出来了。

03 为实现AGI创立DeepMind

周健工:其实AGI这个词,是哈萨比斯在剑桥读书的时候,他们计算机系那个学霸叫大卫·西尔弗,从AI这个圈外引入到圈内的一个词。大概是1998年时候,美国的DARPA开的一次会上,有一个美国科学家在写纳米科技的时候,用了AGI这个词,最早是从那发源的。西尔弗建议他当时的一个老板写一本书,就建议他用“通用人工智能”这个词。

他们成立DeepMind这家公司的时候,AGI这个词的理念和哈萨比斯的这个理念是高度吻合。所以他们这家公司的使命就是:要发明AGI这个机器,先解决AI,再用AI解决一切。就是他们最早的一个口号。

哈萨比斯和大卫·西尔弗有一个执念,他们一开始就认为,通向AGI之路一定是强化学习,未来的AGI一定是一个单一的模型。所以他们这种执念,导致了他们的成功,最起码在游戏的领域。成功的原因我觉得很简单,因为游戏是一个规则相对明晰、边界相对清晰,奖励机制非常清晰,你可以用这种强化学习、试错、反馈机制,快速地优化。强化学习威力最大的这方面,可以发挥得淋漓尽致。

在这个过程中,其实在强化学习和神经网络的这个深度学习之间,又发生了两个学派之争,其实就是杰弗里·辛顿(Geoffrey Hinton)和理查德·萨顿(Richard Sutton),非常有意思。这两个人都在加拿大,辛顿在多伦多大学,萨顿在阿尔伯塔大学。萨顿是强化学习之父。大卫·西尔弗知道了这个萨顿是强化学习的理论之后,跟他的想法非常近似,他就立刻跑到阿尔伯塔,那个冰天雪地去读他的研究生去了。

这里面书中写了几个情节,非常有意思。比如有些人在萨顿那里读了硕士,就想去多伦多大学读辛顿的博士,杰弗里·辛顿下面的人就说,你是从萨顿那边来的,那你那个强化学习那套要放弃的,跟我们这边是行不通的。两个派别之间实际上也是有对峙的。

泓君:我觉得这段背景太精彩了,它其实也是现在在AI发展中,没有被大家注意到的两个派别。之前我记得还有一本书叫做《深度学习革命》,其实是以深度学习为核心来去讲这样的一群人的。在这本书里面,你刚刚提到像理查德·萨顿,然后还有强化学习的这条路线,它也是非常明显的一条发展线。如果我们要讲到这个发展线的话,是不是我们可以从整个DeepMind崛起来看,它有一些高光时刻,包括AlphaGo、AlphaZero,还有AlphaFold,它都是跟这条线一脉相承的。

我们再把故事线稍微往回拉一拉。刚刚其实聊到了他的游戏公司,万灵药工作室,接下来就是整个DeepMind崛起了。周老师,你要不要先跟大家介绍一下DeepMind三个创始人以及他们的背景?

周健工:其实我觉得最应该成为他联合创始人的应该是大卫·西尔弗。但是两个人因为在万灵药工作室创业时候因为失败,当时西尔弗就离开了。

他在成立DeepMind时找的联合创始人,第一个叫肖恩·莱格(Shane Legg)。这个人是哈萨比斯在伦敦大学学院的神经计算研究所认识的。他发挥了一个非常重要的作用,就是把哈萨比斯跟硅谷连接起来了。另外一个就是苏莱曼了。

泓君:我在这里稍微给大家划个重点,大家可以关注一下苏莱曼,他现在也是整个微软AI的负责人。

周健工:苏莱曼来自一个穆斯林背景的移民家庭。他父母很早就离异了,从小生活艰辛,但是人很聪明,他考上了牛津,学的是神学,上了两年就辍学了。之后就做一些小生意,开冰激凌铺,和我们谈的硅谷的创业完全不是一回事。他经常去哈萨比斯家玩,有时候哈萨比斯不在家,他就住在哈萨比斯那房间里,他就看哈萨比斯读的书。

哈萨比斯以前在游戏公司打工创业,手头大概有几百万英镑。苏莱曼喜欢做点小生意,就拉哈萨比斯谈两件事,一个是社会正义,第二个就是说我们怎么去做生意,就这样跟哈萨比斯建立了信任。

后来哈萨比成立公司,考虑到要融资,要经营,他觉得苏莱曼在这方面能帮他。所以最早的三个联合创始人,就是他们三个。哈萨比斯占了绝对多数的股份,是肖恩·莱格的9倍,苏莱曼的14倍。

第一笔天使融资,我觉得是最有意思的一个过程。你看什么样的人愿意投资DeepMind这家公司。如果是说伦敦有这么几个年轻人说我要造一个AGI,我相信在硅谷可能有一些人听得懂,在伦敦几乎是没有人能听得懂的。

但是他们还是在英国找到了一个愿意投资他们的人。那个人投资的动机非常有意思,他听了哈萨比斯讲的AGI这个事情之后,立刻认定,这是一架上帝需要的机器。所以那个人出于一种宗教信仰,投了几十万英镑。

另外一个愿意投资他的,是哈萨比斯在MIT做博士后研究时的指导教授,他非常欣赏哈萨比斯。他认为哈萨比斯将来是一定能获得诺贝尔奖的,而且他获得诺贝尔奖不是普通的人能获得的那种,一定是费曼和克里克那个级别的。当哈萨比斯跟他开口的时候,他说,我可以投你10万美元,我就这么多了。

04 从融资到被谷歌收购,哈萨比斯与硅谷资本的博弈

周健工:当然第三个最重要的投资人就是彼得·蒂尔(Peter Thiel)了。彼得·蒂尔他认为哈萨比斯是那种可以在科学上做出顶级发现的,但是在商业模式上完全不成立的那种人。彼得·蒂尔是一种“反共识”式的投资,所以叫逆向投资。他觉得这种人是需要投的。如果说世界上可能在一个遥远的未来,存在着一个AGI的话,那么能够做成这件事的这个人肯定就是哈萨比斯。不管怎么说,先投吧。

特别重要的是他手下一个叫卢克· 诺塞克( Luke Nosek)的合伙人。诺塞克一见哈萨比斯就认为,这个人就是跟马斯克一样的一个创业者。彼得·蒂尔就破例,给了他一个不上投决会表决的特殊的通道,才投了这家公司。所以你看,能投DeepMind的人都是非凡的人,他们的想法跟一般人非常非常不一样的。

泓君:Founders Fund投了DeepMind至少有三轮,最开始的230万美元的支票,这张支票占了接近于一半的股权。第二张是900多万的一张支票。三轮下来,Founders Fund在DeepMind这家公司的股份已经是超过三个联合创始人的所有的股份之和了。但是他在每个关键节点,还是会有很多犹豫。包括到后面他不愿意领投,其实是周凯旋的领投救了DeepMind最后一轮融资的。

主要原因还是Founders Fund一直在质疑他们如何商业化。我觉得跟这个机构的投资风格也是挺有关系的。就像您说的,他不需要上投委会,他可以自己做比较激进的投资方式,投一个不被大众看好的公司,只要这个方向是共识了,那他们就开始卖了。

周健工:我记得彼得·蒂尔决定卖的时候就是2013年了,那个时候AlexNet已经出来了。杰弗里·辛顿、伊利亚,还有Alex做的AlexNet,它在图像识别时候已经超过人类了,深度学习取得了突破。那个时候,深度学习或者整个AI就开始热起来了。彼得·蒂尔突然发现,硅谷的这些人才的身价开始迅速地上涨。他认为这是一个共识,共识就意味着泡沫,泡沫就意味着你要投入更多的钱去做一个更不确定的事情,这个又不符合他的投资理念了,他就决定不再追加了。

泓君:这个投资里面,其实还有一个很有意思的名字,就是周凯旋。他应该是帮李嘉诚管理他的家族基金的。他其实也是在当时,应该是哈萨比斯拿不到钱的时候,是非常关键的一个人。

周健工:对,最关键的B轮,DeepMind筹了2500万美元,周凯旋起到了非常重要的作用。

泓君:谷歌当时收购DeepMind是在一个什么样的背景下?

周健工:那是他的C轮,他融不到足够大的钱。哈萨比斯认为彼得·蒂尔背叛了他,这个时候马斯克就出场了。这里面有个逻辑特别有意思。因为肖恩·莱格,他参加了奇点大会,因为到了奇点大会,他认识了彼得·蒂尔,也知道埃隆·马斯克。埃隆·马斯克也在B轮承诺要投资500万美元。

因为谷歌投了SpaceX,埃隆·马斯克就整天跟拉里·佩奇他们就混在一起。有一次马斯克跟拉里·佩奇他们去看SpaceX发射,然后就坐同一架私人飞机上回加州,他们就谈起神经网络这个事情。拉里·佩奇的父亲也研究过神经网络。所以他对这个事情还是有一定敏感度的。

所以当时埃隆·马斯克一听,非常炫耀式地就说,你看,我们谈这个事情,我已经开始投资一家公司了,这家公司就叫DeepMind。拉里·佩奇听完之后,默默地掏出了安卓手机,在安卓手机上记下了这家公司的名字。没多久,哈萨比斯就收到了一个电子邮件,第一句话自我介绍说,我是谷歌负责对外投资的,一条线就串起来了。

在谷歌决定收购DeepMind的时候,中间又插出了Facebook的扎克伯格。当时AI火了起来,扎克伯格也很着急,也急于想找到一个团队来做这个事情。哈萨比斯和苏莱曼,用马斯克、用扎克伯格作为手中的牌来对付谷歌,希望能谈出更高的价钱,这是他们的博弈策略。

哈萨比斯非常聪明,我记得里面写了一段,扎克伯格邀请哈萨比斯去他家,两个人神侃。哈萨比斯就问,你觉得哪些技术的赛道非常好?扎克伯格就说了一大堆,AI、虚拟现实、增强现实、3D打印……我都非常看好。哈萨比斯听完就非常失望,一方面,AGI在扎克伯格眼中地位远远没有那么重要;第二个,他认为扎克伯格对未来技术是没有自己的判断的,所以他就告辞了,马上给拉里·佩奇打了个电话:我们继续谈吧。

泓君:这个细节我觉得非常的精彩。但是他最终没有接受Facebook的收购要约,还是因为他们提到的一个AI安全宪章的这件事情,对不对?

周健工:我觉得他一开始最认真考虑的还是谷歌。谷歌这家公司的文化和气质非常吸引他。他认为两个创始人是有科学家的情怀的,能谈得来的。另外,谷歌所谓那种“不作恶”的文化,其实跟他们提到AI的这个“安全”,实际上在当时是有契合点的。但是Facebook就没有这些东西。

我觉得他对Facebook那边一直是当一张牌来打的。书里面讲了一个细节就是,拉里·佩奇有一次约他出去散步,他说:“那你为什么不来谷歌呢?你的目标不是追求AGI吗?我已经在这里为你准备了一切。”这一句话真正打动了哈萨比斯。

接下来就是价钱了。在这之前,谷歌收购了杰弗里·辛顿师生三个人那个小公司(注:2013年3月谷歌收购了刚刚成立1个月、仅有3名员工的公司DNNresearch和AlexNet源代码)。DeepMind也参与竞购了,出了1000万去报价。当哈萨比斯出局之后,他立刻给杰弗里·辛顿打了一个电话,说,你的要价无论如何不能低于4000万。最后杰弗里·辛顿的团队4400万美元成交了,算下来平均一个人差不多1500万。

所以在谈卖DeepMind这家公司,和谷歌谈的时候,哈萨比斯就把前面这个交易价格作为参考就提出来。当时谷歌的报价,大概是这么算的,你们有30到40个世界顶级的AI研究人员,在当时情况下,我给你每个人1000万美元,也就是三四个亿。哈萨比斯就不干了,他说你看我们不能低于1500万美元,应该是五六个亿(注:这笔交易没有被官方确切披露过金额,大概是5亿到6.5亿美元之间)。后来真的是,这些核心技术人员的平均价格,确实是在1500万,而且谷歌对哈萨比斯这个人的定价大概是1.4个亿左右。

泓君:所以这是当时AI的人才价格,现在已经涨到1个亿了,对吧?

周健工:现在一个人1个亿。Facebook如果是抢了三四十个人,可能得花三四十个亿美元。

05 从围棋到蛋白质折叠:DeepMind掀起智力革命

泓君:接下来的一个大的节点,就是AlphaGo在首尔击败李世石,时间是到2016年。我们刚刚讲到谷歌收购DeepMind,差不多是在2014年左右。时间我们再拉回到两年以后,为什么他们会选围棋这样一个领域攻破呢?

周健工:谷歌在收购DeepMind之后,有一天哈萨比斯突然跟佩奇在讲,说我们将战胜围棋的世界冠军。然后对方就很吃惊地说,多长时间?他随口就说了两年。

被谷歌收购之后,他们整个的算力、人才各方面,都是当时全世界首屈一指的。他们一定找到一个世界上最难的游戏项目来攻克它,来证明自己是世界首屈一指的AI实验室。

另外,哈萨比斯他自己也在剑桥的时候学过一段时间围棋。我在采访哈萨比斯时候我专门问他了,他当时告诉我大概就是围棋一段的水平。他也知道围棋的难度远远比国际象棋要难,所以他选择这样一个目标。

泓君:所以选围棋核心是因为它难。我记得谷歌创始人像拉里·佩奇也很喜欢下围棋。当时他们说要在围棋上战胜人的时候,是没人相信的。因为你第一步、第二步、第三步,你每一步要增加多少种可能性。当时大家觉得以计算机现在的计算水平,感觉它是很难去穷尽所有的情况做到这样的一个技术的,在当时看来还是有一点点天方夜谭。

然后接下来还有一个AlphaFold,它是破解了困扰生物学界半个世纪的蛋白质折叠的难题。破解的时间是在2020年。2024年,哈萨比斯他其实是因为这个事获得了诺贝尔的化学奖。从围棋到蛋白质,这个跨越他是怎么发生的?

周健工:哈萨比斯他一直非常关注生命科学。他在伦敦大学学院计算神经科学读博士的时候,他注意到,有一位生物学家叫安芬森,他就提出蛋白质的结构是由氨基酸链构成的。而且自然界中大约只有20种常见的氨基酸链,如果能破解其中的密码,是有可能把蛋白质的结构全部破解出来的。这个事情触动了他,这个事情在他后来的十几年的过程中间,一直萦绕在他的脑海里。

书里面有一段讲了他在2016年,在汉城跟李世石下棋的时候,讲了他中间跟大卫·西尔弗谈起了这个事情,说我们现在把围棋给攻克了,下一个目标是不是蛋白质?而且特别有意思,两个人在谈的时候,旁边还围了一堆记者,他们私下里谈这些话居然被录下来了,这个事情也就传出来了。

他们为什么敢于做这个事?这时候有个叫戴维·贝克(David Baker)的生物学家,他知道蛋白质的折叠是有一定的规则的,他就做了一个叫Foldit(折叠它)的游戏,大家就可以去玩。全世界大概有几千个对这个领域比较熟悉的人,就非常喜欢玩这个游戏。后来他们又知道,世界上有一个蛋白质折叠的竞赛CASP。

马拉比笔下的哈萨比斯,最本质一个特点就是,玩什么游戏都一定要赢,而且哈萨比斯有这样一个自信,他说没有我玩不赢的游戏。他们觉得蛋白质的结构是由氨基酸的序列无穷无尽的组合构成的,它一定是一个序列的问题。所以他们就用了循环神经网络来解决。后来突然发现,它不是一个序列问题那么简单。因为氨基酸之间它们不仅仅是一个排序的问题,它们还有折叠、接触,比较复杂地纠合在一起。他们又觉得,这是一个图像识别的问题,所以他们又用了一个卷积神经网络,就用来解读它的图像,效果就好了一点。突然他们发现这个也不对。

这个时候他们引入了一个人,约翰·江珀(John M.Jumper)。詹珀发挥了一个特别决定性的作用,他决定转向机器学习,你有可能通过深度学习,将氨基酸的这个链映射到它们最终的折叠的架构上去,得到了哈萨比斯的支持。结果他们后来就一路开挂。2018年第一次参赛击败了97个团队,到2020年是AlphaFold 2的时候,得分92.4分,颠覆了整个的领域。决定AlphaFold 2的成功,其实就是他们最终采用的Transformer这个架构。

泓君:这段非常精彩。而且我们的播客过去两度就AlphaFold跟AlphaFold 2,我们都出过节目,讲它对整个生物学的意义,以及是如何解决这个困扰生物学界半个世纪的这些难题的。有兴趣的听众也可以往回听一听。

图片来源:www.nobelprize.org

06 DeepMind因何错失大语言模型?

泓君:后来在2022年底,OpenAI推出ChatGPT的时候,DeepMind它当时是一个什么样的状况?他们内部是什么反应?

周健工:这又回到刚才谈到的哈萨比斯和大卫·西尔弗对强化学习的执念。DeepMind研究的项目组合,哈萨比斯亲自讲过的。他给外人感觉是非常包容、非常跨学科的,但是他还是有先后顺序的。他第一,我们认为强化学习就是通向AGI的,这是我们的重中之重;第二,就是神经科学,向人的大脑学习;第三才是从数据中去归纳。而且大语言的模型是在数据归纳里面的一个分支。所以大语言模型是排在第三位里面的一个分支,足见他是非常不重视的。

这个时候,伊利亚到了OpenAI之后,他在研究上做出了一系列的突破。特别是在Transformer之后,伊利亚第一个就拉着一帮工程师,他说你必须依照这个给我做模型出来。所以有GPT-1、GPT-2。到GPT-2的时候,才引起了哈萨比斯他们的关注,但还不到重视。

这时候就有一些他们从OpenAI挖来的人,就不断地提醒他,你要重视大语言模型。一直到GPT-3出来的时候,才真的让他们警醒了。

泓君:你觉得在整个过程中,哈萨比斯犯的最大的战略性的错误是什么?

周健工:我觉得他有他固执的一面,不服输的一面。他一直不愿意承认,通向AGI的另外一条可能的道路是深度学习。他认为就是我强化学习。你看他当时的AlphaFold已经证明了,深度学习在AlphaFold里面其实是起到了比强化学习更大的一个作用。

但是他又藐视了语言。他一直认为,AGI一定是接地的,他认为语言是不接地的。当然伊利亚就反驳他这个观点,他认为语言里面间接地反映人类大量的接地的经验和逻辑,是通过语言反映出来的。这个其实他是不承认的。

还有一点,他们一直认为DeepMind应该是一家以科学研究为主的机构。但是他突然发现,通过不仅仅是科研而且是工程,不仅仅是模型而且是产品,不仅仅是只做研发而且这个商业,其实对于推进AGI所起到的作用是非常巨大的。如果你不让更多的人用它,你谈什么通用,都是没有意义的。

所以这些都是让哈萨比斯反思的地方。当然哈萨比斯没有放弃,他内心的那种,我认为是某种程度的一种孤傲。他对这个事情,他另外一个情绪是非常的愤怒。书里面也写了,他说他们把坦克开到了我们家草坪上了。他就觉得AGI这个地盘应该是我DeepMind的,你现在OpenAI居然搞出这么大的一个挑衅,我必须要反击。

泓君:在马拉比写整本书的过程中,我觉得DeepMind它虽然很强大,但它还是一个忍辱负重者。在2025年6月以后,整个形势发生了逆转。就从现在的情况来看,我们也可以说DeepMind它追上了。你觉得后面,它在追赶竞争对手的过程中间,谷歌进行了怎样的调整?它有哪些关键的策略?

周健工:我觉得第一个是,DeepMind和Google Brain的合并,是2023年4月份。当时谷歌内部进入了一个据说是危机的状态,连另外一个创始人谢尔盖-布林(Sergey Brin)都回来上班了,跟大家一起看代码、看数据、看模型。

有点有意思的说,Google DeepMind的CEO是哈萨比斯,不是杰夫·迪恩。所以也证明了,当初皮查伊不让它分离出去,一直认为它是一个战略性的棋子,总有一天要用上。这个时候真的就用上了。

还一个就是说,DeepMind内部的工作方式发生了变化,回到了以前DeepMind那种突击队式的工作方式,这样就可以把所有的资源给集中起来,攻克最前沿的大模型。就是谁在哪个模块、哪个环节取得了突破,就立刻内部公开,然后立刻给予采纳,就是完全透明的、高强度的攻关的这种方式。

另外以前很多人都在做各种各样的Blue Sky Research,所谓蓝天式的研究,他说这个要削减,即使是研究出来成果,也不及时发表了。

所以这几点还是证明了比较有效,所以就慢慢地又赶上了。

泓君:对,所以整体来说,一个是谷歌组织架构的大调整,然后是创始人的回归,然后给钱、给算力资源。整体上这些基本盘的事情做了,追上来也是很快的事情。

07 科学家的执念,将带我们去向何处?

泓君:事情发展到今年,就是我们录播客的这个时间,就像我开始说的,我觉得现在整个AI的能力就表现出让人恐惧。

其实在这本书里面他有提到,杰弗里·辛顿他自己一直在很多公开场合说,他觉得我们完了,他对AI是非常负面的看法,他觉得可能AI会毁灭人类。另一位图灵奖的得主本吉奥,他也发出了AI的末日警告。

但是哈萨比斯依然觉得,AI是人类有史以来最有益的一个技术。您怎么看哈萨比斯这个人?你觉得他是一个乐观主义者,还是一个被竞争裹挟的囚徒?

周健工:用最简单的一句话说,我认为他是一个好人。我跟他在交谈中我就感觉,这个人是一个天生的、最底色的东西是偏乐观的。他真正的理想还是科学发现。他身上有一种非常浓厚的英国科学革命和整个欧洲的这种人文精神。我觉得这是他跟硅谷的那些埃隆·马斯克、黄仁勋、山姆·奥特曼、甚至阿莫迪,都不一样的地方。

他还是相信AGI这个技术,它最终能够帮助人类,解决人类所面临的最重大的一些挑战。他认为除了AI之外没有别的办法。

至于杰弗里·辛顿和本吉奥的警告,我自己不太喜欢那种AI的末世论、AI威胁人类生存的这些论调。很多人批评他们这种所谓“奥本海默情结”,本质上是想夸大他们所发明的技术的威力。

泓君:对,还有我觉得对像哈萨比斯这样的顶级科学家而言,即使他知道AI的威力很大,我记得书里其实有一句话,就是讲为什么他还要研究这项技术,是因为“探索的乐趣”对他来说实在是太大了。我觉得这也是我在很多这个世界顶级的科学家身上看到的一种共同的特质,他们没有办法停止自己去探索、去创新。

周健工:对,在这本书的扉页,马拉比引用了冯·诺依曼在研制原子弹的时候写的一句话:我们知道这个威力太大,但是我们作为科学家,如果我们不履行我们的发现的天责,这是违背我们科学伦理的,但是一旦把这些产品的威力释放出来,我们可能成为世界上最被憎恨的人。就是体现了他们矛盾的这种心情。

泓君:我自己是觉得,马拉比对哈萨比斯的写法,有一点点过于好了。我鲜少看到他在一些关键事件、关键抉择的时候,展现的这个人的矛盾性。他很多的叙述,是在写哈萨比斯的思想是什么、想法是什么。但是人很多时候是可以在事成之后,给自己安一个光鲜亮丽的理由的。这一点我不知道你是怎么看的?

周健工:我觉得跟他的英国立场是有一定的关系的。马拉比是英国人。我认为哈萨比斯是英国的“国宝”。他在写自己的“国宝”的时候,倾向性会很自然地流露出来。而且你可以看到,他在书中谈到AGI的未来、对人类究竟是好是坏这个事情上,他其实非常地不相信硅谷那帮人的。他流露出一个倾向就是——哈萨比斯这样的人就在伦敦来引领AGI,可能代表了这个技术的未来。

泓君:我觉得一个人动人,他不仅仅是因为身上的优点,有的时候也是因为身上的缺点。你觉得哈萨比斯这个人身上是有矛盾点的吗?

周健工:我见他的第一印象,我就说他像一个普通的科研工作者,他不开口,你会觉得他是一个特别普通随和、与世无争的人。但是这本书里面就写到,他是一个非常争强好胜的人。他在任何智力游戏中,包括玩桌面足球、打扑克牌、象棋、双陆棋,他不玩则已,他一玩一定要战胜别人。他口口声声说,我不愿意控制别人,但是你一定要赢过别人,是不是另外一种控制呢?

泓君:我觉得这也是书中在反复讨论的一个议题。哈萨比斯也有一个类似于“绝地武士”这样的一种说服力,他同时也是口才非常好的。

周健工:我觉得他可以把所有的人给侃晕。他那种敏捷度和对你提问题的针对性,跨学科的逻辑的打通能力,我觉得在这个世界上很少有人能做到这一点。

泓君:今天整个的故事都非常的精彩。我觉得现在整个AI竞赛也开始白热化了,我们但愿我们聊的这样一个天才,他是一个好人,也希望在整个AI的构建过程中,这些人都是好人,而不是被资本绑架。

(编后记:在我们在录这期节目的时候,哈萨比斯总体上对AI的态度还是乐观的。但就在我们制作这期节目的几天,哈萨比斯也开始公开站出来,警醒AI带来的风险。他在一个AI峰会上说:“我们需要紧急关注,因为AI系统正在变得越来越自主,而且它一旦偏离了我们的预设轨道,后果可能会非常严重。当前国际的合作可能根本不够用。”这也呼应了我们在节目中提出的问题:一个科学家想用AI去理解宇宙,却发现自己可能亲手打开了潘朵拉的盒子。大家会如何去看AI带来的风险?欢迎在评论区讨论。)