15 岁那年,他就把这条路看完了
“There is a common thread — or maybe I made it into one. But I’ve known what I was building toward since I was a teenager.”
象棋神童、十七岁开始做游戏、神经科学博士、DeepMind 创始人 — 这四段履历,外人看是四件事,他自己心里只有一件。早在十几岁,他就认定 AI 是这辈子最值得做的事。后面读什么专业、进什么公司、做什么项目,全是冲着 DeepMind 来的。
做游戏看着像绕路,其实不是。九十年代真正在用最前沿技术的就是游戏行业 — 第一代 GPU 是给图形渲染做的,那时候没人想过它后来会被用来跑矩阵乘法。游戏要做实时 simulation,要把 AI 写进玩法。他 17 岁写的 Theme Park 里有上千个小人,每个都有自己的偏好,这游戏卖了 1000 万套。但他自己记住的不是这个数字 — 是普通玩家跟那些 AI 玩起来时被逗乐的样子。
再往后去读神经科学,他不是为了神经科学本身,是想从大脑里找点算法上的灵感;同时也提前给自己准备好一件工具 — 等以后真把"那种东西"造出来了,他知道该怎么去研究它。等 DeepMind 开张那天,这副牌他其实早就攒齐了,剩下的只是当众一张张摆出来。
“You want to be five years ahead. Not fifty.”
在 Elixir Studios,他做过一款叫 Republic 的游戏 — 想在一台 Pentium 上模拟一整个百万人口的国家,那是 90 年代末。结果就是太超前了,整个工作室赔了进去。他从这件事带走的判断是 — 一件事大家都看得见的时候,你已经晚了;一件事还要 50 年才能落地的时候,你又根本够不到。中间这个窗口很窄,但你必须瞄着它。
守着一个秘密 — 2009
“Academia rolled their eyes when we said ‘AGI.’ We figured — if we fail, at least we’ll fail in an original way.”
DeepMind 在 2009 年的那场赌,不是押在某一个想法上,是押在四件事上 — 这四件事在当时都不流行,回头再看才发现都是常识:
Deep learning
Hinton 那一拨人刚把它跑通,但学术界、工业界基本都没当回事。
Reinforcement learning
当时是 AI 里另一个孤立的角落。Demis 的判断很笃定 — 把它跟 deep learning 拼到一起,能 scale,而且能一路 scale 到 AGI。
Accelerated compute
GPU、后来的 TPU。整个显卡产业即将变成"智能"的物理底座 — 它自己当时还没意识到这件事。
Brain principles
计算神经科学给的不是公式,是直觉 — 比如那条"RL 一路能把人送到 AGI"的判断。
An original failure mode
九十年代搞 expert systems 的那拨人是认认真真失败过的。如果 DeepMind 也要失败,至少会以一种不一样的方式失败 — 光这一点就值得赌一把。
他到现在还能一字不差地复述当年的 mission statement: “Step one — solve intelligence. Step two — use it to solve everything else.” 16 年过去,他还在做 Step One。他自己估,Step One 现在大概走完了 75%。
“We thought it would be a 20-year mission. We’re basically exactly on track.”
当年定的就是 20 年。今天回头看,差不多卡着这个时间点在走。绕一层去做 — AI for Science
“My personal mission was always to advance science. Building AGI was the meta way to do it.”
这是 DeepMind 自打第一天就有的那个结构性想法。如果你想在某个学科里做出真正的突破,你有两条路 — 盯着一门学科死磕,或者,造一个最终能撬动每一门学科的工具。Demis 走的是后一条 — 先把杠杆造出来,回头再去搬石头。
DeepMind 的 AI for Science 部门是首尔回来的第二天就成立的 — AlphaGo 那场比赛之后,正好就是 10 年前的这个月。AlphaGo 给的信号很清楚: 算法终于够 general 了。一旦它够 general,它能干的最重要的事就再也不是下棋了。
AlphaFold 解决的是蛋白质 3D 结构预测 — 一个搁了 50 年的难题。但形状只是第一步。Isomorphic Labs 是自然的下一层: 去设计真正能精确结合到目标蛋白靶点的分子,而且不结合到别的任何地方。理想是把 99% 的药物发现搬进电脑里跑,把 wet lab 留给它真正擅长的最后一步 — 验证。这条路一通,10 年就压成了几天。
实验室还没在做的“新科学”
“Will AI eventually create entirely new sciences, the way thermodynamics fell out of the industrial revolution?”
Demis 的回答是会,而且他给了两种具体的样子。
第一种新科学,是研究 AI 自己。 我们正在造的这些东西,过不了多久复杂度就跟人脑一个量级了 — 它得有自己的学科。Mech interp 是其中一部分,但远远不止。神经科学搞了一个世纪,我们对大脑的理解都还差得远;凭什么觉得一个季度就能把万亿参数的网络看明白?
第二种新科学,是把 simulation 当成方法。 经济学这些"社会科学",按物理学的标准不算硬科学 — 不是因为它们不严肃,是因为你没法在它们身上做对照实验。央行加息半个点这件事,真实世界里只能加一次,加完之后大家花十年争论这一下到底起了什么作用。
但如果你能学出一个足够准、可以反复采样的 simulator — 不是带闭式解的玩具模型,而是真的能把现实里那些乱糟糟的动态全部捕捉下来的那种 — 那一瞬间,你就可以把"加息半个点"这件事跑一万次再做决定。整个学科的认识论都会变形状。
- Weather Next. DeepMind 用 ML 学出来的天气模型,现在比气象学家自己用的物理模型都更准,还快得多。
- Virtual cell. 把生物 — 一个典型的 emergent dynamical 系统 — 装进模型里,让人能用计算的方式去审讯它。
- 经济、气候、生态. 凡是“信号弱、维度高、没现成数学公式、真实世界又只能跑一次”的领域。
“ML is the right description language for biology, the way math was for physics.”
物理之所以能用数学写下来,是因为它的系统干净,几个符号就装得下。生物不是。社会科学也不是。它们 emergent、动态、布满人脑装不下的弱关联。ML 是有史以来第一种宽到能装下它们的描述语言。
更进一步 — 一旦你有了学好的 simulator,也许有一天你能反过来从它身上抽出 explicit equations。一个新的 Maxwell,从权重里钓出来。
宇宙的底色,是 information
“Energy and matter are interconvertible — Einstein settled that in 1905. I think information has the same kind of equivalency. And of the three, it’s the most fundamental.”
这一段离日常的产品最远,但要看懂 Demis 在干什么,这一段最重要。
1920 年代的物理学家把物质和能量摆在宇宙最底层。Demis 想把这一层翻过来。所有抵抗熵的结构 — 生物、大脑、文明 — 本质上都是在做 information processing。如果 information 才是这三个可互换量里最底层的那个,那 AI 就不是又一项普通技术 — 它是直接作用在宇宙真正底色上的那一种。
“Somehow we’re reading the language of the universe.”
说到底,我们好像是在“阅读宇宙的语言”。跟这个想法配套的,叫 Turing’s Champion。一台经典的 Turing machine — 换上现代的衣服就是神经网络 — 居然能搞定那些我们一直以为非 quantum computation 不可的事情。蛋白质折叠就是证据: 水分子键怎么作用、那些小尺度的量子效应 — 所有让这个问题看起来"不可解"的东西 — AlphaFold 在 classical substrate 上全部近似过去了。这不是定理,是一个存在性证明,但它已经把先验改了 — 很多我们以前归到“非量子不可”那一档的问题,可能根本不需要量子。
先把工具造出来。意志的事,回头再说。
“Build the tool. Cross the rubicon that already matters. Then, with the tool in hand, face the questions you couldn’t face before.”
被问到“AI 什么时候不再是 tool、变成另外的东西”,Demis 的回答出奇地谨慎。他认为对的顺序是 — 先造一个无比聪明、无比精准的工具,这一步过了,已经是一道很深的鸿沟。再往后才是更难的那几道: agency、consciousness、experience。
他笃信的一件事是: 大家说“意识”时挥手指的那些东西 — self-awareness、self/other 的边界、跨时间的连续性 — 都是必要不充分。光看行为,永远关不上这道闸。
我们为什么从来不会争论“别人是不是有意识”
我们之所以默认其他人有意识,靠的是两件事: 行为上你看着像有意识,加上 substrate 上你跟我跑在同一种生物硬件上。剩下的事 parsimony 帮你做完。
但对一个 artificial system,行为这一半你可以让它对得上 — substrate 这一半永远对不上。所以哪怕一个 agent 已经足够 agentic,“它真的在体验什么吗”这道闸也许永远关不上。行为上能验证,体验上我们大概只能带着这个问题继续活下去。
这件事他生前最常聊的对话伙伴是 Daniel Dennett。Demis 的希望是 AGI 自己能成为一个更好的透镜 — 我们造出来的工具,反过来帮我们把“意识”这件事定义得比过去 2000 年的哲学更清楚一点。
Kant 与 Spinoza,并排放
“Kant: the mind constructs reality. Spinoza: doing science is reading the universe. Demis takes one from each.”
从 Kant 那儿,他取的是“为什么研究大脑这件事重要”: 如果心智是组装我们所体验到的那个世界的装置,那要理解 reality,你就得先理解那台装置。这条线是他神经科学博士论文的暗线。也是为什么他特别在意 AI 的 interpretability — 装置已经换过了。
从 Spinoza 那儿,他取的是态度。做 science 不只是 engineering 或 business — 它有一种近乎宗教的东西在里面: 你试着把宇宙的语言学回来,再说回去,去跟它的结构产生接触。AI 在他看来,不过是这门语言最新的一种方言。
快问快答
四个短答案。每一个都告诉你一件他在长答案里不会说的事。
加起来是什么
“走完四分之三”意味着 — 接下来这五年,跟过去那五年不会是一回事。
整段论证总结起来一句话: 2010 年定的 20 年计划,今天我们是第 16 年,还在轨道上,还剩 5 年。那些重大的开放问题 — 医学、材料、社会科学想成为真正的 science — 卡住的从来不是道德或政治,是 algorithmic。算法现在终于来了。
药物研发会先垮 — 因为它最干净,本质就是一个有验证终点的 search problem。然后是整个生物学,靠 virtual cells。然后是 economics、climate、ecology — 所有那些因为 emergent、因为只能跑一次,长期抗拒分析的领域。变化的形状不是“产能提高 X%”,是真正意义上的新的 science 在出现。
而这一切的底下,是一个安静的形而上断言 — information 比 matter 或 energy 更底层。如果它成立,那这件事就不是一个产业,是物理学的延续。
“The next five years aren’t a roadmap. They’re a deadline.”
接下来这五年,不是 roadmap — 是 deadline。