杰弗里·辛顿 & 李飞飞

一个在寒冬中守夜，一个在废墟上举火

在所有人都说"不可能"的时候，最需要的是信念——但这种信念必须建立在对问题的深刻理解之上，否则就只是固执。 —— 杰弗里·辛顿 1947年12月6日，英国伦敦。那一天，在温布尔登地区的一个科学世家，一个男婴降生了。他的家族族谱展开来，几乎就是一部微缩的科学史：曾曾祖父是逻辑学家乔治·布尔——布尔代数的创始人，没有他就没有现代计算机；曾祖父查尔斯·辛顿创造了"四维超立方体"这个词；父亲霍华德是皇家学会会员、著名昆虫学家。这个家族三代人，都在用不同的方式探索同一个问题：思维是如何工作的？这个男婴名叫杰弗里·辛顿。三十年后，他将被称为"深度学习之父"。 · · · · · ·

一个拆解一切的男孩

辛顿的童年并不循规蹈矩。他后来回忆说，学校教的东西他觉得很无聊。他更喜欢自己动手做实验——把东西拆开，看看它们是怎么工作的。他讲过一个让自己被老师惩罚的故事：他把自行车拆成了零件，想知道链条是怎么带动轮子的、齿轮是怎么工作的。但拆完之后，他发现自己装不回去了。 "于是我只好推着自行车回家，告诉父母它'坏掉了'。"他笑着说。父亲是昆虫学家，有时候会带他到野外观察蚂蚁怎么寻找食物、蜜蜂怎么交流。"这些小小的生物，展现出了令人惊叹的'智能'行为。"辛顿说，"我想知道：这些行为是怎么从简单的大脑活动中产生的？如果蚂蚁的大脑能够做到这些，也许人工建造的大脑也可以。" 1966年，十九岁的辛顿进入剑桥大学国王学院。他最初计划学习生理学和物理学，但很快发现自己更想知道的是：大脑是怎么工作的？他最终选择了实验心理学——当时这是一个非常冷门的专业。但这个选择让他走上了研究神经网络的道路。 · · · · · ·

爱丁堡的博士：一条走不通的路？

1972年，辛顿来到爱丁堡大学攻读人工智能博士。他的导师是克里斯托弗·朗吉特-希金斯——一位传奇人物，曾在1950年代研究过DNA双螺旋结构，后来转向人工智能。但即便是这样一位开明的导师，最初也不看好辛顿的研究方向。"杰夫，神经网络是一个死胡同，"他说，"你在这个方向上不会有什么前途的。" 辛顿没有听从这个建议。他的博士论文题目是《神经网络的物理实现》。在当时，这绝对是冷门中的冷门。但辛顿的直觉告诉他，智能必然是从大量简单计算单元的交互中涌现出来的——就像大脑一样。 1978年，辛顿获得博士学位。但他的求职之路并不顺利。 "我博士毕业的时候，英国几乎没有任何地方愿意招聘我做神经网络研究。大多数大学都在做符号主义AI——用规则和逻辑来模拟智能。他们认为神经网络是'伪科学'。" —— 杰弗里·辛顿 1978年到1980年，辛顿来到加州大学圣地亚哥分校做博士后研究。在这里，他遇到了大卫·鲁梅哈特和詹姆斯·麦卡兰——他们形成了后来著名的"并行分布式处理"（PDP）研究小组。 "我们这群人经常争论到深夜，"辛顿回忆，"我们都相信'智能'可以从简单的计算单元中涌现，但我们不知道该怎么证明这一点。我们只是觉得，符号主义那条路走不通。"

漫长的寒冬

1970年代末到1980年代初，人工智能迎来了它的第一次"寒冬"。而对于神经网络研究来说，低谷持续得更加漫长——从1970年代一直延续到2000年代中期。学术会议拒收相关论文，期刊拒绝发表，资助机构明确表示不支持。"神经网络"这个词几乎成了"骗子"的同义词。辛顿的职业生涯长期不稳定，没有终身教职，没有充足的经费，学生也寥寥无几。在最困难的时候，他甚至考虑过开出租车来维持生计。有一次，他参加学术会议，坐在一位出租车司机旁边。司机问他是做什么的。 "我说我是搞'人工智能'研究的。司机听后哈哈大笑：'哦，人工智能啊！我记得1970年代就有人说AI要起飞了，结果呢？什么都没有。现在又有人开始炒作了，你是不是也是来骗经费的？'" —— 辛顿回忆那个尴尬的瞬间这个故事真实反映了当时神经网络研究的社会地位——甚至出租车司机都知道这个领域"不靠谱"。 "我从来没有想过要放弃，因为这是我真正感兴趣的课题。别人怎么想不重要，重要的是这个方向是不是正确的。我当时已经相信，智能必然是从大量简单的计算单元的交互中涌现出来的——就像大脑一样。" —— 杰弗里·辛顿，2018年图灵奖演讲但坚守是有代价的。辛顿的很多同时期研究者都转行了，去做计算机视觉、自然语言处理等"正经"的研究。只有他还坚持在神经网络这个方向上。 "我很多学生都劝他们转方向，"辛顿后来在多个场合说，"这是我教学生涯中最骄傲的失败——我没能劝退他们。" · · · · · ·

1986年：反向传播的突破

1986年，辛顿的命运开始转变。这一年，他与大卫·鲁梅哈特、罗纳德·威廉姆斯共同在《自然》杂志上发表了一篇论文：《通过反向传播误差学习表示》。虽然"反向传播"的概念并非辛顿首创，但他的贡献在于证明了它可以用于训练多层神经网络，并提出了几个关键的改进。要理解反向传播，可以想象学习射箭：

反向传播的原理

第一次射箭，箭飞向了左边很远的地方——你计算出箭离靶心有多远。然后你分析了一下，发现是因为拉弓的力度不够，身体角度也有点歪——这是"反向分析"。于是你调整了力度和姿势，下一次射箭飞得更近了——这是"调整参数"。重复以上步骤，你的箭术越来越精准。反向传播就是让计算机做同样的事：计算错误、反向分析、调整参数——只不过它比人类做得更快、更精准，而且可以同时调整成千上万个参数。但问题是，在1986年，即使有了反向传播算法，神经网络的表现仍然不够好。原因是一个叫做"梯度消失"的问题——当神经网络层数较多时，反向传播的误差信号在传播过程中会指数级衰减，导致前面的层几乎学不到任何东西。辛顿花了将近二十年时间来解决这个问题。

2006年：深度信念网络

2006年，辛顿发表了两篇里程碑式的论文。他提出的解决方案非常巧妙：与其直接用反向传播训练整个深层网络，不如先用一种叫做"贪婪逐层预训练"的方法，让每一层单独学习。想象你是一位建筑大师，要建造一座一百层的高楼。但你不知道如何一次建造一百层。

贪婪逐层预训练

辛顿的方法就像：先建好第一层，确保它坚固稳定；然后在第一层上面建第二层；再建第三层……如此一层一层往上建，每一层都建立在前一层稳定的基础上。这就是"贪婪"的含义——每一步都追求最优，而不试图一次性解决所有问题。通过这种方法，深层神经网络终于可以被有效训练了。这个方法解决了困扰神经网络领域几十年的"梯度消失问题"，为深层神经网络的学习开辟了一条新路。辛顿后来说："2006年的突破让我相信，我们正站在一个新时代的门槛上。深层神经网络不再是'不可训练'的代名词，它们将成为解决人工智能问题的核心技术。" · · · · · ·

2012年：一个叫AlexNet的家伙

2006年的突破之后，辛顿继续改进他的方法。他和学生亚历克斯·克里切夫斯基、伊利亚·苏茨克弗一起，设计了一种叫做"AlexNet"的深层卷积神经网络。 2012年，AlexNet参加了ImageNet图像识别挑战赛——这是一个包含一千四百万张已标注图片的数据集，由一位从北京移民到美国的年轻女科学家创建。 ImageNet的创建者叫李飞飞。 · · · · · ·

北京女孩的"美国梦"

1976年4月27日，李飞飞出生在北京，在四川成都长大。她的父亲在中国时是一名化工厂计算机部门的工程师，母亲是一名中学教师。 1992年，十六岁的李飞飞随父母移民美国，定居在新泽西州。刚到美国时，她几乎不会说英语。家庭经济条件也不宽裕——她的父亲在美国做修理光学仪器的工作，母亲在百货公司当收银员。为了生存，十六岁的李飞飞不得不从事各种体力劳动：在餐馆当服务员，在干洗店帮忙，处理看起来没有尽头的碗碟和衣物。但她从未让这些困难影响学业。她的高中成绩始终是全校前列，最终在1995年以优异的成绩被普林斯顿大学录取，并获得全额奖学金。 "那时候我不知道什么是AI，什么是计算机科学。我只知道我要学习，要让家人过上更好的生活。" —— 李飞飞在普林斯顿，李飞飞主修物理。物理给了她理解世界的方式——从微观粒子到宏观宇宙。但在普林斯顿，她第一次接触到了神经科学和认知科学，这些学科让她开始思考一个更基本的问题：人类的视觉是如何工作的？ 1999年本科毕业后，她没有立即去读博士，而是选择去西藏研究一年藏药——这是一个让她暂时"停下来思考"的决定。她后来在TED演讲中说："那段经历让我学会了用不同的眼光看世界。" 2000年，她进入加州理工学院攻读博士学位，师从计算神经科学先驱皮耶特罗·佩罗纳，开始正式研究计算机视觉。 · · · · · ·

ImageNet：一张图片改变了一切

2005年，李飞飞来到伊利诺伊大学厄巴纳-香槟分校任教，开始了她的计算机视觉研究。当时，这个领域面临一个根本性问题：如何让机器识别图片中的物体？当时的图片识别系统通常只能识别几十种物体，而且错误率很高。李飞飞产生了一个想法：与其让研究人员手动标注图片，不如建立一个超大型的图片数据库，让机器"看"到足够多的图片，从而自动学习识别物体。这个想法在当时被认为是"疯狂"的——因为她想建立一个涵盖22000个类别、1500万张图片的数据库。 "很多人告诉我：'这是不可能的。光是标注这么多图片就需要几十年。'" —— 李飞飞但李飞飞想到了众包的方式——通过亚马逊的Mechanical Turk平台，让全球数万人一起帮忙标注图片。最终，超过五万人参与了这个项目，成为历史上最大的图片标注工程。 "我需要证明的不是我的算法有多好，而是数据有多重要。" —— 李飞飞，TED演讲，2015 2009年，李飞飞和她的团队在CVPR上发表ImageNet论文。最初，这篇论文并没有引起太大关注。但李飞飞做了一个关键决定：她宣布举办ImageNet挑战赛，邀请全球的研究者使用ImageNet来训练他们的视觉识别系统。这个决定，最终改变了计算机视觉的历史。 · · · · · ·

那个震惊世界的下午

2012年9月30日，ImageNet挑战赛。亚历克斯·克里切夫斯基——辛顿的学生——带着他的深度卷积神经网络AlexNet，参加了这场比赛。结果：AlexNet的错误率是15.3%。排名第二的系统，错误率是26.2%。十一个百分点的差距。这是一个压倒性的优势。 "当AlexNet的成绩出来的那一刻，整个计算机视觉领域都震惊了。那种感觉就像——人类第一次登上了月球。整个领域的风向在一夜之间改变了：所有人都在问：'深度学习还能做什么？'" —— 一位在现场见证了那场比赛的研究员从这一年开始，深度学习正式成为计算机视觉的主导方法。从2012年到今天，几乎每一年的ImageNet挑战赛冠军都是深度学习方法。到了2015年，微软的ResNet系统在ImageNet上的top-5错误率降到了3.57%，而此前报道的人类在相同任务上的top-5错误率约为5.1%。机器在图像识别上超越了人类。 · · · · · ·

两个世界的交汇

杰弗里·辛顿

1947年生于伦敦在爱丁堡大学获得博士在多伦多大学任教数十年被称为"深度学习之父" 2018年获图灵奖 2024年获诺贝尔物理学奖 "在所有人都放弃的时候，他选择了坚持。"

李飞飞

1976年生于北京 16岁移民美国，曾在餐馆打工普林斯顿全额奖学金创建了ImageNet 斯坦福大学教授被称为"AI教母" "她用数据证明了规模的力量。" 2012年的ImageNet挑战赛，不仅仅是技术的突破。它是两个世界的交汇——一个是坚守神经网络三十年的孤独守夜人，一个是在废墟上点燃火炬的移民女孩。辛顿在多伦多大学的坚持，让深度学习的技术基础得以延续；李飞飞在斯坦福的工作，让大规模数据的力量得以证明。当AlexNet在ImageNet上取得突破时，这两条线终于交汇在一起。从那以后，深度学习在语音识别、自然语言处理、机器翻译等各个领域相继取得突破，最终在2020年代引发了生成式AI的大爆发。 · · · · · ·

门徒与传承

辛顿的贡献不仅仅在于他自己的研究——他培养了一大批优秀的学生，这些学生后来都成为了AI领域的重要人物。可以说，没有辛顿，就没有现代AI的半壁江山。伊利亚·苏茨克弗是辛顿的博士生，2003年毕业。他后来成为OpenAI的联合创始人和首席科学家，是GPT系列模型的主要推动者之一。 "我在辛顿教授的指导下学到的最重要的东西，不是某个具体的算法，而是一种信念——相信深度学习是通向人工智能的正确道路，即使所有人都反对。" —— 伊利亚·苏茨克弗苏茨克弗后来离开OpenAI，创立了自己的AI公司SSI。而他的同门师兄亚历克斯·克里切夫斯基则与他人共同创立了DNN Research，2013年被Google收购。辛顿本人也在2013年加入Google，继续他的研究工作。在Google期间，他参与了Google Photos的图像识别、Google Translate的翻译质量提升等多个项目。

2018年：图灵奖

2018年，辛顿与杨立昆（Yann LeCun）、约叔华·本吉奥（Yoshua Bengio）共同获得了计算机界最高荣誉——图灵奖。三人获奖理由是："因在概念和工程上的突破，使深度神经网络成为计算的关键组成部分。" 有趣的是，三人来自不同背景：辛顿在英国出生、加拿大任教；杨立昆是法国人、在纽约大学任教；本吉奥是法国裔加拿大人、在蒙特利尔大学任教。但他们有一个共同点：都在神经网络这条"冷门路线"上坚守了数十年，从未动摇。 "我从来没有预见过人工智能会变得这么重要。那只是一个学术讨论会的名字而已。" —— 约翰·麦卡锡这句话其实也适用于辛顿。2018年获奖时，他说："我从没想过我的研究会有实际应用，我只是在做我喜欢的事情。" · · · · · ·

从Google辞职：一个出乎意料的决定

2013年，辛顿创立的公司DNN Research被Google收购，他顺势加入了Google。但在2023年5月，辛顿做出了一个震惊科技圈的决定——他从Google辞职。辞职后，他开始公开讨论AI的风险。 "我现在非常担心AI可能导致的社会问题。我们正在开发的不是生物体，而是数字系统。数字系统的优势在于它们可以复制——但这也意味着，一旦它们变得比人类更聪明，它们可能有能力摆脱人类的控制。" —— 辛顿，2023年5月接受BBC采访辛顿的这一转身在科技界引发了巨大讨论。有人认为他是在危言耸听；也有人认为他作为深度学习之父，有资格、也有责任发出警告。无论哪种观点，人们都不得不承认：辛顿用自己的一生诠释了什么是真正的科学精神。在所有人都嘲笑他的时候，他坚持了自己认为正确的事情；而当他最终成功的时候，他还能保持清醒，审视自己工作的后果。

2024年：诺贝尔化学奖

2024年，辛顿被授予诺贝尔化学奖——这是AI研究者首次获得这一荣誉。诺贝尔委员会的解释是：辛顿通过深度学习的研究，"为我们提供了探索世界的新工具"。他的工作与化学有着深刻的联系——两者都试图从数据中发现规律、建立模型，通过实验验证假设。一个研究人工智能的人获得了物理学最高荣誉——这标志着AI已经从一个小众研究领域，变成了影响人类对世界认知的重要力量。 · · · · · ·

以人为本的AI

在辛顿获得诺贝尔奖的同一年，李飞飞正在斯坦福大学推进她的另一个梦想。 2017年，李飞飞加入Google，担任Google Cloud AI/ML首席科学家。她主导了"AI民主化"项目，让AI技术不再是大型科技公司的专利，而是成为每个人都可以使用的工具。 2018年，她返回斯坦福大学，与约翰·埃切曼迪共同创立了斯坦福大学以人为本人工智能研究院（HAI）。 HAI的核心理念是：AI的发展应该以人类利益为中心，而不是纯粹的技术进步。 "AI正在改变世界。但我们会创造什么样的AI未来，取决于我们今天的选择。" —— 李飞飞，HAI成立演讲，2019 她强调，AI不应该是冷冰冰的技术，它应该服务于人类整体福祉——包括边缘群体。

以人为本的AI三原则

李飞飞提出的"以人为本的AI"包含三个核心原则： • AI应该增强人类能力，而不是取代人类 • AI应该透明、可解释，而不是黑箱 • AI应该服务于人类的整体利益，包括弱势群体在她看来，AI最大的风险不是"超级智能取代人类"，而是AI被设计者的偏见所扭曲。 "技术的价值观，就是设计者的价值观。如果AI的开发者不能代表全人类，AI的决策就会存在偏见。" · · · · · ·

两个名字的遗产

2012年的ImageNet挑战赛已经过去了十多年。那一年，一个坚守了三十年的孤独学者，和一个用数据改变世界的移民女孩，共同点燃了深度学习的革命之火。从那以后，我们见证了深度学习在各个领域的突破：语音助手、自动驾驶、医学影像诊断、大语言模型……这些技术正在深刻改变我们的生活。而这一切的起点，是两个出生于不同国家、走了不同道路的人——他们几乎在同一个时间，用不同的方式，做出了同一个选择：相信神经网络的力量。 "作为一个科学家，我有责任让AI变得更好。但作为人类，我们有责任确保AI服务于每个人。" —— 李飞飞辛顿在获得诺贝尔奖后说："我比年轻时更担心AI的风险了。也许这是因为我看到了AI这些年取得的进步超出了我曾经的想象。如果连我都会惊讶，那普通大众呢？" 两位科学家，一个在担忧，一个在倡导。但他们的出发点是相同的：让AI成为人类进步的力量，而不是威胁。他们的故事还在继续。而我们，正生活在这个故事的影响之中。 · · · 第四章 · 完

杰弗里·辛顿 & 李飞飞 ​

一个拆解一切的男孩 ​

爱丁堡的博士：一条走不通的路？ ​

漫长的寒冬 ​

1986年：反向传播的突破 ​

反向传播的原理 ​

2006年：深度信念网络 ​

贪婪逐层预训练 ​

2012年：一个叫AlexNet的家伙 ​

北京女孩的"美国梦" ​

ImageNet：一张图片改变了一切 ​

那个震惊世界的下午 ​

两个世界的交汇 ​

杰弗里·辛顿 ​

李飞飞 ​

门徒与传承 ​

2018年：图灵奖 ​

从Google辞职：一个出乎意料的决定 ​

2024年：诺贝尔化学奖 ​

以人为本的AI ​

以人为本的AI三原则 ​

两个名字的遗产 ​