第三章

弗雷德里克·贾里尼克 —— 统计语音识别之父

一个从布拉格走来的"跨界移民"

1932年11月18日弗雷德里克·贾里尼克出生于捷克斯洛伐克克拉德诺（Kladno） 1949年 16岁时随家人移民美国 1956年获得麻省理工学院电子工程学士学位 1958年在麻省理工学院获得电子工程硕士学位 1962年在麻省理工学院获得电子工程博士学位 1964年加入康奈尔大学任教 1972年加入IBM沃森研究中心，从事语音识别研究 1993年加入约翰·霍普金斯大学，领导语言与语音处理中心 1997年获得IEEE信号处理学会奖 2010年9月14日在佛罗里达州科勒尔盖布尔斯去世，享年78岁

📋 弗雷德里克·贾里尼克 (Frederick Jelinek)

出生 1932年11月18日，捷克斯洛伐克克拉德诺（Kladno）逝世 2010年9月14日，佛罗里达州科勒尔盖布尔斯国籍美国（原捷克斯洛伐克）领域计算机科学、语音识别、自然语言处理 "每解雇一名语言学家，语音识别系统的性能就会提升。" **来源：**贾里尼克的生平信息来源于IEEE历史文献、约翰·霍普金斯大学官方纪念页面、以及《自然》杂志讣告。

童年：在战火中颠沛流离

1932年11月18日，弗雷德里克·贾里尼克出生在捷克斯洛伐克小镇克拉德诺（Kladno）。

🌍 战争的阴影

贾里尼克的童年并不平静。他出生时，捷克斯洛伐克还是一个独立的国家。但仅仅几年后，1938年的《慕尼黑协定》将这个国家推入了灾难的深渊。 1939年3月，纳粹德国占领了捷克斯洛伐克。犹太家庭开始遭受迫害。二战期间，贾里尼克的父亲——一位医生——被关入泰雷津集中营，并最终在那里去世。全家人在战火中苦苦挣扎，但贾里尼克幸运地活了下来。 1949年，16岁的贾里尼克随家人移民美国——这成为他人生的转折点。在战火中长大的少年，不会说英语，带着东欧口音，最终却成为了改变人类语言处理方式的关键人物。 **关于战时经历：**贾里尼克在二战中的经历相对少被详细记录。根据他后来的回忆，移民美国是他人生中最重要的选择之一。他在自传中写道："美国给了我第二次生命。"

MIT岁月：从工程师到研究者

移民美国后，贾里尼克展现出了惊人的学术天赋。

🎓 22岁的博士

1956年，24岁的贾里尼克从麻省理工学院（MIT）获得了电子工程学士学位——这已经够快了，但更惊人的还在后面。 4年后的1958年，他获得了MIT的电子工程硕士学位；又过了4年，1962年，30岁的他终于获得了MIT的电子工程博士学位。在MIT期间，他师从著名的电子工程学家罗伯特·福塞特（Robert Fano），研究方向是信息论。信息论——这个由克劳德·香农在几年前刚刚建立的学科——将成为贾里尼克一生最重要的思想武器。

🔬 从通信到语音：一个意外的转向

博士毕业后，贾里尼克最初的研究方向仍然是电子工程和通信理论。他在IBM的一份临时工作，最终改变了他的人生轨迹。 1960年代中期，他开始接触语音识别问题。当时的语音识别研究主流方法，是让语言学家设计复杂的规则系统——告诉计算机"什么是词"、"什么是音"、"什么语法是对的"等等。但贾里尼克是搞信息论的。他看到了一个不同的角度：语言，能不能被当作一种信道来编码和解码？ 这个看似简单的想法，最终颠覆了整个语音识别领域。

"语言不是一套规则，语言是一种信息。" —— 弗雷德里克·贾里尼克

IBM时期：用统计方法颠覆语音识别

1972年，贾里尼克加入了IBM的沃森研究中心（Watson Research Center），在这里，他开始真正改变语音识别领域。

💡 一个革命性的想法

当时的语音识别系统主要依赖"规则"：语言学家编写语法规则、词典、发音规则，系统根据这些规则来识别语音。但贾里尼克提出了一个完全不同的思路：统计。 他的核心观点是： • 不需要告诉计算机"什么是对的" • 只需要给计算机大量的例子（语音数据和对应的文本） • 让计算机自己"学习"语言规律这听起来很简单，但背后的数学支撑——贝叶斯定理、隐马尔可夫模型——需要深厚的理论基础。而贾里尼克，恰恰两者兼备。

🧠 什么是隐马尔可夫模型（HMM）？

隐马尔可夫模型是贾里尼克革命的核心工具。简单来说： • 语音可以看作是一个"隐藏状态"（我们要说的词）通过某种概率分布产生的"观测"（声波） • 给定观测序列，我们可以计算各种可能的状态序列的概率 • 选择概率最大的状态序列，就是识别结果举例：当你听到"你好"这两个字时，语音信号是一串连续的声波。HMM的工作是：给定这串声波，找出最可能对应的词序列——"你好"。

📊 "每解雇一名语言学家，系统性能就提升一点"

贾里尼克有一句名言，后来在学术界广为流传： "每解雇一名语言学家，语音识别系统的性能就会提升。" 这句话后来被演绎成更夸张的版本："每解雇一名语言学家，语音识别率就提升1%。" 当然，这句话更多是调侃。贾里尼克的真正意思是：数据比规则更重要。当你的数据量足够大时，数据驱动的方法会超过人工设计的规则。这在今天已经是理所当然的观点——但在1980年代，这简直是离经叛道。 **关于贾里尼克的名言：**这句话的确切来源存在一些争议，有多个版本。但它确实准确反映了贾里尼克的学术观点：数据驱动的方法优于规则驱动的方法。

约翰·霍普金斯大学：建立语音研究的圣地

1993年，贾里尼克离开了IBM，加入约翰·霍普金斯大学（Johns Hopkins University），领导该校的语言与语音处理中心（Center for Language and Speech Processing，简称CLSP）。

🏛️ 一个传奇的地方

CLSP很快成为了全球语音和语言处理研究的圣地。在接下来的20多年里，该中心培养了一大批杰出的研究者，他们后来分布在全球各大高校和科技公司。贾里尼克的一个著名做法是：每年夏天举办暑期学校，邀请全球最优秀学生和研究者来JHU学习交流。这些暑期学校培养了几代语音和NLP研究者，影响深远。

🎓 约翰斯·霍普金斯大学语言与语音处理中心（JHU CLSP）的遗产

约翰·霍普金斯的CLSP在1984-2010年间培养了大量语音识别和NLP领域的领军人物，包括： • 约叔华·本吉奥（Yoshua Bengio）—— 深度学习先驱 • 迈克尔·乔丹（Michael Jordan）—— 机器学习泰斗这些研究者后来在深度学习和机器学习领域做出了重要贡献，而且他们的学术成长深受CLSP学术氛围的影响。

学术贡献：不仅仅是语音识别

🌐 自然语言处理的统计革命

贾里尼克的影响远不止语音识别。他的统计方法论直接影响了整个自然语言处理（NLP）领域。在他之前，NLP主流是符号主义——用规则处理语言。在他之后，统计方法逐渐成为主流。今天的NLP，包括机器翻译、情感分析、问答系统等，最基础的方法仍然是统计方法——当然，现在更多是结合了深度学习的统计方法。 可以说，贾里尼克是现代NLP的奠基人之一。

📚 他的学生，他的遗产

贾里尼克不仅自己做研究，更善于培养人才。他的学生和合作者遍布全球，很多人后来都成为了领域内的领军人物。 2010年贾里尼克去世后，ACL（国际计算语言学协会）专门发表悼文，称他是"计算语言学领域最有影响力的人物之一"。

晚年：与帕金森症抗争

💪 最后的岁月

2000年，贾里尼克被诊断出患有帕金森症。这种疾病会逐渐剥夺患者的运动能力，对于一个热爱学术、热爱教学的人来说，这是一个残酷的命运。但贾里尼克没有放弃。他继续在JHU工作，继续指导学生，继续参与学术讨论。 2010年9月14日，弗雷德里克·贾里尼克在佛罗里达州科勒尔盖布尔斯因心脏病发作去世，享年78岁。他生前一直与帕金森症抗争。他的名字被铭刻在语音识别和NLP的历史上——作为一个改变了一个领域的跨界移民，作为一个用数学和统计方法重新定义语言处理的思想者。

"他的工作彻底改变了我们处理和理解语言的方式。" —— 约翰·霍普金斯大学官方悼词

🤔 一个值得思考的问题

贾里尼克的统计方法革命揭示了一个重要的科学哲学问题： 我们应该用"规则"还是用"数据"来理解世界？ 在语言学领域，规则派和统计派的争论持续了几十年。最终，数据驱动的方法占据了上风——但这是否意味着规则不重要？在深度学习时代，我们看到了另一种趋势：用更大的数据、更深的网络来"学习"规则。这是否是向某种意义上的"规则派"的回归？这个问题，或许永远没有标准答案。但正是这种争论，推动着科学不断前进。

🎭 一个真实的贾里尼克

在学术界的传说中，贾里尼克有几个特点被人们津津乐道： • 他对数学极其严格——任何不严谨的推导都逃不过他的眼睛 • 他说话直率——不喜欢含糊其辞，对错误的容忍度很低 • 他热爱教学——即使在晚年病痛困扰时，他仍然坚持给学生们讲课 • 他有一种特殊的魅力——能把复杂的问题讲得清晰明了他不是那种高高在上的学术权威，而是一个真正热爱研究、热爱学生的学者。 **关于贾里尼克的教学风格：**多位曾与贾里尼克共事的研究者回忆，他在学术讨论中非常直接，如果你的想法有漏洞，他会直接指出来。但这种直接是出于对学术的热爱，而不是个人攻击。

影响与传承

🏆 贾里尼克获奖与荣誉

• IEEE信号处理学会奖（1997） • ACL终身成就奖（2009）—— 这是计算语言学领域的最高荣誉之一 • IEEE会士、美国国家工程院院士 • 此外，他还是《计算机Speech与语言》期刊的创始主编

🌍 对后续研究者的影响

今天，当你对着Siri说话、对着Google Translate翻译、用语音输入发消息时，这些应用背后都有贾里尼克的贡献。他开创的统计方法不仅没有过时，反而在深度学习时代得到了新的生命力——现代的语音识别系统仍然使用他发明的核心框架，只是加入了深度神经网络。 用一句话总结：弗雷德里克·贾里尼克是一个用数学改变了人类与机器对话方式的人。

"每解雇一名语言学家，语音识别系统的性能就会提升。" —— 弗雷德里克·贾里尼克

💭 苏格拉底式反问

关于规则与数据： 贾里尼克的统计方法革命说明，当数据量足够大时，数据驱动的方法会超过人工设计的规则。这让我们思考：在你的领域中，是规则更重要还是数据更重要？或者两者如何结合？ 关于跨界与创新： 贾里尼克原本是搞信息论的，但他把信息论的方法用到了语言处理上，最终颠覆了整个领域。伟大的创新是否往往发生在学科交叉地带？你如何将不同领域的知识结合起来？ 关于勇气与坚持： 在所有人都用规则方法的时候，贾里尼克敢于提出统计方法——这是一种冒险，也是创新。你是否有勇气在你自己的领域中挑战主流方法？ 关于传承与影响： 贾里尼克培养了一大批优秀的学生，他们后来在各自领域做出了重要贡献。好的导师对学生的影响可以持续几代人。你遇到过这样的导师吗？

📚 知识回顾

本章知识点

✅ 隐马尔可夫模型（HMM）：贾里尼克用于语音识别的核心统计工具，将语音看作概率过程 ✅ 统计语音识别：用数据驱动代替规则设计，让机器从大量语音数据中学习语言规律 ✅ 数据驱动 vs 规则驱动：贾里尼克的革命性观点——数据比规则更重要 ✅ 约翰·霍普金斯大学CLSP：贾里尼克创建的语音与语言处理中心，培养了Yoshua Bengio、Michael Jordan等领军人物 ✅ 自然语言处理的统计革命：贾里尼克的方法影响了整个NLP领域，也为现代NLP奠定了基础 ✅ ACL终身成就奖：2009年授予贾里尼克的计算语言学最高荣誉 — 第三章完 —

第三章 ​

一个从布拉格走来的"跨界移民" ​

📋 弗雷德里克·贾里尼克 (Frederick Jelinek) ​

童年：在战火中颠沛流离 ​

🌍 战争的阴影 ​

MIT岁月：从工程师到研究者 ​

🎓 22岁的博士 ​

🔬 从通信到语音：一个意外的转向 ​

IBM时期：用统计方法颠覆语音识别 ​

💡 一个革命性的想法 ​

🧠 什么是隐马尔可夫模型（HMM）？ ​

📊 "每解雇一名语言学家，系统性能就提升一点" ​

约翰·霍普金斯大学：建立语音研究的圣地 ​

🏛️ 一个传奇的地方 ​

🎓 约翰斯·霍普金斯大学语言与语音处理中心（JHU CLSP）的遗产 ​

学术贡献：不仅仅是语音识别 ​

🌐 自然语言处理的统计革命 ​

📚 他的学生，他的遗产 ​

晚年：与帕金森症抗争 ​

💪 最后的岁月 ​

🤔 一个值得思考的问题 ​

🎭 一个真实的贾里尼克 ​

影响与传承 ​

🏆 贾里尼克获奖与荣誉 ​

🌍 对后续研究者的影响 ​

💭 苏格拉底式反问 ​

📚 知识回顾 ​

本章知识点 ​

第三章