书名:AI群星闪耀时
ISBN:978-7-115-62091-0
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
主 编 刘知远 曾哲妮
编 著 AI群星闪耀时编写组
责任编辑 张 涛
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
本书以人工智能发展史上几十位重要的学者的事迹为索引,用人物传记的形式生动地向读者展示人工智能的发展脉络。本书本着知人论世、严肃活泼的原则,力图将更准确、更理性的事实性记录与更全面、更温情的文学性叙述结合起来。通过阅读本书,读者将加深对人工智能的基本原理与概念的理解,能够更深刻地了解学科发展脉络以及作出重要贡献的科学家的品格。
本书内容通俗易懂,文字风趣幽默,高中生或低年级本科生可作为名人传记阅读,培养科学素养与志向;AI领域技术人员与其他对AI感兴趣的读者,可把本书作为人工智能的入门科普读物,以更为系统地了解AI的发展历史,并展望其未来。
本书以人物传记的形式,辅以人工智能相关话题的介绍,用充满温情的方式为读者回顾了人工智能的发展史。这段历史中当然记载着人工智能技术发展历程中的一次次跌宕与起伏,但“理性而前沿”的技术背后,人类的成长与挫折等“感性又浪漫”的故事最打动人心——本书将两者进行了巧妙的结合。在书中,那些教科书上如雷贯耳的专家成为鲜活的人物,围绕他们生活与工作的故事展开的叙述,为技术的发展铺陈了生动的背景。本书导论、人物动漫形象与生平小传,也为读者的阅读体验增色不少。
值得一提的是,书中人物传记和专题介绍的作者都是清华大学的本科生。尽管本书主编刘知远老师谦虚地评价“同学们的语言表达能力还没有那么强”,但阅毕全书后,相信每位读者也会和我一样感叹学生写作能力之出色。我想这应当算是“写作与沟通”课程与任课老师最值得骄傲的事情:学生思维水平的提升以写作为载体呈现在读者眼前,学生自身则在书写过程中带着人文关怀去看待技术变革,潜移默化地实现了感性与理性的相互促进与共同发展。
期待每位读者在阅读这本书时,也拥有这样充实饱满的收获:被人工智能的技术魅力与逻辑理性所吸引,更为人类携手探索未知的团结与勇气而感动。
清华大学写作与沟通教学中心主任 曹柳星
这本书是写给对人工智能历史感兴趣的读者的。人工智能可谓当下最热门的科学技术,特别是最近十几年来,已经对人类社会的方方面面产生了深远影响。从“人工智能”这一术语被正式提出的1956年达特茅斯会议算起,到现在不过短短六十多年光景,人们对人工智能的探索却经历了几次大起大落。充满戏剧性的历史进程往往造就英雄人物,并由他们影响历史的进程。相信很多读者会对在人工智能历史上发挥过重要作用的人物很感兴趣。他们是谁?他们做过什么?他们对人工智能产生过哪些深远影响?为什么是他们而不是别人?本书梳理了这些人物的重要人生经历和贡献,力求对这些问题作出详尽的解答。
本书的一大亮点是,作者都是清华大学的本科生,这是他们选修“写作与沟通”课程的成果,编者则是这门课的教师兼助教。“写作与沟通”是清华大学自2018年开设的一门本科必修课程,清华大学为此还专门成立了“写作与沟通教学中心”(后称写作中心),旨在提升学生写作的逻辑性和说理性。写作中心希望同学们学习后,彼此间可进行“无学科门槛,有学理深度”的交流。我们认为,改变学生的写作思维是写作课最为根本的价值诉求。学生应该基于扎实的知识与广袤的视野,训练逻辑理性与人文感性兼备的深度思维能力,而写作则应是思维结果的自然表达。
在授课形式上,这门课不是简单地讲授写作理论,而是结合具体的学科知识进行小班探讨,将培养写作能力与具体专业兴趣结合在一起。“言之无文,行而不远”,我作为计算机专业的教师和学者,深知口头和写作表达能力对计算机专业学生的重要性,但这往往被很多学生忽视。因此,我在2020年秋季学期以“人工智能的历史与未来”为主题开设了一门课程,并邀请了曾哲妮和韩旭两位博士生担任助教。
2020年,本课程共有18名同学选修。本课程主要向他们介绍人工智能的发展历史和技术源流,并为他们安排相应的写作任务。每位同学被随机分配了一位人工智能发展史上的重要人物作为写作的主角,着重围绕重要人物(共18位)与人工智能的关系来选取素材,并把这些素材写成传记。这18位重要人物分别是莱布尼茨、伯特兰·罗素、维特根斯坦、诺伯特·维纳、冯·诺依曼、库尔特·哥德尔、艾伦·图灵、克劳德·香农、司马贺、马文·明斯基、约翰·麦卡锡、罗森布拉特、艾弗拉姆·诺姆·乔姆斯基、费根鲍姆、黄煦涛、朱迪亚·珀尔、大卫·马尔、杰弗里·埃弗里斯特·辛顿。他们有的是人工智能领域的重要学者,有的是大哲学家和数学家,他们共同的特点是,其思想和工作都对人工智能直接或间接地产生过深远影响。2021年,本课程又有17位同学选修,他们中有10位同学被邀请为莫里斯·文森特·威尔克斯、艾伦·纽厄尔、吴文俊、查尔斯·巴赫曼、埃德加·弗兰克·科德、道格拉斯·恩格尔巴特、恩格尔伯格、约翰·霍兰德、傅京孙、杨立昆作传;余下7位同学为人工智能领域的重要事件和话题撰写专题介绍,包括达特茅斯会议、AI下棋、图灵测试与思想实验、科学家心目中的AI、用AI解决科学问题、关于AI的未来畅想等。当然,人工智能领域的重要人物何止这28位巨擘,我希望随着接下来本课程在每年的开设,会有更多同学完成更多重要人物的传记。
组织同学为人工智能领域的重要人物作传并整理出版有3个原因。一是国内还缺少介绍人工智能发展历史的图书。尼克先生的《人工智能简史》是这方面的佳作,但体例上是以事件发展为脉络的断代史。我通读过几遍,非常精彩,语言亦庄亦谐,很多地方颇下考据的功夫,有很多真知灼见。而本书则以人物为单元,采用纪传体体例,从个人成长发展的视角去写,让读者领略AI重要人物作为历史中的个体,是如何面对人生、作出抉择和改变世界的。相信这对亲手为他们作传的同学的人生观也会产生积极的影响。二是帮助同学发现自己的潜力,认识到未来的无限可能,从而自信地施展自己的才华。三是既能让同学领略AI重要人物对人类发展产生的重要影响,又能让他们体验成功出版一部作品的过程,还能为国内读者献上一本新鲜的AI人物传记合集。期待同学们在学习前辈的光辉经历之后,能够成长为像前辈一样的人,对人类社会作出巨大贡献,几十年后成为后辈作传的对象。
这本书的名字受到了奥地利著名作家茨威格的历史人物传记合集《人类群星闪耀时》的启发。群星闪耀,用来形容人工智能跌宕起伏的发展历程最恰当不过。当然,与大作家茨威格的妙笔生花相比,同学们的语言表达能力还没有那么强,但是他们在查阅大量资料之后,所写故事真实、全面,语言通俗易懂,足以带领读者了解这些AI英雄的事迹。下表是参加写作的作者信息。
章名 |
作者 |
院系(简称) |
---|---|---|
符号主义之滥觞:莱布尼茨 |
丁阳 |
自动化系20级 |
艰难思考与自由之路:伯特兰·罗素 |
吴一波 |
探微书院20级 |
世界之外的孤行者:维特根斯坦 |
黄索之 |
交叉信息院20级 |
不完备的世界:库尔特·哥德尔 |
陈晓晨 |
电子系20级 |
控制论之父:诺伯特·维纳 |
李钦 |
未央书院20级 |
一个人·一个理论·一个时代:克劳德·香农 |
谢荣靖 |
交叉信息院20级 |
AI与人类的棋类智慧竞技 |
陶也 |
电子系21级 |
我向AI扔出了敲门砖:冯·诺依曼 |
王振宇 |
电子系20级 |
电子存储夺天工:莫里斯·文森特·威尔克斯 |
李林峰 |
电子系21级 |
超越时代的思考者:艾伦·图灵 |
史笑屹 |
自动化系20级 |
图灵测试与思想实验 |
张睿 |
土木系21级 |
举起人工智能的火炬:约翰·麦卡锡 |
王麓宁 |
电子系20级 |
达特茅斯会议:AI思维的滥觞 |
方奔皓 |
电子系21级 |
符号代表的世界:司马贺 |
梁翊恒 |
电子系20级 |
符号认知狂想曲:艾伦·纽厄尔 |
张宇航 |
精仪系21级 |
我走我的路:吴文俊 |
田世祚 |
电子系21级 |
神经网络的问世:罗森布拉特 |
井晨哲 |
经管学院20级 |
真正的知识分子:艾弗拉姆·诺姆·乔姆斯基 |
邹箫桐 |
电子系20级 |
构筑人机交互的梦:道格拉斯·恩格尔巴特 |
赫奕铭 |
电子系21级 |
“机器人之父”:恩格尔伯格 |
张琰然 |
自动化系21级 |
特立独行的先驱:马文·明斯基 |
陈睿铧 |
电子系20级 |
在知识中寻找力量:费根鲍姆 |
刘宇 |
自动化系20级 |
数据库的领航者:查尔斯·巴赫曼 |
黄俊凯 |
致理书院21级 |
“表”达万物之序:埃德加·弗兰克·科德 |
于骥琪 |
土木系21级 |
用AI解决科学问题 |
武永祥 |
电子系21级 |
从智能的计算到计算的智能:大卫·马尔 |
温凯越 |
交叉信息院20级 |
模式识别的先驱:傅京孙 |
司开明 |
土木系21级 |
从人的视觉到计算机视觉:黄煦涛 |
邵马安平 |
交叉信息院20级 |
触手可及的AI |
严绍波 |
未央书院21级 |
孤独的领路人:朱迪亚·珀尔 |
周若愚 |
自动化系20级 |
用游戏模拟自然界:约翰·霍兰德 |
朴城民 |
经管学院21级 |
“神经网络之父”:杰弗里·埃弗里斯特·辛顿 |
伍泓达 |
交叉信息院20级 |
呼啸而来的人工智能:杨立昆 |
毛顺宇 |
电子系21级 |
科学家的AI漫谈 |
吕芳怡 |
电机系21级 |
关于AI的未来畅想 |
李昭阳 |
自动化系21级 |
我们邀请了清华大学美术学院的荆潇为本书设计封面。荆潇和曾哲妮一起设计了28位传主的卡通形象,并以诗的形式对传主的人生经历和贡献进行概述,还设计了人工智能发展历程的可视化图,以方便读者在人工智能的全景下了解这些重要人物。虽然同学们认真遵循了课程制定的写作规范,但毕竟28篇传记出自不同同学之手,因此在风格和体例上仍然或多或少有不一致的地方。为此,曾哲妮和韩旭认真统一了各篇传记的风格和体例,并与同学们共同收集了相关图片资料。此外,来自清华大学新闻学院、人文学院的毕诗尧、蔡斐然、崔静宁、樊佳璇、甘泽霖、纪小璐、李杭、李瑶琦、娄紫奇、陆泉宇、莫家楠、孙景然、王艺晓、张宁宁等同学对书稿进行了校对与润色。
本书能够面世,要感谢清华大学“写作与沟通教学中心”的支持,感谢选修该课程的全体同学的努力,感谢两位助教韩旭、曾哲妮对本课程和本书的贡献,感谢新闻学院和人文学院的鼎力相助,感谢人民邮电出版社张涛编辑对本书的支持。
人工智能涉及诸多学科,因此给人工智能发展史上的重要人物作传极其不易。编者自认才疏学浅,加之时间和精力有限,书中疏误之处或恐难免,祈望广大读者不吝赐教,不胜感激。
刘知远
清华大学FIT楼
人类自远古时期起,便对遥悬九天的星辰充满向往。那星芒代表着神秘的、不可及的、未知的光亮。而先祖则用可与星辰比拟的智慧日日钻研、步步探索,将众生带入崭新的天地。几十万年前,人类用火攫取温暖、驱散野兽;几万年前,人类学会了在岩壁上描绘星斗;一百多年前,法拉第发现磁铁穿过闭合线路时电光闪烁;大约七十年前,关于用机械模拟人类智慧的想法悄然萌芽……人类追逐、探索乃至创造智能的过程,也是科技加速发展的过程,而我们想带读者回顾的则是创造智能的伟人。他们的精神长存,犹如“人工智能”的天穹里闪耀的熠熠星光。
我们今天所说的人工智能,作为一门正式学科的历史不过几十年;然而对世界与自身的进一步理解——抑或说对智能的追求,则是人类发展永远的主题。以亚里士多德为代表的哲学家远在公元前就开始了对存在、知识、理智等问题的探究与思考。
读者对亚里士多德的三段论应该并不陌生,它便于我们给定初始前提以严格推导得出结论,譬如“哲学家都需要一顶帽子,我是一个哲学家,所以我需要一顶帽子”。亚里士多德实际上在尝试为人类头脑中智能的、理性的那一部分建立系统而精密的规则,他是一个典型的理性主义学者。同样信奉理性主义的还有笛卡儿,他强调推理的重要地位。例如,由于人的头脑中由物理定律支配的那一部分和一块石头并无区别,因此被当成机器对待是完全可能且合理的,反之亦然——这或可称为人工智能可行性的哲学理论基础。再往后,经验主义运动中的休谟对归纳法进行了反思,这对人工智能领域的因果推理、学习泛化等问题都有深刻的借鉴意义。理性主义与经验主义一起构成了认知论的最重要思想。
亚里士多德还有一段有趣的论述:“当哲学家明白了他需要一顶帽子时,他需要考虑该选择哪种实际行动以实现目标。最容易的是去店里买一顶帽子,但如果哲学家没有足够的钱,那他就停止‘直接买帽子’这一行为分支的搜索,转而考虑该如何自己制作一顶帽子。”形式化决策在这段论述里已经初现雏形。
哲学界早已开启了将人类智能机械化、规则化的探讨,而对于制造模拟人类智慧的机器的真正实践,我们需要从生活在17世纪的人工智能先驱莱布尼茨说起。
提及莱布尼茨,人们通常最先想到他的数学成就;实际上,他在符号逻辑学领域的研究也相当亮眼。1677年,莱布尼茨发表《通向一种普遍文字》和《理性演算的基础》两篇文章。他细致地考察并尝试还原自然语言的基本结构,希望建立一套与人们思考对象的意义唯一对应的“人类思想的字母表”,以避免自然语言的模糊性给逻辑推理的基本演算过程带来消极的影响。莱布尼茨的研究激发了后世科学家对数理逻辑的热情,人工智能的主要流派之一——符号主义也就此发端。一以概之,符号主义学者散发着严谨缜密的理性光辉,认为智慧天成而人类幸甚得之。
著名哲学家罗素为数理逻辑的发展添上了浓墨重彩的一笔。1901年,他提出了“罗素悖论”。这一悖论有诸如“理发师悖论”等通俗解释,其核心是,朴素集合论中出现自指情况会引发矛盾。“罗素悖论”引发了严重的数学危机,而罗素本人也努力尝试解决这个问题,他的方法是对“集合”这一概念进行变动。1910年,他与怀特海合著了《数学原理》,希望论证所有数学真理在一组数理逻辑内的公理和推导规则下都是可证明的。此书时至今日尚无完整且权威的中译本。除了原著过于艰深外,一个重要的原因是,在其问世20年后,哥德尔证明了任何尝试以一组公理和推理规则来建立的数学系统都是不自洽或不完备的,这就是大名鼎鼎的“哥德尔不完备性定理”。
时间来到了20世纪40年代,计算机的性能逐渐强大,通用性不断提升。彼时年仅20岁的香农研究数字电子技术的应用,论证了如何使用开关来实现逻辑和数学运算,标志着二进制电子电路设计和逻辑门应用时代的来临。此时,回看莱布尼茨在18世纪初提出的对于二进制算术意义的讨论,你会发现他超越时代的前瞻性。1941年,阿塔纳索夫-贝瑞计算机诞生了,它是世界上第一台电子计算机。1945年,冯·诺依曼在有关EDVAC的报告中提出了冯·诺依曼结构,将程序指令存储器和数据存储器合并在一起。这种计算机设计结构具有开创性意义并沿用至今。几年后,世界上第一台存储程序式电子计算机最终实现于威尔克斯之手,电子计算机终于被赋予了“生命”。
同一时期,人工智能的其他研究流派陆续出现。1948年,维纳提出控制论。这是一种关于人、动物和机器如何相互控制和通信的科学研究,行为主义流派就源于此。此后,控制论系统研究不断发展,智能控制与智能机器人也随之兴起。同年,图灵撰写论文《智能机器》,其中描绘了联结主义的基本原理,引入了后来被称为遗传算法、神经网络、强化学习等人工智能的核心概念。联结主义相信造物之神奇,认为人工智能源于仿生学,这派学者重视对人脑结构的钻研和仿制。两年后,图灵又提出了展现行为主义方法论的“图灵测试”——这是一个判断机器是否能够思考的著名实验,认为当机器表现出与人类无法区分的智能时,表示机器拥有思考能力。我们可以大致认为,三大学派中的符号主义强调机器必须有清晰的思考路径;而联结主义则认为相似的结构可以获得相似的反馈,这就能够实现智能;行为主义最干脆,学者们甚至并不强求机器的思考过程,只要能实现人们所期盼的功能即可。2018年,谷歌宣布助理机器人Duplex可实现全自动电话订座,通过了图灵测试,可是该人工智能背后过多的“人工”成分也很快被披露。读者不妨尝试预测一下,什么时候才会出现真正通过图灵测试的人工智能?通过了图灵测试,就能够证明机器达到了与人类相当的智能水平吗?
让我们再回到人工智能的发展历史。虽然哥德尔彻底击碎了许多数理逻辑学家的美好构想,但这一定理的出现并没有阻止以逻辑演绎为根基的符号主义人工智能向前迈进。1950年前后,香农研制了一个计算机下棋程序,并提出了人机博弈中最基础的极小化极大算法;1953年,维特根斯坦的遗作《哲学研究》出版,讨论了智能行为的实时处理以及许多关于语言哲学的问题;1955年,司马贺与纽厄尔编写了一个名为“逻辑理论家”的程序,可谓符号主义学派的代表性成果——这是第一个可以自动进行推理的程序,简洁、新颖地证明了《数学原理》中的38个定理。自动定理证明后来衍生为人工智能领域非常重要的话题之一,其中不乏十分亮眼的理论成果,例如改变几何定理机器证明领域面貌的“吴方法”(由吴文俊提出),不过这都是后话了。
1956年是我们不得不提的“人工智能元年”。麦卡锡、明斯基、香农等人发起了达特茅斯夏季人工智能研究计划(即达特茅斯会议)。该会议被公认为人工智能的起源。关注人工智能领域发展的学者带着无穷的创造力聚集一处,就自动计算机、神经网络、计算理论等议题展开讨论,碰撞出诸多火花。该会议的主要发起人之一麦卡锡是符号主义学者,他在当年提出了Alpha-Beta剪枝搜索,这是基于香农极小化极大算法的重要改进算法;两年后他发明了LISP语言,这种语言使用前缀符号表示法,是现今第二历史悠久且仍在广泛使用的高级编程语言——人工智能领域的标准编程语言之一。
此后的20年间诞生了许多令人印象深刻的成果,人工智能这一概念也正式进入大众视野,我们称之为人工智能第一次浪潮。1957年,罗森布拉特发明感知机——这是一种最简单形式的前馈神经网络,也是一种二元线性分类器。搭载感知机算法的计算机经过训练后,可以准确地识别出卡片的不同之处,这是一个精彩的开头。虽然用如今的眼光来看,其背后的原理十分简单明了,然而在当时,这是一个十分神奇且振奋人心的功能。罗森布拉特等联结主义学者彼时风头正盛,而符号主义学派亦有新进展:乔姆斯基提出了转换-生成(Transformational-Generative,TG)文法。这是一种闪烁着理性主义光辉的学说,研究的是人类为什么会说话以及如何了解新的句子。乔姆斯基无心插柳地成为自然语言处理领域的巨擘。从实用角度来看,飞入千家万户的代表性成果是恩格尔巴特的鼠标和演示,在他之前,几乎所有人认为计算机被普通人便捷舒适地控制、帮助人“增智”是天方夜谭;“机器人之父”恩格尔伯格则带领工业机器人登上历史舞台,使工业制造、医疗等行业率先打开了机器化的新篇章。
其实我们可以想象,20世纪50年代少有人自称人工智能学家。达特茅斯会议的3位主要发起人中,麦卡锡研究计算机科学,明斯基的老本行是数学,而香农是一名无线电工程师;罗森布拉特和乔姆斯基的第一身份则分别是心理学家和语言学家;司马贺则拿了9个博士学位,对认知心理、经济管理等学科十分精通。然而,他们每个人都用自己所擅长领域的知识为人工智能的发展作出了不可磨灭的贡献。可以说,人工智能是一门名副其实的交叉学科,要想做好人工智能研究,应涉猎广泛、善于交流合作,正如上述英杰做出的示范那样。而人工智能的3个主要起源——数学与计算机、信号处理、控制理论,即现在大学里的计算机科学、电子、自动化专业,齐头并进,主攻人工智能。
这一时期,社会对人工智能的发展前景拥有极高的关注度与极大的信心。学者们争相涌入人工智能领域,各国政府也对相关项目豪掷千金。然而万事过犹不及,当一个新兴领域受到与之本身的发展水平不相匹配的瞩目与追捧时,现实的巨浪迟早会迎头拍下。明斯基对感知机直截了当的批评引爆了危机:20世纪70年代中期,人们逐渐发现哪怕设想再美好,人工智能也仍然无法突破计算机性能的基本限制,停留在玩具阶段——过高的期望带来失望,大众对人工智能的态度转为批判讥讽,随之而来的是相关研究资金锐减,研究进度停滞不前。这就是第一次人工智能寒冬。
明斯基早年专注于人工神经网络,后来转而走向符号主义学派。1975年,他首创了框架理论,该理论成为人工智能领域通用的知识表示方法。两年后,“专家系统之父”费根鲍姆在国际人工智能会议上提出了知识工程的概念,也与明斯基的想法相通;同时,知识工程也让人工智能领域从寒冬中复苏,推动了人工智能的第二次浪潮。
早在1968年,费根鲍姆就发明了DENDRAL,其中存储着来自化学家的经验以及质谱仪的知识。这是最早的专家系统,它可以帮助有机化学家识别未知的有机分子。此后,费根鲍姆和他的团队又在医学和国防等领域研制了若干可投入实际使用的专家系统,例如可以为医生提供诊断与治疗建议的MYCIN。各类专家系统需要调度大量的人类知识与数据。这一时期,伴随着计算机数据处理能力的显著增强,数据库技术取得里程碑式突破。前有巴赫曼的网状数据库,后有科德的关系数据库,这些都成为专家系统乃至更广泛的人工智能技术发展的重要依托。20世纪80年代,专家系统进入商用普及阶段,一系列的成功向人们重新证明了人工智能的潜力与实用价值。
专家系统的鼎盛时期,其余旁支也在默默发展。1982年,马尔在他的著作《视觉》中提出了视觉计算理论,这标志着计算机视觉成为一门独立的学科。同年,长坐冷板凳的联结主义学者辛顿发明了玻尔兹曼机。这既是一种随机神经网络和循环神经网络,也是最早能够表达和解决复杂的组合优化问题的神经网络。几年后,他还成功推广了我们如今耳熟能详的反向传播算法,引发了人工神经网络领域的“文艺复兴”。
此外,统计学派的珀尔于20世纪80年代发明了贝叶斯网络,在当时取得了一系列不小的成功,这同样是十分值得铭记的。这是一种概率图模型,描述变量间不确定性因果关系。譬如,我们希望用一周的天气变化记录预测明天的天气情况,之前的做法或是根据一套复杂经验规则推理得到一个最有可能的结果,或是借由一系列网络权重计算得到一个无法解释的结果,而贝叶斯网络则会告诉我们雨过天晴和阴雨连绵的概率分别是多少,以及明天又有多大的降水量。
然而好景不长。计算机性能在短短数年间急速攀升,因而在全世界迅速兴起和普及,投资者失去了对AI专家系统这种大块头的兴趣;日本五代机项目开始时轰轰烈烈、野心勃勃,但很快陷入僵局,最终悄无声息,这更进一步打击了研发者的积极性。20世纪80年代末期,第二次人工智能寒冬来了。
一个十分有趣的说法是,当人的某项功能被机器完成得很出色时,人们便不觉得这能代表智能了。同理,当人们对人工智能信心低迷、兴趣寥寥时,机器只有在某个新的领域打败或取代人类,才能重新吸引大家的目光。1997年,IBM推出名为“深蓝”的国际象棋程序,并打败了人类冠军棋手。人工智能在十年寒冬后,终于迎来了复苏。当然,许多人在震惊过后很快又表示,国际象棋规则简单,围棋才能真正代表人类的智慧水平;不过现在我们都看到了,围棋世界冠军也被人工智能棋手征服了。
低谷期间,科学家在经历之前的教训后变得更加谨慎,但是包括上面提到的统计学习等板块仍然在发展。比如20世纪60年代出现了支持向量机,20世纪90年代初期出现了非线性分类器,非线性分类器在文本分类等任务上取得了非常出色的效果;霍兰德在20世纪70年代借鉴生物学现象提出的遗传算法,也在20年后伴随着计算能力的增强和实际应用需求的增长而得到很大的发展。再如1989年,杨立昆等人对反向传播算法进行了实际应用,卷积神经网络被成功应用于识别美国邮政服务提供的手写邮政编码数字,推动了深度学习领域的发展。
推动了神经网络“文艺复兴”的辛顿,在联结主义落魄之时毅然加入,潜心耕耘数十年,在2006年发表了一篇关于深度信念网络(Deep Belief Network,DBN)的论文,该论文实际上提出了使用GPU来优化深度神经网络的工程方法。彼时就连论文审稿人都对“神经网络”避如蛇蝎。辛顿将多层神经网络相关的学习方法命名为“深度学习”,也可能是迫于情势的无奈之举。好在从这一年起,基于互联网大数据的深度学习时代来临,以联结主义为主力的人工智能第三次浪潮终于拉开序幕。
掀起人工智能第三次浪潮的一位不得不提的关键人物是美籍华裔计算机科学家李飞飞。2009年,她的团队发布了ImageNet数据集,这是为了检测计算机视觉能否识别自然万物、经过三年多筹划才组建完成的一个大型数据集。从2010年开始,一共举行了8届ImageNet挑战赛。该挑战赛是计算机视觉发展和深度学习热潮的关键推力,将目标检测算法推向了新的高度。2012年,辛顿和他的学生创造了一个大型的深度卷积神经网络AlexNet,赢得了当年的ImageNet挑战赛冠军。随后三年,VGG、GoogLeNet、ResNet分别夺冠。基于卷积神经网络的机器视觉充分展现了它的发展潜力,变得家喻户晓。 如今,基于人脸识别技术的移动支付与安防、基于场景重建技术的扫地机器人等计算机视觉应用随处可见。人工智能正切实可感地改变着我们的生活。
自然语言处理也在人工智能第三次浪潮期间扮演了重要角色。2015年,注意力机制被提出。这一机制为不同重要程度的序列向量提供不同权值,是神经网络机器翻译最终超过传统翻译的关键。2018年,ELMo、GPT、BERT等预训练大模型相继出现。它们证明了一个非常大的模型可以显著提高自然语言任务的准确率,而这个模型可以通过在无标记数据集上预训练得到。大模型可以在机器翻译、自动问答、情感分析等任务中取得非常惊艳的效果,这在几十年前是难以想象的,而如今我们已经有能力为其提供足够的算力与训练数据。
除了上述两大板块,其余人工智能板块也取得了让人欣喜的进展。例如恩格尔巴特的梦想——人机交互,就在21世纪掀起了新兴热潮,其发展过程中也不乏华人、华裔的身影:黄煦涛在二十世纪六七十年代专注于图像压缩与图像增强技术的研究,自20世纪90年代起,作为贝克曼研究院的创始人之一,他对交叉领域产生了浓厚的兴趣,并开创了多模态智能人机交互、手势跟踪与识别、情感识别等领域。
半世纪的华山论剑,各派起落浮沉、兴盛衰败;而目前看来,最终的趋势应是融会贯通、集成发展。时至今日,我们已经没有太大的必要去划分清楚一位学者究竟属于上述哪一种流派。例如个人计算机上的Cortana或Siri,就是专家系统的一种变体,有符号主义知识工程的痕迹,同时也离不开联结主义在语音识别等方面作出的技术贡献。可以说,在人工智能起步阶段,对领域发展的过度乐观估计,既为其吸引了更多目光,争取到了肥沃的土壤,也在落差渐显时打击了社会积极性;加之领域内部门派纷争,人工智能研究两次落入低谷。随着其产业化加速,人工智能得到了越来越多来自企业的研发资金,且各大流派在“交锋”之后也逐渐走向了合作共赢的道路。寒冬期间细而未绝的幽咽泉流,为新世纪的厚积薄发、峰回路转打下了良好的基础。正因为如此,人工智能的第三次浪潮精彩而又深厚,能够不绝至今。
当然,人工智能的星空里闪耀的远不止书中这些人物。若有机会,我们会将更多遥远的、耀眼的星辰展现在大家眼前。于我们而言美中不足的是,在人工智能这片方兴未艾的璀璨星空中,中国人尚不算耀眼,女性学者亦不多见。如果此书能使更多人受到感染,加入对这一学科的探索并作出自己的贡献,我们将不胜荣幸。读者不妨与我们一同期待人工智能更加绚烂的未来。
曾哲妮
本文作者:丁阳
戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz,1646—1716),德国哲学家、数学家,是历史上少见的通才,被誉为17世纪的亚里士多德式的人物。
1646年夏天,戈特弗里德·威廉·莱布尼茨出生在德意志莱比锡地区。莱布尼茨的父亲在当地大学担任哲学教授,他的母亲也同样出身于教授家庭,可谓书香门第。虽然他的父亲在其6岁时不幸去世,但他依然从母亲那里获得了良好的幼年教育。天赋异禀的莱布尼茨对各种知识都抱有强烈兴趣,再加之广泛地阅读父亲留下的藏书,使他从中汲取了丰厚的知识。莱布尼茨在14岁时就进入莱比锡大学攻读哲学和法律专业,并在20岁时完成学业,随后在纽伦堡的一所大学获得了博士学位,并在同年出版了自己的第一部著作《论组合术》(见图1)。
图1 《论组合术》(拉丁文版)
莱布尼茨毕业后,收到了一所大学的教职聘请书,可他却决定为法庭和政府提供顾问服务。此后,他经常游历于多个国家,接触到了世界多地的科学文化。在繁忙的工作之余,他广泛地研究哲学、经济学、物理学以及各类工程技术。他除了在数学领域与牛顿共同开创了微积分之外,在物理学、哲学、经济学等领域也都有所成就,被学术界誉为历史上罕见的“通才”。
与兴起不过几十年的人工智能科学相比,莱布尼茨简直可以称得上生活在“上古时代”,就连最早的电子计算机都在他逝世200多年后才出现。但令人惊奇的是,莱布尼茨在数学、哲学思想上的成就在今天也不过时,有些甚至对今天的计算机科学和人工智能都产生了深刻影响。
“1与0,一切数字的神奇渊源。”
——莱布尼茨
在莱布尼茨之前,十以外的进位制一直只是被当作特殊的计数法则,在很长时间内都无人问津。虽然二进制数早在古埃及和古印度时期就已经被用于计数,但是没有人系统地研究过二进制的算术体系。
1672年在巴黎工作期间,26岁的莱布尼茨首次见到了帕斯卡于1642年创造的机械加法计算器。他在惊叹于其机械结构精巧的同时,也很受启发——所有数字计算过程在某种意义上都是可机械化的。于是在这之后的十几年,莱布尼茨都在尝试建造一台能够实现四则运算的“全能计算器”。
1674年,莱布尼茨完成了“步进式计算器”的初步设计(见图2)——以机械齿轮表示数值,并通过齿轮啮合旋转实现计算与进位。他凭借步进式计算器精妙的设计,成为英国皇家学会的会员。但是步进式计算器在设计上过于超前,因而莱布尼茨到1694年也仅完成了几部样机的制造,而其中涉及的“销轮结构”更是在工业革命后才得以广泛制造使用。
图2 莱布尼茨制作的步进式计算器
虽然机械硬件的限制使莱布尼茨最终制造的算数机器难以持续稳定地运作,远称不上完美,但制作算数机器的过程促使他开始思考数与算术的本质,并由此注意到了二进制。
1679年,莱布尼茨根据此前数年对二进制的研究,完成了《二的级数》一文,这是历史上首次对二进制进行细致且系统的探讨。在这篇文章中,他明确了以0和1来表示一切数,并明确了逢二进一的二进制数制以及二进制的形式化符号。此外,他还具体研究了二进制下的加、减、乘、除、 乘方、开方等运算法则,并指出了使用二进制进行运算的多项优越性。
莱布尼茨对二进制的思考还与中国文化有着不小的渊源。他在1689年游历意大利时,偶然结识了一位被派遣到中国的传教士,与这位传教士的交流使他对中国文化产生了浓厚的兴趣。在此后的研究中,他惊奇地发现二进制与中国《易经》的核心思想颇有共通之处,也从中意识到了二进制的哲学意义,并称此为“发现了二进制的‘极大用途’”。
然而,与莱布尼茨同时代的人对二进制不屑一顾。因为在信息科学尚未兴起的时代,人们难免认为进位制和算术仅仅是一种操作规定,讨论进位制和算术法毫无实际意义,甚至连莱布尼茨在1701年正式向巴黎科学院提交的一篇专门论述二进制的论文《数字新科学论》(Essay d'unne nouvelle Science des Nombres)也被巴黎科学院院长以“看不出二进制有任何用途”为由拒绝发表。
此后莱布尼茨积极寻求二进制的实用证据,他把来自中国《易经》的“伏羲八卦”内容加入论文,并特别对二进制的用途加以强调,才使这篇以《论单纯使用0与1的二进制算术— 兼论二进制用途及伏羲所使用的古代中国符号的意义》为题的论文(见图3)在《1703年皇家科学院年鉴》上发表,二进制方法也第一次得到了大范围的推广。
图3 莱布尼茨在其著作中将二进制与八卦对应,从右到左依次是伏羲先天八卦排列中的乾(☰)、兑(☱)、离(☲)、震(☳)、巽(☴)、坎(☵)、艮(☶)、坤(☷)
然而,这篇二进制论文的顺利发表,并不能代表当时学界对二进制的认可。17~18世纪欧洲启蒙运动过程中曾掀起一股中国风潮,运动领导者借助中国不重神权的传统哲学、伦理本位的道德体系对抗欧洲教会统治下的封建神学体系。在这个过程中,欧洲的知识阶层对世界另一头的中国一度产生了美好的幻想。从某种程度上讲,莱布尼茨的论文得以发表,应当归功于这样的风潮,而非世人真正认识到了二进制的精妙之处。
但莱布尼茨始终认为二进制有特殊的意义,甚至认为它是连接数学和哲学的重要枢纽。可是在莱布尼茨去世后的几个世纪,几乎无人用二进制做出什么成果,莱布尼茨的研究成果也迟迟得不到应用。直到近几十年来计算机科学的兴起才使得二进制大放异彩,其简明、规律的优越运算性质在现代计算机上体现得淋漓尽致。能在几个世纪前就注意到二进制的优越性,让人不得不赞叹莱布尼茨惊人而超越时代的眼光。
精练我们的推理的唯一方式是使它们同数学一样切实,这样我们就能一眼找出我们的错误,并且在人们有争议的时候,我们可以简单地说,让我们计算,而无须进一步忙乱,就能看出谁是正确的。
——莱布尼茨
莱布尼茨把二进制称为“一种具有世界普遍性的、最完美的逻辑语言”。在研究二进制的过程中,莱布尼茨不仅是在研究算术,从某种意义上也是在探寻一种“最简单基本结构”的可能性。如果一切数字都可以还原为简明的只由1和0表示的二进制数,那么是否可以把复杂命题乃至世界上的全部对象都还原为最基本的“原子命题”?进一步来说,能否将这些命题组成的逻辑推理也形式化为纯粹的数学运算?
解决这个问题需要克服方方面面的障碍。一方面,自亚里士多德以来基于自然语言的传统逻辑学太过模糊,难以进行归纳和演算。莱布尼茨为此设想建立一种通用语言,他说“这种语言是一种用来代替自然语言的人工语言,它通过字母和符号进行逻辑分析与综合,把一般逻辑推理的规则改变为演算规则,以便更精确、更敏捷地进行推理”。其实质上就是对自然语言数学化、符号化后得到的一种精确、无歧义、可计算的人工语言(莱布尼茨称之为“普遍语言”)。
另一方面,还需要构造某种理性演算规则,也就是所谓的“普遍文字”的具体用法,使其能通过运算来模仿人们的逻辑思考;进而,推理逻辑就可以表达为一些字符和符号间的数学演算,人们从而有可能通过机械化的方式对推理过程进行计算。这样不仅避免了逻辑上的争端,而且可以通过枚举各种可能性来发现新的知识。
莱布尼茨为逻辑符号化做了很多努力。1677年,他发表了论文《通向一种普遍文字》。他在这篇论文中系统地讲述了建立普遍字符的一些初步方法。在构建普遍字符的过程中,他对各种概念和命题进行阐述和归纳,希望建立一套与人们所思考对象的意义唯一对应的“人类思想的字母表”,例如用赋值或字母来表示基本概念,以此避免自然语言的影响。他还细致地考察和还原了自然语言的基本结构,指出了逻辑演算最基本的要素——“项”。除此之外,他还尝试将逻辑推理还原为理性演算。同一时期,他以一些公理和定理为基础,将逻辑推理还原为基本的演算过程。他提出的“充足理由律”“无矛盾律”等推理规则在很大程度上推进了理性演算的实现。虽然受制于当时的科学理论发展水平以及莱布尼茨逻辑体系自身的一些问题,他最终没能实现自己逻辑符号化的构想,但他所做的这些工作无疑是十分具有先见性的。而莱布尼茨关于“普遍字符”和“理性演算”的这些思考也激励了后来众多逻辑学家投身于数理逻辑的研究,他的宏伟设想如今确实得到了某种意义上的实现。
可惜的是,莱布尼茨几乎没有为他的符号逻辑研究出版过专门、系统的著作,他的研究成果大都包含在他生前遗留的数以万计的手稿中。而在莱布尼茨去世后的很长时间里,他关于“普遍字符”和“理性演算”的思考事实上并未获得太多关注。直到200年后,德国逻辑学家弗雷格从莱布尼茨那里得到启示。他的著作《概念文字》在很大程度上沿袭莱布尼茨的思想与方法,并在真正意义上建立起了完整的数理逻辑系统,再加上罗素、怀特海等人在命题和谓词逻辑方面的努力,数理逻辑才真正地发展成为一门备受科学家和世人关注的新兴科学,而莱布尼茨的工作正是沟通西方古典形式逻辑与现代逻辑科学的重要桥梁。如今,我们能清晰地认识到莱布尼茨对于现代逻辑学无可替代的开创地位,“人们谈到莱布尼茨的名字就像谈到日出一样,他对逻辑数学化的见解远远超过了古代人,使亚里士多德的逻辑得到新生。”
莱布尼茨尝试实现符号化的“普遍语言”以及理性逻辑演算的目的并不是替代自然语言,而是尽可能地避免自然语言的复杂性和模糊性,让思想内容变得清晰明确,可以解读,甚至可以通过机器运算来实现理性思维。而自人工智能科学建立并蓬勃发展的半个多世纪以来,人们就致力于解决和莱布尼茨相似的问题,即让思维变得可以计算,让计算机通过运算“听懂”语言,这些问题也衍生出了机器学习、自然语言处理等众多研究分支。如今,人们在让计算机处理自然语言时,往往被语义的模糊性和复杂性所困扰,而莱布尼茨所研究的符号化的普遍语言恰好能被计算机“理解”和使用。让“普遍语言”成为计算机和人对话的媒介,这是莱布尼茨的符号逻辑思想为语言学方面的人工智能研究指出的发展方向。
人工智能研究有三种不同学派:符号主义、联结主义以及行为主义。其中,符号主义学派是现代人工智能研究的主要学派之一,这一学派的研究以逻辑学理论为基础,尝试探索物理世界,以及人类智能能否简化成符号,进而通过研究符号以及符号系统间的逻辑联系来反映和解决现实问题。从20世纪60年代起,符号学的方法在人工智能模拟智能思考的过程中取得了很多重要成就,这一学派也在很长一段时间主导了整个人工智能的研究和发展。显然,这一学派研究的正是符号逻辑的思想。生活在300年前的莱布尼茨竟不可思议地成为今天符号学派人工智能研究的鼻祖。人工智能的另一个主要学派——行为主义学派,则将控制论作为人工智能研究的主要方法来源,而这一学派早期的很多研究者事实上也深受莱布尼茨符号逻辑思想的启发和影响,控制论的开创者维纳曾经指出:“莱布尼茨的“理性演算”以及“普遍字符”的思想,决定了莱布尼茨是控制论在科学领域的守护神。”由此看来,莱布尼茨的符号逻辑思想正是现代人工智能科学很多研究方向的理论基础和灵感来源。
无论是对规律、简洁的二进制算法的深刻研究,还是对符号逻辑的不懈探求,从中可见莱布尼茨似乎终其一生都在追寻一种“规范化”“系统化”以及“可计算化”的知识体系和推理形式,进而用这套理性的思维方法来表达和理解整个世界。他超越时代的远见不仅在于那些数学、逻辑学方面超前的研究工作,更重要的是,这种“认知即计算”的思想与现代计算机科学和人工智能的某些核心思想有着惊人的相似性和重合。我们甚至可以说,今天人工智能科学家们用机器运算来模拟人类思考的设想,早在几个世纪前,就在莱布尼茨的研究和思考中出现了雏形。
1716年11月16日,莱布尼茨在汉诺威病逝。在他生活的年代,科学和技术水平还很有限,这也导致他的许多超前研究都注定无法在他生前实现实用价值,他的设想也难以凭借他个人的努力得以实现,这些超越时代的远见并未得到同时代人的理解和认同,时代的局限给他的研究划定了难以突破的边界。莱布尼茨的很多研究在当时显得有些抽象,但这些成果与后来的计算机科学产生了密切的关联,直到今天我们借助现代计算机科学的理论和成果审视这段历史,才得以彻底理解莱布尼茨所做工作的重要意义。如果让莱布尼茨出生在与他学识相适合的时代,或许他就会与人工智能科学建立起直接的联系。今天的研究者或许也有必要思考,我们现在所做的研究是否也受我们所处时代的限制?
今天,莱布尼茨的许多设想都已经在人工智能这一新兴领域以他无法想象的方式变成了现实,他超越其所处时代的远见仍然在为现在的人工智能研究者提供可贵的启迪。从莱布尼茨的思考中,我们或许能找到探寻人工智能未来发展道路的奥秘所在。
[1] 朱新春, 史玉民. 莱布尼茨对二进制体系的贡献[J]. 宜宾学院学报, 2010, 10(2): 5-8.
[2] 朱新春, 史玉民. 莱布尼茨对二进制体系的贡献新论[J]. 咸阳师范学院学报, 2010, 25(2): 89–93.
[3] 莱布尼茨. 莱布尼茨自然哲学文集[M]. 段德智, 译. 北京: 商务印书馆, 2018.
[4] 李熙. 莱布尼茨哲学的一种现代阐释及其对通用人工智能的启示[J]. 科学技术哲学研究, 2020, 37(4): 27–32.
[5] 刘辉. 普遍语言与人工智能——莱布尼茨的语言观探析[J]. 外语学刊, 2020(01): 122–126.
[6] 陈波. 逻辑学导论[M]. 北京: 中国人民大学出版社, 2006.