书名:AI帮你赢:人人都能用的AI方法论
ISBN:978-7-115-64663-7
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
著 谭少卿
责任编辑 胡俊英
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
本书强调“把AI作为方法”(AI即Artificial Intelligence,人工智能)这一核心理念,旨在引导读者掌握与AI对话的关键技巧,并将AI融入工作和生活,真正体验AI带给人类的高效与便捷。
本书从技术的发展规律入手,探讨了把AI作为方法的必然性和必要性,进一步剖析了算法与哲学在内在逻辑上的贯通性。此外,本书通过丰富多样的案例展示了AI的强大魅力,通过一系列“召唤术”帮助读者运用AI创造性地完成各种各样的任务,在这个过程中体验运用AI的核心技巧,掌握对语言的辩证法。
本书适合对AI有研究兴趣、有使用需求、有产品研发需求或有投资意向的读者阅读。读者可扫描文中的二维码了解本书所介绍的与AI交互的秘诀。
ChatGPT 发布之后,国内外公司都先后发布了自己的大模型,我们360公司也发布了自己的“智脑”。这是AI技术首次面向大众提供服务,是一个很大的进步,这个阶段可以理解为“模型即产品”。
经过一段时间的发展,大模型产业取得了一定进展,“模型即产品”的观念似乎已经过时了。这些大模型整体上离用户的实际需求仍然较远,业内公司普遍陷入了通用大模型技术同质化的困境,难以找到真正适配用户需求的场景。
因此,只有将大模型转化为场景背后的能力,切实解决用户在特定场景下的痛点、满足刚需,国内大模型产业才能实现真正的突破与发展。360公司推出的AI搜索和AI浏览器就在寻找这样的“明星场景”,通过大模型重塑关键体验,从而为用户提供更加智能、便捷的服务,解决真正的痛点问题。
以上是从企业角度出发的一些判断。那么从个人角度来说,如何用好 AI 产品呢?
这本书提出了一个很好的观点,那就是把AI作为方法,学会与AI对话,发挥出AI最大的潜力,全面武装自己。普通人可以通过AI快速获取那些曾经只有少数精英和专家才能掌握的、高深的“技术特权”和经验认知。
很多人以为,对话就是简单地提出问题,但是提出什么问题、如何提出问题、如何指导AI达成你的目的,才是核心所在。如此一来,提问的质量是非常关键的。苏格拉底说:我不能教会他人任何东西,我只能使他们开始思考。我们使用AI也是类似的,要向AI提出好问题,让AI“思考”,从而引导出它的智慧。而提问能力的提升,其实需要一定的理论指导和实践,尤其对于不搞技术的普通人来说。这本书还提供了一系列召唤术和大量的案例,这些案例不是奇技淫巧,更不是那种今天学了明天就过时的东西,而是一套系统化的、循序渐进的、针对各项能力进行提升的场景化的解法,因此更有普遍的意义。
从产品设计的角度来说,AI产品应当让用户不需要思考就能使用并获得满足。而从用户的角度来看,善用AI可以大大提高自己的能力上限,让AI帮助自己赢得未来。我强烈推荐大家读一读这本书!
周鸿祎
终有一天,在你漫游银河系的旅途中,当你觉得太空无比辽阔、星辰之间的知识浩瀚无边时,记得要手握《银河系漫游指南》和你正在读的这本书——它们会在你迷茫、困惑,甚至有点害怕的时候,给你提供帮助。
此外,我还有一些至关重要的思考与你分享。
有的人宣称,人工智能是自图形用户界面问世以来,最令人震撼的科学突破。有的人预言人工智能将赢得人类的竞赛,而有的人则悲观地猜测,不懂人工智能的人将成为这场竞赛的牺牲品。
然而,我并非在此断言这些观点正确与否。我只想提醒你,在历史的长河中,无论是哪个时代,人们总是对快速的变化感到恐慌。然而,每个时代的人都发现了应对变化的方法。所以,当你面对自己的恐慌,以及外界所制造并放大的恐慌时,请尽量保持冷静,与自己进行一场深度对话,通过升维和降维的方法去处理那些令你恐慌的未知事物,搞清楚这一切究竟是怎么一回事。
希望你记住这本书,并把它带在身边,它会成为你的陪伴者,并时刻提醒你:Don’t panic(别慌)!
这是一个非凡的时刻!人们在形容那些跨越式变革的时候,通常会陷入词穷的境地,仿佛被巨大的奇观震惊到失语。通常用到的无非“某元年”“新纪元”“新的时代”“革命性”等为数不多的词汇。
自2022 年 11 月 30 日 ChatGPT 发布以来,“AI 元年”“通用人工智能元年”“最具革命性的技术”等词汇可谓铺天盖地,人们恨不能将所有震撼的、突兀的词汇都用尽——即便有些说法罔顾了事实——只为能够博取眼球。仿佛如此一来,自己便站在了时代的潮头,成了那个引领时代的人。
每当一个伟大的时代到来,都难免泥沙俱下,鱼龙混杂。但在这喧嚣的背后,你依然会感到时代脉搏的振动,不疾不徐却沉稳、有力。
我希望这本书能拥有它的读者。
我希望它的读者是独立思考的、自主行动的,而不是人云亦云的、迷信权威的。独立思考,才不易沦为“镰下之韭”。自主行动,才不致成为他人的“瓮中之鳖”。不贪眼前之鱼,才能被授以渔。不迷信权威,才能得意忘言。
技术进步是神速的,而技巧是速朽的,你今天孜孜不倦追求的技巧,明天可能就过时了。唯有独立的思想,才是引领你穿越迷雾的唯一凭据。
时代变化越是快速,你越是需要掌握那些不变的东西。如果你要学习方法,也应当学习一法破万法。
本书当然会呈现给你很多方法层面的东西,但在方法之下、在应用之前的,是思想上的交流与涌动,以及生产方法的元方法。实际上,本书就是基于这样的逻辑而构建的。
如果你只想看具体的方法、拿到开箱即用的东西,你可以直接跳转到案例与实践篇。
如果你尚未使用过ChatGPT、Claude、豆包、DeepSeek、通义千问、Kimi、智谱清言、讯飞星火、文心一言[1]等对话式交互的 AI,你可以先去尝试一下,或直接跳转到第4章,感受一下它们的强大。
[1] 文心一言APP已升级并更名为文小言。
如果你是提示工程师,或者已经在自己的工作、生活中使用这类 AI 增强自身能力,你将从这里获得生产方法的元方法,获得哲学层面的启发和系统性的方法论。注 需要说明的是,由于当前 AI 本身的问题,在 AI 的平台上,发送同样的提示语给它,得到的回应并不会是完全一致的,但实际上这正是它“智慧”的一种体现,或者说是它当下“智慧”的副作用。所以,重点是掌握思路,而不是记住具体的对话或者提示词模板。这也是我们强调掌握生产方法的元方法的原因。因此,你将获得更大的收益,因为你从这里可以溯本求源,获取深层的认知。
如果你是应用层创新、产品研发相关领域的从业者,或者本身就是底层大语言模型的从业者,你将能从这本书里看到更人文的、更“他山之石”的理解,从而获得一个新的视角。
第1篇是哲学与思维篇,采用直觉与逻辑融合的方式,阐述了苏格拉底式辩证法与 AI 算法的贯通,从二者的内在契合点开始,探索如何快速习得苏格拉底式辩证法,如何掌握辩证法的核心原理,并由此推导出与 AI 对话的原生方法。第2篇是案例与实践篇,讲述了成体系的 AI 召唤术,以及场景化的应用和练习,系统地解决如何从零到一、从一到亿地使用 AI的问题。
只几个石头磨过,
小儿时节。
铜铁炉中翻火焰,
为问何时猜得?
不过几千寒热。
人世难逢开口笑,
上疆场彼此弯弓月。
流遍了,
郊原血。
一篇读罢头飞雪,
但记得斑斑点点,
几行陈迹。
五帝三皇神圣事,
骗了无涯过客。
有多少风流人物?
盗跖庄蹻流誉后,
更陈王奋起挥黄钺。
歌未竟,
东方白。
——毛泽东《贺新郎·读史》
人类社会进化的高度由什么来决定
人类所掌握的物质生产和信息生产的工具决定了人类社会进化的高度。人类社会的发展程度,虽然有多个衡量指标,但是如果只选择一个核心指标,毫无疑问是社会化大生产的发达程度。这种物质上的生产、文化信息上的生产,是存在于部落、地域、民族、多民族国家的,还是存在于跨国、跨文化、跨种族之间的,显然是人类社会发达程度的核心标志。
人类作为一个整体,在物质生产上的推进,首先依赖于对能源的掌握,力求不断扩大能源来源、提升能源利用效率。在人类掌握打制石器的时代,几乎只能以狩猎和采集为生。在人类掌握了畜力后,农耕文明得到进一步的发展。后来人类掌握了化石燃料,推动了第一次工业革命。再后来人类掌握了电力,进入了电气时代,并支撑了信息时代的发展,为 AI 时代的到来打下了坚实的基础。至此,人类终于创造出了将电能转换为智能,或者说将电力转换为智力的系统。也许以后,随着核能的突破和大规模使用,我们将进入新的时代。
在信息方面,人类不断提升信息的生产、存储、流转的规模和效率。从仓颉造字到汉字的发展与简化,从泥板、龟壳、青铜、竹简,到造纸术、印刷术,再到计算机、互联网、人工智能、脑机接口……人类在物质世界之上构建的信息世界,越来越庞大,且越来越难以与现实清晰地分割,“通用人工智能”的曙光似乎已经照到了我们这代人的头上。
无论如何,我们总能发现,人类能用上什么工具、有多么善用工具、在多大程度上用好工具,决定了渺小的人类能否借助杠杆拥有巨人的力量“撬动地球”。
就普通人而言,人机交互带来的变革是更为显著的
人类社会进化的话题似乎过于宏大了,对这个时代的普通人来说,人机交互的变革带来的影响可能更为直接。
在进入信息化社会之后,交互形式经历了几次大的变革,每一次变革都改变了无数人的生活乃至命运。从最早的科学家、数学家们用打孔纸编程,到程序员、极客们用命令行与计算机交互,再到我们通过图形界面跟计算机、手机交互,人类智慧的结晶——以计算机为代表的电子产品,也从科研产品、少数人使用的生产力工具,一路成为大多数人都已熟识并使用的产品。自iPhone以来的手持电子设备——智能手机,也凭借其比计算机终端更便捷的交互方式,拓展了信息化的边界,让更多年龄段、地域的人加入了移动互联网。
现在,我们与机器的交互形式终于进化到了自然语言层面。所有的电子产品,也正在变成或即将变成所有人可以交互的终端。
诚然,自然语言交互并不一定意味着交互效率的提升。就像在图形界面时代,程序员们依旧大量使用命令行这种交互形式。说话不一定比单击图标来得更快,单击图标不一定比输入一行命令来得更快。但现在,自然语言交互可以将这一切都整合起来。况且,在图形化交互的范式下,用户的行为是被预设了有限种可能的路径,而AI这种双向沟通、对话式“交互”才是真正的“交互”,是比图形界面更高了一个维度的。从理论上来说,这种交互带来了更高的人机交互自由度。
从交互上来讲,自然语言是人类智慧“天然”的交互方式。因为人类的核心智慧几乎都以文字形式存在,或者能被文字表达。就像人形机器人将是最佳的民用机器人设计,这是因为人类社会的一切工具都是“以人为本”进行设计的,外形像人的机器人自然能无缝使用这些工具。
而预训练的大语言模型更是让知识平价化了,每一个掌握与AI对话能力的人,都能无障碍地访问所有行业的智慧结晶。自然语言交互最大的意义是让所有普通人能参与进来,使用人类数千年来沉淀的智慧,以及近几十年来突飞猛进的AI技术。
这是所有人的机会和危机。请注意,它首先是普通人的机会。而如果你消极应对,那它就会成为危机。
在AI 成为超级工具的背景下,我们不进则退。作为个体你必须回答的问题是,你是否要驾驭超级工具,成为超级个体?
重点说明,后文所述AI 如无特殊说明,即指ChatGPT,以及接近其水平的此类 AI 。
本书在介绍与AI互动的案例中,尽量原样保留了AI回应的内容。希望读者能够客观地看待AI回应的内容,其在准确性和实用性方面可能存在疏漏,仍无法完全满足用户的需求,需要具体情况具体分析。
如何掌握AI这一超级工具,是摆在所有人面前的重要问题。技术的进步必然会使技术变成解决问题的方法,进而使职业技能变成通用技能,这符合技术发展的趋向。对于大多数人而言,我们提倡的是将 AI 作为一种方法以全面提升自我能力,而非仅仅将AI视为一种传统意义上的计算机技术。
那么,把 AI 作为方法的核心是什么呢?就是从“基于对话的预训练大语言模型”里引导出“世界级”的知识和强大的“推理能力”。简言之,核心就是如何与 AI 对话。
技术的进步是人类文明发展的驱动力之一。在发展进程中,昔日那些属于少数精英和专家才能掌握的“高深”技术,逐渐普及和社会化,最终变成了大多数人都可以掌握、应用的日常技能。这一变化在历史的长河中屡见不鲜,而我们当前正处于新的变革浪潮之中,那就是人工智能技术的快速发展。
以驾驶技术为例。在汽车问世后,驾驶汽车是一项需要专门学习和掌握的技术,曾经,驾驶员是一个高薪岗位。但随着驾驶技术和汽车的普及,开车几乎变成了人们的一项基本技能。而今,随着自动驾驶技术的发展,驾驶汽车将由人工智能来辅助人类甚至替代人类完成。
再以打字为例。在打字机问世后,打字也是一种由专业打字员从事的高薪工作。但随着计算机和打字软件的普及,打字很快由专职工作变成了一项人人都要掌握的基本技能。如今,生成式AI技术的发展使打字甚至都不再是一种必要行为了,你只需要说出需求,AI 就会为你生成一系列文本。
从编程的演变历程,我们也可以看到同样的内在逻辑。最初的编程是基于烦琐的二进制代码的,后来出现了 C 、Java、Python、Rust 等更为人性化的高级语言,而现在的AI编程,令程序开发变得更加简单和便捷。编程曾经是科学家、数学家的工作,后来出现了程序员这一高薪职业,未来绝大部分编程工作可能会由 AI自动完成。
曾有一段漫长的时期,优质的教育资源是稀缺资源。而现在,通过网络和 AI 技术,优质的教育资源得以分享到世界的每一个角落,海量的在线课程、教育应用以及个性化学习平台,使每个人都有机会学习新知识,享受优质的教育服务。
艺术创作曾经是少数天才艺术家的独占领域,但数字艺术工具和 AI 创作软件正在降低艺术创作的门槛,使更多的人能够尝试和参与艺术创作。如今,AI 绘画和音乐创作软件能够协助人们创作出令人惊叹的艺术作品,还可以拓展人们的复杂技艺,更加展现自己的艺术个性。
这一系列的变革,无不揭示出技术的社会化是技术发展的必然趋势。技术的进步必然使应用技术变成解决问题的方法,使得原本仅由某个群体或少数人掌握的技术社会化、普及化,使更多的人受益。
对于那些曾经享有“技术特权”的人来说,他们的优势地位将被技术的社会化过程削弱。而对于那些没有“技术特权”的人来说,他们将有机会分享到 技术社会化带来的利益和便利。现如今,AI技术的社会化进程也是对所有人一视同仁的,无论对精英还是大众来说,这都是一场伟大的变革,更是一场人人皆可享用的饕餮盛宴!
请接住 AI 时代给予你的馈赠,而不要被这馈赠所淹没!
必须将AI作为方法而不是目的,
必须将AI作为技能而不是职业!
学习AI的使用技巧不是最终目的,学习这本书也不是为了让你仅仅成为提示词工程师、GPT工程师、AI工程师……你的目标不是成为他们,而是将这些“职业”变成你的技能。就好比要掌握驾驶技能,而不是要成为驾驶员;要学会打字,而不是要成为打字员。你应该将AI变成你的技能,作为你解决问题的方法。
如果你觉得偏理性思辨的部分过于枯燥,可以先跳转至第3章,直接上手操作。
你无须了解阳光如何经过层层大气洒落人间,便可沐浴冬日的暖阳;你无须理解风如何穿梭于山川、涤荡林海,便可享受春风拂面;你无须理解水汽如何漂洋过海,雷电如何激发,就可以感受夏日雨后的清新;你无须理解每一种物候的信号、温度的起伏,依旧能共鸣于深秋的“山远天高烟水寒”。
你无须知道音符是怎么跃动的,也能沉浸于音乐的海洋;你无须明白色彩如何交织,便可被画中景致所打动;你无须明白烹饪中的化学反应,也能遍尝美食的鲜香。
你无须知道晶体管的制程和通信原理,也能手持轻巧的电子设备,与千里之外的人沟通;你无须知道什么是二进制和高级程序语言,也能使用办公软件完成你的工作;你无须知道像素阵列和显色原理,也能用照相机拍摄动人心魄的画面,记录生活的真实一刻。
是的,你无须知道这一切的细节,也能很好地生活、工作、娱乐。
面对AI 也是如此,震惊之余,你无须知道AI背后的深奥技术原理,依然可以享受它带来的便利,AI 依旧是为人服务的——至少在当前这个阶段还是如此,问题只不过是为哪些人服务而已。
尽管在一百多年前莱特兄弟就已经将飞机开上了天空,但是直至能设计和制造出大飞机的今天,人们其实仍然不完全清楚飞机是如何飞起来的,因为没有掌握完备的空气动力学理论。人们使用能量守恒定律作为很多学科的基础,但至今,物理学家也不知道“能量究竟是什么”(费曼)。诸如ChatGPT 这种预训练的大语言模型为什么会涌现智能,尚且没人能完全讲明白。
事实上,大多数事物的发展路径并不存在完美无缺的预先设计。所以,你大概要接受一种观念——在对一件事物没有完全了解的情况下,不妨碍我们使用它,甚至大规模地使用它。人类社会就是这么走过来的。
由于科学教育的普及,不少人会有一种错觉——身边事物的规律已经被人类完全掌握了,再也没有什么超乎人类认知之外的东西。但实际情况并非如此。例如空中的乱云飞渡,河中大大 小小的漩涡,这些常见的湍流现象,并没有完全被人类破解;现代医学已经取得了极大的进步,但人们对诸多疾病依然难有确切的认知和很好的治疗途径;关于意识的产生机制,也没有形成绝对的共识。
因此,如果你不是直接打造大语言模型的相关从业者,也不是大语言模型的底层研发者,那么与AI 相关的诸多底层问题与概念,实际上可以与你无关。
除去那些底层研发者才会关心的概念,你需要关心的是什么呢?你可以关注LLM、GPT和ChatGPT这三个关键词,然后跟着我们一起从这里出发,认识 AI。
我们在这里主要谈论 ChatGPT,不只因为它是开创者,是先锋,也是因为它的大众认可度较高。还因为实际上 ChatGPT 是一种功能性的命名,它的名称就来自于它的实现。注 事实上,你可能早就注意到了,ChatGPT 并没有真正通用的中文名称,普遍都是以英文原文出现的。
就好比微博本身指的是类似 Twitter 的微型博客,曾经有搜狐微博、腾讯微博、新浪微博,但是新浪微博后来干脆命名为微博,而独占了这一类目。ChatGPT 实际上就相当于以微博命名微博。所以,从它出发就能洞察此类 AI 的核心逻辑。
以下是关于LLM、GPT和ChatGPT的一般说明。
LLM(Large Language Model,大语言模型)是一个计算机科学术语,描述了一类大型的、用于处理语言任务的神经网络模型。一般指生成式模型,典型的也就是 GPT 系列模型。生成式模型是一类机器学习模型,它能学习数据的内在分布,并能基于学到的分布生成新的、未见过的数据样本。
GPT(Generative Pre-trained Transformer,生成式预训练变换器)是 LLM 的一种,由 OpenAI 开发。GPT是一种基于注意力机制的非常先进的自然语言处理模型,通过大量文本数据的预训练和生成式语言模型学习,它能理解和生成具有连贯性和一致性的自然语言文本。
ChatGPT 是 GPT 模型的一个特定版本或配置,用于与人类进行对话(Chat)。
抛却所有的技术细节,GPT 的基本概念相当简单:采集人类已经创作的文本(超多的书籍、百科、对话等),然后训练神经网络,使其“编写”跟这些文本相似的文本(也就是“生成文本”),但是这种编写并不适合作为人类的“助理”响应人类的对话。所以,ChatGPT 就在这个基础上做了一些特殊处理,使它能够根据人类输入给它的“提示”,来“编写”跟训练时相似的文本。
换句话说,GPT 就像一座庞大的宇宙图书馆,它从人类的文本中学习了大量的信息和知识。但是,图书馆自己是不会回答问题的,因此我们给它找了一个超级图书管理员,你跟这个管理员对话,这个管理员可以查阅所有的图书,并与你进行交流。这就是 ChatGPT。
因此,我们可以为 ChatGPT 进行直观的、切合本意的中文命名,它就是“为对话而生的预训练大语言模型”。
虽然我们进行了比喻,但实际上,这里有一个关键性的问题还需要稍作解释——为什么一个大语言模型看上去具备学习、理解和对话的能力?
在 2023 年 3 月,OpenAI 的前首席科学家 Ilya Sutskever与英伟达 CEO 黄仁勋有一场对话,我们来看 Ilya Sutskever是如何解释的。这段对话非常精彩,我们撷取部分原文呈现于此。
Ilya Sutskever:当我们训练大型神经网络来准确预测互联网上大量不同文本的下一个词时,我们在做的其实是在学习一个世界模型。从表面看,神经网络只是在学习文本中的统计相关性,但实际上,学习统计相关性就能把知识压缩得很好。
神经网络所学习的是生成文本过程中的一些表述,但这个文本实际上是这个世界的一个映射,世界在这些文字上映射出来。
因此,神经网络正在学习从越来越多的角度去看待这个世界,看待人类与社会,看待人们的希望、梦想、动机,以及相互之间的影响和所处的情境。神经网络学习的是一种压缩、抽象、可用的表示形式,这是从准确预测下一个词中学到的。
神经网络对下一个词的预测越准,还原度越高,你看到的文本的准确度就越高。这就是 ChatGPT 模型在预训练阶段所做的,它要尽可能多地从世界的映射(也就是文本)中学习关于世界的知识。
但这不能说明神经网络会表现出人类希望它表现出的行为……这就需要第二阶段的微调、人类反馈的强化学习及其他形式的AI系统的协助,这个阶段做得越好,神经网络就越有用、越可靠。
……
让我们举个例子,假设你读了一本侦探小说,它有复杂的故事情节、不同的人物及许多事件和神秘的线索。在书的最后一页,侦探收集了所有线索,召集了所有人,然后说:“好吧,我要透露犯罪嫌疑人的身份,那个人的名字是 X。”我们需要预测“X”这个词。对于大语言模型而言也是如此,它可能会预测出很多不同的词。通过预测这些词,可以让模型实现越来越好的理解。随着对文本理解的不断深入,GPT-4 预测下一个词的能力也会变得越来越好。
黄仁勋:在某些领域,它似乎展现了推理能力。在预测下一个词的时候,它是否在学习推理?它的局限性又是什么?……
Ilya Sutskever:推理并不是一个很好定义的概念。但无论如何,我们可以尝试去定义它。推理就是当你想更进一步的时候,如果能够以某种方式思考一下,就能得到一个更好的答案。
我想说,我们的神经网络也许有某种机制,例如要求神经网络通过思考来解决问题。事实证明,这对推理非常有效。但我认为,基本的神经网络能走多远,还有待观察。我认为我们还没有充分挖掘它的潜力。
某种意义上,推理能力还没有达到很高的水平,神经网络还具备其他的一些能力。我们希望神经网络能够有很强的推理能力,我认为神经网络能持续提升这个能力。不过,也不一定是这样。
从这段对话可以看出 ChatGPT 的创造者们的一些观点。
第一,GPT-4 实际上压缩了世界级的知识,而 ChatGPT 的 GPT-4 及以上的版本能供所有人通过对话去访问这些知识。它将各领域昂贵的、存在认知壁垒的经验和知识平价化了,将“特权知识”社会化了,而这些知识是当前任何一个人都不可能完全掌握的。所以,我们应该找到一种方法来导出我们需要的知识以尽可能地用其所长。
因为大语言模型是预训练的,所以未联网的经过预训练的独立大语言模型对新知识的掌握是存在延迟的。当然,也因为是经过压缩的知识,所以大语言模型本身并不会完整记录所有的“原文”,它得到的是一些概率分布,这也就导致了所谓的大模型“幻觉”——它可能会自己胡编乱造一些不存在的东西。所以,我们应当采用独立的数据源进行验证,就像我们会对人类的创意持有批判性的态度那样。
第二,从结果上来看,当前的 GPT-4相当于有了一定的理解和推理能力,但人们普遍认为它的推理能力暂时还不如人类。不知道你发现没有,人类的认知有一个有意思的现象,仿佛AI 只有超越了最强的人类,才算超越。就像 AlphaGo 只有超越了人类顶尖围棋手,才算超越人类。但问题是,AI 已经超过了大多数人,看看它是以多高的分数通过那些考试就知道了。当下我们在使用它的时候,为了更好地发挥它的推理能力,我们要尽可能地为它“提供思路”。注 这种思路可以是某些具体的方法,例如贝叶斯定理、波特五力模型、OKR等,对于众人皆知的方法,有时候你只需要提起这个名称,AI 内化的知识即可被唤醒。思路也可以是一种分析过程,甚至只是你们之间的一种逐步深入、逼近真相的对话。
综上所述,我们可以得出结论——如何从“为对话而生的预训练大语言模型”中,引导出世界级的知识和强大的“推理能力”,就是把 AI 作为方法的核心。