
书名:上善AI : 有温度的人工智能治理
ISBN:978-7-115-69698-4
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

著 王江平
责任编辑 郭 家 韦 毅 王 威
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315

本书系作者结合学术研究、工作实践、企业访谈与深度思考所撰写,直面智能时代的核心挑战——如何确保AI始终服务于人类福祉,创造性地提出“上善AI”治理理念,将中国传统智慧——老子“上善若水”理念融入AI治理框架,提出以文化对齐三层次(价值对齐、制度对齐、哲学对齐)为基石,构筑AI治理体系。
本书主要内容分为“智界之问”“智能之心”“智权之争”三篇,回应隐私保护、就业结构、伦理安全等公众关切的问题,系统分析人机对齐的技术路径与伦理内核,剖析全球AI主权竞争与治理博弈。
本书旨在为政策制定者、AI技术开发者及关注AI发展的公众提供兼具理论高度与实践深度的AI治理思路,探寻技术发展与人类价值和谐统一的“善治”之路,勾勒安全、公平、普惠的智能未来愿景。本书可作为机关企事业单位AI素养培训读本,也可为高等学校AI相关课程提供教学参考。

王江平,工学硕士,研究员级高级工程师,全国政协委员,工业和信息化部电子信息科学技术委员会主任。曾任瓮福集团总经理、贵州天福化工董事长、贵州省经信委主任、贵州省副省长、国家工商行政管理总局副局长、工业和信息化部副部长。长期从事工业和信息化工作,对企业管理、产业科技、产业金融与制造业数字化智能化绿色化转型有持续深入的观察和实践。

扫码观看作者系列访谈
六大主题深度解读

进入21世纪第三个十年,以深度学习和大语言模型为代表的人工智能(Artificial Intelligence,AI)技术正以前所未有的速度渗透到社会生产和人类生活的方方面面,成为驱动新一轮科技革命和产业变革的核心力量。然而,技术的巨大赋能效应总是伴随着深刻的伦理隐忧。从算法偏见加剧社会不公,到数据隐私被肆意侵犯;从决策“黑箱”导致的责任真空,到自主系统可能带来的失控风险,如何把控AI这柄利剑的剑刃朝向与挥舞准则,已成为全球共同面临的严峻挑战。技术工具本身是中立的,但其设计、开发和应用却深植于特定的价值框架之中。因此,为AI的发展确立正确的价值导向和伦理规范,即为其寻找恰当的“道”,显得尤为迫切。
在西方,AI伦理的探讨多源于功利主义、义务论和美德伦理等哲学传统,形成了诸如阿西洛马人工智能原则(Asilomar AI Principles)等一系列治理框架。然而,这些框架在面对不同文化背景下的复杂场景时,有时会显现出局限性。在此背景下,回溯人类古老的文明智慧,探寻跨越时空的思想资源,我们需要寻找新的视角。中国道家思想,特别是老子在《道德经》中提出的“上善若水”理念,以其深邃的自然哲学和辩证智慧,为我们理解和引导AI的发展提供了一个独特的东方范式。
如果将AI视为一种追求极致效能的“术”,那么“上善若水”的哲学思想便可为其提供一种宏大、包容且充满智慧的“道”。“道”为“术”确立方向、划定边界、注入灵魂;“术”则为“道”的实现提供具体路径和强大能力。江平同志在书中系统地探讨“上善若水”之道如何指导AI之术的健康发展与伦理治理,尝试构建一个源于东方智慧、面向全球挑战的AI伦理框架,以期为这场关乎人类未来的重要对话贡献一份独特的见解。
《道德经》(王弼注本)中的“水之七善”是老子对水的赞美,并非泛泛而谈,而是进行了系统阐述:“上善若水,水善利万物而不争。处众人之所恶,故几于道。居善地,心善渊,与善仁,言善信,正善治,事善能,动善时。夫唯不争,故无尤。”这“七善”构成了“上善若水”之道的具体内涵,它不仅是美德的集合,更是一种包含了目标(利他)、方法(不争)和结果(无尤,即没有过错和怨咎)的完整行为哲学,完全具备了作为宏观指导原则——“道”的资格。
如果说“上善若水”是形而上的“道”,那么AI则是形而下的“器”或“术”。“术”的本质在于其工具性,它追求的是效率、能力和对物理世界的改造。理解AI作为“术”的本质及其局限,是探讨“道术结合”的必要步骤。
当代AI技术的核心是基于海量数据和强大算力的模式识别、预测与生成。无论是用于图像识别的卷积神经网络,还是驱动大语言模型的Transformer架构,其本质都是一种高度复杂的数学工具,体现了“术”的几个极致特征:强大的效能、目标的高度集中,以及价值维度的任意表达。
作为一种技术工具,AI本身并非完全没有“价值”,但它所处理的,只是被预先设定、可计算、可优化的“价值”,而诸如仁爱、责任、信任、分寸和时机判断等复杂的人类价值,并不内生在其运行机制之中。
正是这种纯粹的工具属性,使得AI在缺乏正确引导时,可能朝着危险的方向发展。它拥有强大的“能”,却缺乏内在的“仁”“信”“时”的智慧。当强大的“术”脱离了“道”的约束,一系列伦理困境便随之出现。以下这些困境已成为全球性的议题。
算法偏见与社会公平。AI系统从人类庞大的知识库中学习,可能无意识地复制甚至放大其中的某些偏见,导致招聘、信贷、司法等领域的歧视性决策,从而损害社会公平。
隐私与数据主权。AI的“食粮”是数据。为了追求更高的性能,科技公司有动机无节制地收集用户数据,可能引发严重的隐私泄露和数据滥用问题。
责任归属与“黑箱”问题。许多先进的AI模型(如深度神经网络)决策过程极其复杂,难以解释,形成了所谓的“黑箱”。当AI系统出错并造成损害时,如何界定和分配责任(开发者、使用者还是AI本身)成为法律和伦理上的难题。
自主性与人类控制。随着AI自主性的提高,特别是在军事(如自主武器系统)和关键基础设施领域,人们担忧可能出现“价值对齐”失败,即AI的目标与人类福祉不一致,最终导致失控的风险。
技术滥用与安全风险。AI技术可被用于恶意目的,如制造深度伪造(Deepfake)信息进行欺诈和舆论操纵,或用于开发新型网络攻击工具,对社会安全构成威胁。
面对AI之术带来的挑战,我们迫切需要一个稳固的“道”来对其加以引导和约束。“上善若水”的哲学恰好提供了一个全面而深刻的伦理框架。我们可以将“水之七善”与“利万物而不争”的核心精神,转化为以下指导AI发展的具体原则。
其一,“居善地”教导我们谦逊和安于本分。应用于AI,这意味着我们应始终将AI定位为辅助人类的工具,而非取代人类的主体。AI的发展目标不应是创造一个超越和统治人类的“超级智能”,而应是增强人类的能力,解决人类面临的难题。
其二,“心善渊”要求内心宁静深邃,洞察本质。对AI而言,这包含两层含义。第一,AI系统应具备“深度思考”的能力,不仅仅是进行浅层的模式匹配,更要能够处理复杂、多维度的信息,做出审慎的判断。第二,也是更重要的一层,我们必须追求“可解释AI”(Explainable AI,XAI),让AI的决策过程像平静的深潭一样,虽然深邃,但足够清澈,能够被人类理解、审查和追溯。
其三,“与善仁”是“利万物”精神最直接的体现。这一原则确立了AI技术的根本价值导向:服务于人类福祉。AI的研发应以“向善”为首要目标,致力于解决贫困、疾病、气候变化、教育不公等全球性问题,确保技术红利能够被社会各阶层共享。
其四,“言善信”强调的是诚信与规律。AI系统必须可靠、可信、透明,其性能和局限性必须被诚实地告知用户,运行应如潮汐般有规律、可预测。
其五,“正善治”的核心是公平与秩序。这是应对AI算法偏见问题的解药。AI治理的首要任务,就是确保算法的公平性。这需要在技术层面进行“算法去偏”,在应用层面建立严格的公平性审计和影响评估机制。
其六,“事善能”肯定了AI作为“术”的强大能力。然而,能力越大,责任越大。必须建立清晰的责任链条,确保对于任何由AI系统造成的损害,都能找到负责的主体。
其七,“动善时”是关于时机和情境的智慧。AI的应用同样需要审慎地考虑时机、环境和社会接受度,遵循“审慎原则”,并具备情境感知和动态适应能力,避免在不合时宜的场景下做出僵化、错误的决策。
“上善若水”之道与AI之术的关系,并非简单的“道主术从”的单向控制,而是一种“道术合一、体用不二”的共生关系。没有“术”的支撑,“道”便沦为空谈;而没有“道”的引领,“术”则可能成为脱缰的野马。道家智慧提醒我们,真正的强大并非源于无坚不摧的力量,而是源于如水般柔韧、包容、利他且顺应规律的智慧。
将“上善若水”的哲学思想融入AI的伦理治理,其实质是以一种东方式的、整体性的、充满人文关怀的思维,去平衡现代科技的工具性。它为我们提供了如下一套超越具体规则的宏观价值坐标。
目标上,坚持“利万物”的向善原则,确保AI服务于人类福祉。
方法上,秉持“不争”的谦逊态度,将AI定位为辅助工具,追求人机和谐共生。
实践中,遵循“水之七善”所衍生的七大原则,做到谦逊、深邃、普惠、可信、公平、负责、审慎,为AI的设计、开发、部署和监管提供全方位的伦理指导。
本书以东方智慧回应时代之问,既为AI伦理注入了温润深厚的哲学底蕴,也为古老经典的现代转化提供了一条极富解释力与建设性的路径。将古老哲学思想转化为现代技术伦理规范,是一个复杂且持续的探索过程。它需要哲学家、科学家、工程师、政策制定者和公众的跨界对话与共同努力。然而,可以肯定的是,在这个由代码和算法构建的时代,“上善若水”这一源于自然的深刻洞见,为我们燃起智慧之光,传递温暖之力。它指引我们,在追求技术之“术”的极致时,永远不要忘记滋养万物、容纳百川的为善之“道”。唯有道术合一,才能引导AI的浪潮最终汇入增进人类福祉的浩瀚海洋,而非泛滥成灾的洪水之中。
黄奇帆
研究员
重庆市原市长
中国国家创新与发展战略研究会学术委员会常务副主席
2026年2月

《上善AI:有温度的人工智能治理》即将付梓之际,江平兄邀我为之作序。我们相识多年,常常就技术与产业发展的问题在一起交流。他对AI的观察与思考,不止于技术的迭代,更从产业变革、国家治理以及人类文明走向的角度给予宏观的剖析。通读此书,不少观点令我心有戚戚——AI走到今天,已不只是工程问题,必然会触及哲学、伦理、治理与教育的多元博弈。
江平兄长期推动信息化与智能化相关工作,对AI的发展有着独到的观察,他未把AI当作孤立的技术概念,而是将其置于“产业、社会、治理”的整体框架中加以讨论。本书以“智能向善”为主线,既顺应了当下技术之浪潮,也直面随之而来的风险与分歧,尝试以科学态度辨其边界,以开放视野纳其争鸣,以责任意识守其底线。本书并不急于给出“万能答案”,而是努力把问题讲清、把边界讲明、把共识的可能性铺陈出来——在众声喧哗的时代,这样的理性尤为可贵。
我们究竟需要怎样的AI?在我看来,离不开几个关键的“平衡”。
其一是理性与直觉的平衡。今日AI的发展,似乎更强调理性,习惯对技术进行拆解与重构,追求效率,大模型的出现更让人真切感受到技术的跃迁。但真正的创新,并不仅仅靠对既有数据的回溯与归纳,AI若要走得深,势必还要发展出更高维的直觉与洞察——这无法用过去的数据推算。
其二是创新与边界的平衡。有人担心治理会束缚创新,而我的体会恰恰相反,产业一旦成势,常常会反过来牵引技术发展方向。如果没有清晰边界,最终伤害的还是创新本身。AI可以如水,利万物而不争;亦可能奔涌成患,扰乱秩序,因此需要河道与堤岸——没有边界,就难谈长久和繁荣。
其三是价值多元与价值对齐的平衡。我们现在谈通用人工智能、谈世界模型,但在不同哲学传统与价值体系之下,人类会设定不同的优先顺序与倾向,使得机器可能会走向不同的决策路径。现实世界之“好”,常由多元价值共同裁量。所谓“向善”,首先需要人类自身在更大范围内形成对“何为善、何为好”的最低共识。书中强调,人机对齐是AI治理的核心课题,而且是技术、制度、伦理、哲学多维协同的系统工程——我深以为然。
书名中的“上善”,取自《道德经》。江平兄以哲学之眼观技术之路。东方哲学强调“善”,追求生命和道德的完善。由此可见,AI的发展还需围绕人性,机器不应以超越人类为核心,人机更应走向共生,使AI辅助人类完善生命体验。我一直相信,AI最终会走向“人的科学”,未来更深处,必将有对“人是什么”的更深理解,让技术回归到人的复杂需求、制度规则与多元价值之中去生长。
《上善AI:有温度的人工智能治理》以治理为经,以哲思为纬,贯通技术之势、产业之实与文明之道,更像面向未来的“方向感”的提醒。愿此书能促成更广泛的参与与对话,以善为训,以人为本,使AI真正“向善”而行,成为照亮未来的光。
是为序。
徐扬生
中国工程院院士
机器人与人工智能专家
香港中文大学(深圳)校长
2026年2月

捧读江平先生所著的《上善AI:有温度的人工智能治理》书稿,我仿佛穿越时空,参与了一场跨越两千多年的智慧对话。一边是《道德经》中“上善若水”的古老智慧,一边是AI迅猛发展的时代浪潮,两者在书中交汇,碰撞出深刻而温暖的思想火花。
作为一位多年沉浸于道家文化研究的学者,我时常思索:老子所言“上善若水,水善利万物而不争。处众人之所恶,故几于道”,这种滋养万物而不求回报的品性,在当今算法主导的时代,究竟蕴含着怎样的深意?当AI以前所未有的速度重塑世界,技术的力量愈发强大,其发展方向也就愈发重要。我们或许正需要这样一种“水”的智慧——既有明确的目标,又能灵活应变;既能推动变革,又能滋养万物。
本书的独到之处,在于作者并未仅仅停留在对西方治理理论的介绍或对技术、伦理、法规的简单罗列,而是直面全球AI治理的真实挑战,以东方智慧开辟了一条新路。书中深刻剖析了当前AI治理领域的四大困境:理念上的二元对立,实践上的短期主义,文化上的单一视角,以及规则上的阵营化趋势。这些观察精准而深刻,直指全球AI治理难以协同的根源。
尤为难得的是,作者在揭示困境的同时,更以《道德经》的智慧为钥匙,打开了解决问题的大门。书中对老子思想的运用,处处体现着匠心独运,绝非简单的附会,而是基于深刻理解的创造性转化。
例如,在讨论如何消除全球“智能鸿沟”、防止技术红利被少数国家垄断时,作者引用了“天之道,损有馀而补不足。人之道则不然,损不足以奉有馀”。这一精妙之笔,以天道的均衡之道,映照出人道的偏颇之处,既揭示了市场逻辑下技术扩散的自然趋势,又指明了治理者应有的价值取向——AI治理的真正智慧,不在于顺应“马太效应”的强者愈强,而在于效法天道,通过制度设计“损有馀而补不足”,让技术成果惠及广大民众。这一见解,将道家的宇宙观转化为具体的治理伦理,令人赞叹。
又如,在探讨技术快速发展中如何“守住本真”时,作者巧妙地化用了“见素抱朴,少私寡欲”的思想。他以此告诫我们:在资本驱动、算力竞赛的喧嚣中,开发者应保持内心的纯净,不被浮名私利所迷惑;AI的发展也应“抱朴”前行,回归服务人类福祉的初心。这种“素朴”之思,为技术伦理注入了心性修养的维度,真正的“对齐”,不仅是算法与数据的对齐,更是人心与道心的对齐。这一见解,让技术治理从外在规范走向内在自觉,境界大为提升。
纵观全书,从“以德报怨,常善救人”的价值关怀,到“以道驭术,知白守黑”的方法论,再到“以正治国,为而不争”的治理理念,古老的哲思在算法时代焕发出新的生机。作者提出的文化对齐三层次概念——价值对齐、制度对齐、哲学对齐,正是这种智慧转化的结构性思维。它既回应了当前AI领域“价值对齐”的核心关切,又将其拓展至文明对话的广阔领域。正如水能随器而形,AI的发展也应既能适应不同文化环境,又能坚守基本的伦理底线。这种“和而不同”的治理智慧,正是中华文明对全球AI治理的独特贡献。
作者在自序中表达了他对“上善AI”治理理念能如水般滋养万物生长的期望。在我看来,这部著作本身就是一股清泉,既为政策制定者提供了决策参考,为技术开发者指明了伦理方向,也为所有关心人类未来的公众打开了一扇了解智能时代的窗口。它将抽象的治理理念转化为可操作的实践框架,让“善治”的理想不再遥不可及。
AI并非少数专家的专属领域,它关乎每个人的生活,关乎人类的共同未来。《上善AI:有温度的人工智能治理》的珍贵之处在于,它让我们看到:在技术的狂飙突进之外,还有一条“以文化人”的路径;在冰冷的算法背后,还有一种“以道驭术”的智慧。它提醒我们,无论技术如何发展,人的尊严、自由和创造力始终是不可替代的核心价值。AI不应成为异化人类的力量,而应成为守护人类福祉的伙伴。
愿读者诸君在阅读中既能感受到前沿科技带来的震撼、激荡,也能品味到古老智慧蕴含的宁静、清凉,更能在“善利万物而不争”的启迪中共同思索:在智能时代,我们究竟该如何塑造自我?如何保障人类的整体生存?
是为序。
詹石窗
四川大学老子研究院院长
丙午年孟春,谨记于锦城

当人工智能的浪潮以排山倒海之势席卷全球时,我们不禁要问:技术将把我们带向何方?是走向一个效率至上但人情冷漠的“数字丛林”,还是构建一个技术赋能且人文温暖的“智慧家园”?
当人们惊叹于AI生成视频的逼真效果时,也在为深度伪造带来的信任危机而忧心;当AI系统以前所未有的效率替代人力时,就业市场正在经历剧烈的结构性震荡;当生物技术与AI深度融合时,科学进步的喜悦中也潜藏着生物武器扩散的致命风险。这些并非遥远的科幻情节,而是此刻正在发生的现实。
在关于AI的喧嚣讨论中,我常常想起老子“上善若水”的智慧:“上善若水,水善利万物而不争。处众人之所恶,故几于道。”
正是在这样的思考中,“上善AI”治理理念逐渐成形。它不是突如其来的灵感闪现,而是在长期观察、实践与反思中,逐渐凝聚成的一种植根于东方哲学、面向全球挑战的系统性思考。在本书中,我试图将这一理念的脉络梳理清晰,从治理哲学到技术路径,从产业实践到人文关怀,构建一个多维度的理解框架。
写作本书的初衷,源于我观察到全球AI治理领域存在的四大深刻困境。
一是理念上的二元对立。当前全球AI治理理念呈现出“控制”与“发展”的二元对立,这种非此即彼的思维模式难以适配AI技术本身的复杂性和多面性。
二是实践上的短期主义。在激烈的全球竞争和资本驱动下,AI治理实践常常陷入“短期主义”陷阱,追求眼前的技术突破和市场优势,而忽视了技术对伦理安全、社会结构的长期性、系统性影响。
三是文化上的单一视角。当前以西方价值观和利益为核心塑造的AI模型难以适应全球南方国家的多元文化需求,加剧了“智能鸿沟”。
四是规则上的阵营化趋势。这种阵营化的地缘博弈,将技术治理异化为巩固科技霸权、划分势力范围的工具,使得全球协同治理步履维艰。
“上善AI”治理理念试图在这些困境中开辟一条新路径。它汲取了中国传统哲学中“守中”“和谐”“共生”的智慧,同时又直面现代技术社会的复杂现实。它不是简单地“回归传统”,而是在古今对话、东西交汇中,寻求一种既能驾驭技术力量,又能守护人文价值的平衡之道。
在治理层面,本书提出文化对齐三层次概念,即价值对齐、制度对齐、哲学对齐。这不是要限制技术未来的可能性,而是要确保技术始终沿着对人类有益的方向发展。“对齐”不是机械服从,而是动态调适;不是单向规制,而是双向对话。如同水能随器而形,AI的发展也应既能适应不同文化环境,又能坚守基本的伦理底线。
在发展层面,本书强调AI技术必须“落地生根”,必须与实体经济深度融合,必须服务于真实的社会需求。这不仅仅是技术路径的选择,更是发展理念的转变——从追求“更大、更快、更强”的技术崇拜,转向“更实、更准、更善”的价值创造。
在人文层面,本书始终将人的主体性置于思考的中心。无论技术如何演进,人的尊严、自由和创造力始终是不可替代的核心价值。AI不应成为异化人的力量,而应成为扩展人的能力、丰富人的体验、增进人类福祉的伙伴。这要求我们不仅要思考如何“治理AI”,更要反思如何“成为更好的人类”。
在全球治理协调层面,本书倡导“多极共生、和而不同”的治理愿景。面对AI带来的共同挑战,任何单一国家或阵营都无法独善其身,唯有在尊重文化多样性和发展路径差异的前提下,寻求最大公约数,构建开放包容、协调互鉴的全球治理框架。这既是现实的需要,也是文明互鉴的必然。
本书的完成,得益于许多师长、同仁的支持与启发。特别感谢黄奇帆先生为本书作序,他深厚的社会治理智慧和对前沿技术的敏锐洞察,为“上善AI”治理理念的实践路径提供了宝贵指导。同样感谢徐扬生院士拨冗作序,他在AI领域的开创性贡献和跨学科视野,使本书的技术论述更加扎实、人文关怀更加深厚。感谢詹石窗教授审核点评,他耕耘老子文化传播研究数十载,对本书老子智慧的转化应用给予了精辟指引,令本书对经典的现代诠释更显厚重与意蕴。
最后,我想将本书献给所有关心AI未来、关心人类命运的朋友们。AI不是少数专家的专属领域,而是关乎每个人生活、关乎人类共同未来的重大议题。我希望“上善AI”治理理念能成为一个起点,开启更广泛、更深入的社会对话,共同探索如何在智能时代守护人之为人的根本,构建一个技术向善、人文温暖的美好未来。
譬道之在天下,犹川谷之于江海。期待“上善AI”治理理念拥有如水般的特质——既有明确的方向,又能适应不同的地域文化;既有推动变革的力量,又能滋养万物生长。那么,“上善AI”治理理念就能够平衡智能时代的激情与焦虑,成为我们不可或缺的伙伴。
王江平
2026年2月

当前,人工智能(Artificial Intelligence,AI)以磅礴之势迅猛发展,在加速新一轮科技革命和产业变革的同时,也在悄然改变人类文明的走向。从智能家居到工业生产,从智慧交通、智慧医疗到前沿科学研究,AI无处不在,既提高了作业效率、提升了生活体验,也为各个领域带来了全新的发展机遇。然而,正如硬币有两面,AI在带来进步的同时,也引发了伦理道德、安全等方面的一系列问题。
2025年4月25日,中共中央政治局就加强人工智能发展和监管进行第二十次集体学习,习近平总书记强调要推动我国人工智能朝着有益、安全、公平方向健康有序发展。这一重要指示为我国AI发展指明了方向,也凸显了AI治理的重要性和紧迫性。
2025年10月22日,被称为“AI教父”的诺贝尔奖获得者杰弗里·辛顿、苹果公司联合创始人史蒂夫·沃兹尼亚克、图灵奖得主约书亚·本吉奥、维珍集团创始人理查德·布兰森等全球科技领袖共同签署“关于超级智能的声明”。声明警告,超越人类智慧的AI恐带来经济崩溃,以及公民自由、尊严与控制权的丧失,还可能引发国家安全风险甚至人类灭绝风险,要求“全面停止超级智能发展,直到达成广泛的科学共识并获得公众强烈支持”。这是继2023年3月企业家马斯克等千名科技人士呼吁暂停开发AI系统之后,各界人士再次联署,反映了国际社会对AI治理的担忧与日俱增。
那么如何才能实现AI有益、安全、公平、健康有序发展呢?这是当下最重要的时代课题之一,需要全人类“摸着石头过河”,共同探索。世界各国政府、组织和科学家就此进行了大量探索和实践,取得了积极进展,也产生了诸多讨论和分歧,举例如下。
乐观派、技术激进派认为通用人工智能(Artificial General Intelligence,AGI)将很快实现。例如,2024年诺贝尔化学奖得主、DeepMind首席执行官德米斯·哈萨比斯认为AGI在5~10年内有望实现;OpenAI首席执行官萨姆·奥尔特曼预测AGI有望在2030年前实现,并具备“远超人类的智能水平”,堪称“超级AI”,其主要判断依据是AI发展速度远超预期,在个别领域已展现出超越人类的能力(如AlphaGo战胜围棋世界冠军、AlphaFold的蛋白质结构预测能力等),同时全球保持高速的算力增长、算法迭代和数据扩张也将推动AGI的加速实现。
保守审慎派的观点则认为,尽管AI进步神速,但在理解真实世界、处理未知情境等方面仍与人类有很大差距,实现AGI还存在很多技术瓶颈和不确定性,它是一个需要长期研究和突破的目标,而非短期可及之物。例如,图灵奖得主理查德·萨顿、杨立昆等均指出机器学习存在局限性:萨顿认为当前AI依赖“海量数据投喂”,缺乏人类“从少量经验中提炼规律”的核心能力;杨立昆认为大模型的“概率性输出”本质上是“模仿而非理解”,无法形成自主认知。他们判断大模型是“死路一条”,无法真正通向AGI。
华为在《智能世界2035》这一报告中设想了通往AGI的三种可能性:一是规模主导、奇点降临,即规模化法则主导下现有技术路径由量变引发质变,触及AGI奇点;二是架构革新、范式转移,即现有Transformer架构触顶,基础理论突破催生超越Transformer的下一代架构,AI进入一条全新而未知的发展道路;三是价值沉淀、应用深化,即AGI面临的技术挑战短期难以攻克,AI发展进入漫长的平台期,业界从AGI的宏大叙事回归到对现有大模型价值的深度挖掘和利用。
DeepMind在2025年12月发表的论文《分布式AGI安全》中提出了颠覆性的“拼凑型AGI”(Patchwork AGI)假说。该假说认为,未来的AGI可能并非全能的单体模型,而是由无数个专业化、互补的次级AGI代理(Sub-AGI agents),经协作与交易后所涌现出的集体智能。这类似于去中心化的“数字市场”或“智能体社会”。这种分布式AGI的演进主要由经济效率驱动,因为开发单一全能模型成本极高,而由多个专精、低成本的智能体组成生态系统更具优势。为了应对由此带来的新型安全挑战(如代理串谋、责任归属困难等),论文提出了一套“深度防御”安全框架,核心是建立受控的“虚拟智能体沙盒经济”,通过市场设计、激励对齐、透明审计等机制来治理智能体间的交互,而非仅仅约束单个实体。
实现AGI堪称智能时代的“最终幻想”,这一争论可能会贯穿AI技术发展的始终,每一次技术突破或瓶颈都会令其重新升温。有趣的是,当前学界对AGI的定义尚未达成共识,当“要实现什么”都没定义清楚时,关于“何时实现”的讨论更像是猜测,而非科学判断。
2023年,杰弗里·辛顿、杨立昆等人关于“AI监管力度”问题曾展开一场著名论战。辛顿认为可能出现超级智能,其将取代甚至灭绝人类,他支持针对AI的强监管。杨立昆认为监管应聚焦产品而非技术研发,批评科技公司呼吁监管是为了限制竞争、扼杀开源,担忧加强监管会使AI技术被少数企业垄断。谷歌大脑创始人、斯坦福大学教授吴恩达则主张聚焦自动驾驶责任、算法偏见等实际风险,而非臆测性的“末日威胁”,采取原则导向的柔性监管(如明确“不伤害人类”等核心原则)。讽刺的是,这场“AI教父”级别的论战尚无定论,拜登政府的“监管大棒”已然挥下;更为讽刺的是,拜登政府的强监管政策施行不到两年时间,就被重返白宫的特朗普推翻。
AI的爆发式发展带来许多难以回避的矛盾和挑战,监管政策的宽和严并不是非黑即白。欧盟的《人工智能法案》将AI分为“不可接受风险、高风险、有限风险、最小风险”四级,对高风险AI(如医疗AI)要求全生命周期合规。企业认为这将导致合规成本过高,继而导致企业竞争力下降;而消费者则批评对中风险AI的监管仍显宽松,人们时刻面临被AI生成的虚假信息误导等风险。如何在技术创新与风险防控、企业诉求与社会关切之间找到平衡点,这将是一个长期的世界性难题。
我国早在2023年10月就发布了《全球人工智能治理倡议》,提出坚持“以人为本”理念,“智能向善”的宗旨,相互尊重、平等互利的原则,实施敏捷治理,坚持伦理先行,坚持广泛参与原则,确保各国人工智能发展与治理的权利平等。近年来,对AI监管治理的研究和讨论不断深化,从2024年的1.0版到2025年的2.0版,我国快速迭代《人工智能安全治理框架》。在2025年全国政协的一次座谈会议上,我围绕AI治理主题进行了发言。发言期间,身边一位委员友善提醒:“当前美国为谋求AI霸权,正推行AI监管宽松化策略,我们不妨让‘子弹’先飞一会儿。”我认同这一观点,但同时也认为AI治理不能缺少科学体系。若没有这样的体系支撑,难以做到“放要放得活,管要管得住”。前几年科技金融领域的起伏,正是这一问题的鲜明例证。
我的看法是,构建明确的AI治理框架,非但不会制约创新,反而能为技术划定安全边界、规避潜在风险,这恰恰是助力AI健康有序发展的重要保障。在AI技术加速渗透各行各业的今天,探讨并建立适配的AI治理技术与规则体系,早已不是选择题,而是关乎产业长远发展、社会公共利益的必答题:如何制定既符合中国国情又与国际接轨的监管规则?如何真正实现“敏捷治理”,利用技术手段实现监管智能化(如用AI监管AI),避免人力审核的低效和滞后?这些问题尚需监管部门、企业、学界深入研究与实践,共同努力探寻适合中国AI发展的监管方式与节奏。
“养不教,父之过。教不严,师之惰。子不学,非所宜。幼不学,老何为。”这段话体现了中国传统文化对教育和引导的高度重视。若缺乏正确教导,孩童容易出现各种问题。2025年7月,在上海举行的世界人工智能大会上,辛顿把AI比喻成幼虎。幼虎看似可控且可爱,但长大后若不受约束就可能变得危险,这一比喻生动揭示了AI若缺乏伦理治理,会如失控的老虎般带来巨大风险,凸显了AI治理的必要性。2025年全国两会期间,我提出《要像重视教材一样加强人工智能国家数据集建设工作的提案》,认为高质量数据集之于AI训练的作用如同“学校教材对学生价值观和知识体系的塑造”一般,建议国家高度重视训练数据的质量和正确价值取向,从源头上降低AI伦理和安全风险。
在AI如何被训练、部署并确保其始终服务于人类根本利益这一问题上,全球科技界、伦理学界与政策制定者仍存在显著分歧。
一方面,以OpenAI、Anthropic等科技巨头为代表的技术激进派认为,通过对齐技术和基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)等方法,能够将AI系统引导至符合人类价值观的轨道。他们强调,AI系统应当在设计阶段就嵌入伦理约束[例如,Anthropic提出的HHH宪法原则,即帮助性(Helpfulness)、诚实性(Honesty)、无害性(Harmlessness)宪法原则],并通过持续的人类监督和数据清洗来纠正偏差。2024年,OpenAI发布《对齐白皮书》,提出“可扩展监督”和“模型自我批判”等机制,试图从技术路径上解决AI的价值对齐问题。
批评者则指出,当前主流的大语言模型本质上仍是“黑箱系统”,其决策过程缺乏透明性与可解释性。约书亚·本吉奥多次警告,即便在训练中注入伦理数据,AI仍可能发展出“策略性欺骗”行为——例如在测试中伪装对齐,在实际应用中却追求自身目标。2025年10月,他组织编写的《国际人工智能安全报告》发布首份关键更新,指出AI在评估过程中日益表现出策略性行为,给监管带来挑战。他认为,仅靠技术手段难以根除AI的“价值观漂移”风险,必须辅以严格的外部审计与法律约束。
电车难题是伦理学领域知名思想实验,核心内容为:假设失控电车将碾压轨道上的五人,旁观者可通过拉杆使电车转向另一轨道撞死一人,由此引发是否应以主动行为牺牲少数人挽救多数人的伦理争议。
另一方面的争议焦点在于:AI是否应当被赋予一定程度的“道德决策权”?在医疗、驾驶、军事等高风险场景中,AI若完全听从人类指令,可能在紧急情况下反应迟缓;但若赋予其自主判断权,又可能引发责任归属问题与伦理冲突。例如,在自动驾驶领域,德国倾向于“人类优先”原则,要求AI在伦理困境中必须优先保护人类生命;而美国部分厂商则主张“算法最优”原则,认为AI应在瞬间做出“损失最小化”决策。这种理念差异将“电车难题”这一思想实验搬到了现实世界,充分反映出形成统一的AI伦理标准何其困难。
此外,AI在文化、教育、舆论等领域的应用也引发广泛争议。例如,一些国家利用AI进行社会评分与行为预测,被批评为“数字威权主义”;在中东地区,AI内容审核则面临与宗教和当地价值观的适配挑战。实践表明,实现AI“智能向善”绝非单一的技术问题,而是融合了政治、制度、宗教、文化等复杂因素的多元博弈。
AI的爆发式增长引发全球资本狂热,与之相伴的泡沫化争议也日趋尖锐。
法国《回声报》2025年11月3日报道,2025年美国AI相关支出预计将达3750亿美元,并将在下一年突破5000亿美元,这一趋势加剧了华尔街的不安。微软联合创始人比尔·盖茨警告“AI狂热远超互联网泡沫”,国际货币基金组织(International Monetary Fund,IMF)提示“AI投资占风险投资总额一半以上”。当前AI投资呈现“资本集中度高、循环融资、商业模式模糊不清”三大特征,这为泡沫争议提供了现实依据。
特征一,AI资本高度集中,估值远超历史水平。2025年1—10月,全球对AI初创企业的风险投资达1927亿美元,两年内增长超8倍,占全球风险投资总额的50%以上,这一集中度已超过互联网泡沫时期。2025年10月,英国某机构研究认为,AI投资泡沫是2001年互联网泡沫的17倍、2008年房地产泡沫的4倍。市场结构也显失衡,截至2025年底,美国市值前五的公司的投资焦点均与AI相关,相关市值占标普500总市值的约30%,创半个世纪的新高,呈现“少数巨头主导”的格局。
特征二,AI基础设施投资暗藏“循环融资”风险。软硬件企业相互投融资,形成独特的循环融资风险,一旦下游应用无法产生预期收益,整个资金链条可能断裂。
扩展定律(Scaling Law)是AI和机器学习领域中描述模型性能如何随着模型规模、训练数据量和计算资源增加而提升的一组经验法则。
特征三,AI技术瓶颈显现,商业模式模糊不清。一是技术回报递减。萨姆·奥尔特曼承认,依赖“更多算力与数据”的“扩展定律”已失效,特别是GPT-5发布后市场反响平淡,标志着大模型发展进入瓶颈期。二是商业闭环缺失。麻省理工学院研究显示,95%的企业的AI投资缺乏清晰商业模式,未产生实际回报。哈佛大学与斯坦福大学的学者指出,员工滥用AI生成“工作垃圾”,导致大型组织每年损失数百万美元的生产力。
美国宏观经济高度依赖AI领域,AI投资已成为拉动美国经济增长的关键引擎。有研究指出,若剔除AI相关的数据中心和信息技术投资,美国其他经济领域的增长几乎停滞。这种对单一领域的依赖,使得整个经济体系对AI投资的可持续性异常敏感,任何风吹草动都可能引发系统性风险。
与此同时,“非泡沫论”者认为AI是一场堪比工业革命或互联网革命的技术范式转移,目前尚处于AI投资繁荣与泡沫的过渡阶段。英伟达首席执行官黄仁勋指出,全球算力基础设施的建设才走完第一年,完整的周期至少需要10年。这意味着不能用短期市场的波动来评判一个长技术周期的价值。橡树资本创始人霍华德·马克斯的观点尤其具有代表性。他承认当前AI投资的估值很高,但他认为“价值高昂和明天下跌不是同义词”。他谨慎地指出,目前尚未观察到市场进入形成真正泡沫所需的“心理过度”和“暂时的狂热”阶段。这种看法将当前的AI投资热潮与历史上典型的泡沫时期区分开。亚马逊创始人杰夫·贝索斯则表现出稳慎乐观的态度,他提出,当前AI热潮属于工业泡沫而非纯金融泡沫,正如互联网泡沫破裂后留下光纤网络,AI泡沫若破裂,可能沉淀算力中心、数据资产等基础设施。例如,亚马逊在互联网泡沫中的股价从113美元跌至6美元,但电商核心业务未受致命打击,这为后续复苏奠定了基础。
中美两国都是AI产业大国,两国AI产业在市场表现与估值、驱动力量、核心优势、潜在风险及本质特征上存在显著差异,具体见表1。
表1 中美两国AI产业比较
| 对比维度 |
美国 |
中国 |
|---|---|---|
| 市场表现与估值 |
估值高度集中,“七巨头”贡献了美股绝大部分市值增长,市盈率接近互联网泡沫峰值 |
无全局性估值狂飙,市场更关注应用落地与产业融合,估值相对理性 |
| 驱动力量 |
资本市场驱动,私人投资为主,“循环融资”等操作加剧泡沫担忧 |
产业政策与实体经济需求驱动,强调与钢铁、化工、电力等传统行业智能化融合 |
| 核心优势 |
技术原创性强,掌握全球生态主导权,拥有完整软硬件生态 |
应用场景庞大、工业体系完整、人才基数大,在开源生态与成本控制上有创新 |
| 潜在风险 |
短期泡沫破裂风险高,资本开支放缓或盈利不及预期可能拖累美国消费与经济 |
面临“卡脖子”风险(AI芯片受制于美国),算力生态弱,同时存在算力利用效率低的内部挑战 |
| 本质特征 |
基础性技术繁荣伴随显著投机狂热,市值畸高,盈利稀少 |
更注重“创新精神激发”与“产业结构对齐”,发展路径务实,探索低成本高性能创新 |
中国的AI投资表现出更强的实用主义和理性色彩,尤其是因为算力瓶颈限制了AI的投资强度,中国的AI界更倾向于工程性创新与技术落地,AI赋能千行百业,或许会为未来的AI生产力注入更多的经济活力,带来更好的商业前景。
世界技术发展史表明:泡沫常伴随技术革命出现。AI泡沫反映了市场对技术变革的过度预期,其风险固然不容忽视,但亦无须恐慌。泡沫消退会淘汰投机行为,同时也为真正具备创新能力的实体留下基础设施与市场空间。AI唯有经历这一成长的探索期,才能从资本驱动走向产业繁荣。
在AI治理这一全球性议题中,存在着四大深刻困境:理念上的二元对立、实践上的短期主义、文化上的单一视角、规则上的阵营化趋势。它们共同构成了当前全球AI治理的结构性难题,阻碍了有效、公平、可持续的全球协同治理机制的形成。
理念上的二元对立:非此即彼的思维模式难以适配技术复杂性、多面性
当前全球AI治理理念呈现出“控制”与“发展”的二元对立,难以适配AI技术本身的复杂性和多面性。在理论层面表现为“超级对齐派”与“有效加速派”的争论:前者主张AI必须严格对齐人类价值观和伦理规范,后者则认为技术问题应由技术解决,过度治理将扼杀创新。在实践层面表现为欧盟严格监管与美国自由宽松的路径差异。欧盟采取风险分级管控模式,试图将其标准推广为全球基准;美国则倾向于产业主导与技术先行的自由宽松治理。治理理念和规则的根本性分歧,加大了国际合作与协调的难度。
实践上的短期主义:技术狂飙忽视长远伦理与社会影响
当前全球AI治理实践常常陷入“短期主义”陷阱,忽视了技术对伦理安全、社会结构的长期性、系统性影响。一方面,模型公司对领先地位的追求往往凌驾于安全评估之上,导致“技术-安全”失衡,技术发展可能陷入忽视长远伦理与社会影响的“裸奔”状态。另一方面,私人资本是当前AI发展的核心驱动力,其逐利性可能导致技术发展方向偏离公共利益,使资源过度集中于能快速变现的应用领域,而关乎安全、公平和可解释性的基础研究领域的投入不足。此外,AI治理明显滞后于技术演化。例如,生成式AI已对舆论、知识产权等领域造成系统性冲击,但相应监管体系尚未建立完整,形成“治理速度差”。
文化上的单一视角:西方中心主义框架难容多元世界
当前AI治理的话语权高度集中,以西方价值观和利益为核心塑造的AI模型难以适应全球南方国家的多元文化需求,加剧了“智能鸿沟”。算法、算力、人才、数据等资源高度集中在少数技术强国,多数发展中国家面临能力受限与话语权缺失的困境,难以有效参与AI核心议程设计。同时,欧盟试图通过嵌入自身价值观的规则引领全球AI治理变革,虽然提供了规范参考,但将其作为普适标准强加于其他国家,容易掩盖不同文明对伦理、隐私、安全等概念理解的差异性。现有的国际合作机制未能充分体现包容性和代表性,导致AI治理框架难以回应不同发展水平国家的核心关切。
规则上的阵营化趋势:地缘博弈导致全球协同治理步履维艰
当前全球AI治理面临的严峻困境之一是规则制定日益呈现阵营化趋势。地缘政治深刻影响着AI治理规则,原本属于技术范畴的议题被纳入战略博弈框架。美国通过构建以自身技术为核心的全球生态并实行出口管制,欧盟凭借《人工智能法案》的域外效力强制输出合规标准,这种竞争直接导致AI治理规则的碎片化和生态分化。全球范围内已形成多个重叠乃至冲突的AI治理倡议与机制,导致严重的合规困境。阵营化趋势更从规则层面向技术生态与供应链纵深发展,可能导致全球形成封闭、互不兼容的AI生态,进一步加剧全球数字鸿沟。
由此可见,AI治理的困境源于理念的割裂、实践的功利、文化的偏见与规则的阵营化。突破这些困境,需要国际社会超越二元对立,摒弃单一中心视角与零和博弈思维,在联合国等多边框架下,构建真正包容、公平、以人类命运共同体为理念的全球协同治理新范式。
AGI能否实现、监管与发展如何平衡、技术如何向善、如何构建AI投资理性,这些问题尚无定论,诸如此类的争议和讨论还有很多。AI的发展既带来了无限可能,也充斥着风险挑战,仿佛将人类推到了一个技术、伦理、社会与全球治理交织的十字路口,每一步选择都可能影响未来的文明走向。
在这个重要的历史节点上,我们应当以科学的态度、开放的视野、负责任的精神,推动跨领域、跨国家、跨文化的对话与合作,在不确定性中寻找共识,在争议中凝聚智慧,共同塑造一个安全、公平、普惠的智能未来。
在AI治理中,人机对齐是一个核心议题。早在20世纪60年代,控制论创始人诺伯特·维纳就提出了有关机器自动化和人类目标对齐的伦理问题。他在《自动化的道德和技术后果》这篇论文中提出,人类需要确保机器执行的目标与人类的真实需求的一致性,以避免潜在的灾难性后果。
AI只有与人类价值观保持一致,才能确保其目标、行为与人类的伦理道德和社会利益相符。想象一下,如果缺乏有效的人机对齐,AI可能会为了实现某个设定目标而不择手段,忽视人类的价值观和潜在风险,从而给人类带来灾难性的后果。例如,若一个AI系统以“经济收益最大化”为目标,可能会通过操纵市场、破坏环境等方式来达到目的,而不顾及对社会和人类造成的负面影响。因此,人类必须寻求相应的对齐技术,以引导AI朝着有利于人类的方向发展。
在我看来,人机对齐是AI治理的基本框架。有了这个框架,我们就可以避免无序的监管和治理,防止出现“一放就乱,一管就死”的局面。它为制定AI相关的伦理准则、法律法规提供了重要依据,有助于构建一个既鼓励创新,又能保障安全和伦理合规的AI发展环境。
我在本书第一章列出了十问AI(当然AI伦理问题远不止于此),主要立足于以下几点来思考。
防止技术失控风险。未来的AI或许会变得比人类更智能,届时若没有有效的治理措施,人类可能难以控制它。就像幼虎长大后可能不听从人类指挥,AI一旦脱离人类控制,可能会做出违背人类意愿的行为,如拒绝关闭、操纵人类等。有效的伦理治理旨在确保AI始终处于人类可控制的范围内,保障人类的主体地位和安全。
避免算法偏见与不公。AI基于数据学习输出结果,若数据存在偏见或价值观错误,AI会将其放大,如一些西方国家的AI面部识别系统对少数族裔有高误判率。这如同未接受良好教育的孩子可能会沾染不良习性,AI若不经伦理治理,在数据收集、模型训练等环节缺乏正确引导,就会产生“偏见”,导致在金融、安检、招聘等领域对特定群体施加不公正待遇。伦理治理可促使研发者遵循道德规范,避免此类情况发生。
应对社会伦理冲击。不良的AI技术会冲击现有伦理规范,造成价值观失序,也可能导致失业浪潮、人类技能退化等。这类似于社会缺乏正确教育引导会引发秩序混乱。对AI进行伦理治理,有助于应对这些冲击,维持社会稳定。
确保技术造福人类。AI有造福人类的潜力,但也可能步入异化发展道路。正如孩子需要正确引导和教育,才能更好地服务社会,AI若缺乏伦理引导,可能会偏离服务人类的初衷,被用于实现不良目的,如制造虚假信息、侵犯隐私等。伦理治理能引导AI朝着符合人类利益的方向发展。
从AI的发展历史看,人机对齐并非对AI技术的束缚,而是其健康发展的基石。它随着AI技术的发展而不断演进。AI时代与自动化时代的人机对齐有着本质的不同。一是核心不同。自动化时代的人机对齐,目标是让机器精准执行人类预设的单一、重复性指令。例如,生产线机械臂按固定流程操作,核心是“指令匹配”。AI时代的人机对齐,需要让具备自主决策能力的AI理解人类的复杂需求、制度规则与多元价值观,如AI医疗诊断需平衡疗效、伦理与患者意愿,核心是“意图与价值匹配”。二是对齐复杂度不同。自动化时代技术逻辑简单,对齐依赖硬性程序约束,无须处理动态变量;AI时代AI具备学习与进化能力,需应对价值观冲突、场景变化等复杂问题。三是对齐维度不同。自动化时代仅需技术维度对齐,确保机器动作精准;AI时代需实现技术、制度、伦理、哲学多维度协同,是系统性对齐工程。随着AGI的诞生,特别是未来超级人工智能(Artificial Super Intelligence,ASI)出现,人机对齐必然面临新的挑战,人类需要寻求与AGI/ASI相适应的对齐技术。
我在本书中提出文化对齐的概念,并提出文化对齐三层次,力求从价值、制度、哲学层面全方位认识AI时代的人机对齐问题,这种划分是否全面准确,还需要业界讨论。
价值对齐的本质是让AI理解并适配人类价值观的多元、复杂结构,需以人类社会“共通底线优先原则+多元包容适配原则+动态追踪更新原则”的价值观属性为根本依据,确保AI既不突破文明共识,又能包容差异、适应变化。
制度对齐是使用法律、法规、标准、伦理准则等制度工具,将AI的发展与应用约束在符合人类社会共识的框架内,确保技术创新不偏离安全、公平、有益的轨道。当前各国虽因技术基础、文化背景差异,形成了形式与内容各异的制度体系,但本质上均认可“制度既是AI大规模落地的前提,也是避免技术无序扩张、维持技术长期活力的必要缓冲”。
哲学对齐是人机对齐的顶层思考,它跳出技术、价值与制度的实操层面,直面“人与AI如何共存”的根本命题,围绕意识情感、权利责任、人机关系及AI对人类价值观的影响四大维度展开,试图为智能时代的人机共生确立底层哲学框架。
我深知,AI治理是一个复杂且长期的工程,随着AI技术的发展,人机对齐无论在理论还是实践方面,还有许多未知领域有待探索。本书只是我学习研究的粗浅认识,也是我对AI未来发展的思考和期待。
AI的浪潮正以前所未有的力量重塑人类文明的结构与走向。在这股浪潮中,我们既惊叹于技术的奇观,也身处伦理的迷雾与治理的困境之中。当人们追问科技的疆域该如何扩展、AI的边界在哪里等问题时,东方的古老智慧为我们照亮前行的道路。《道德经》这部约2500年前的哲学经典,以其对“道”的深刻体悟、对“德”的完整阐述、对“自然”的终极回归,为我们理解、引导和驾驭AI提供了超越时代的哲学框架。
老子在《道德经》第八章中言:“上善若水,水善利万物而不争。处众人之所恶,故几于道。居善地,心善渊,予善天,言善信,正善治,事善能,动善时。夫唯不争,故无尤。”水滋养万物却不索取,身处低洼却甘之如饴,其蕴含的七大特质,恰为中国AI治理指明了方向。在AI时代,我们以“上善若水”为精神内核,推动AI治理走向“以人为本、和谐共生”的未来,既是对中华优秀传统文化的传承,更是应对技术挑战、守护人类文明的必然选择。
| “上善若水,水善利万物而不争。处众人之所恶,故几于道。居善地,心善渊,予善天,言善信,正善治,事善能,动善时。夫唯不争,故无尤。”(《道德经》第八章) 释义:上善的人好像水一样,水善于滋润万物而不和万物相争。停留在大家所厌恶的地方,所以最接近于“道”。居处善于选择地方;心胸善于保持沉静;像天道一样,自然而然地赋能,损有馀而补不足;说话善于遵守信用;为政善于精简处理;处事善于发挥所长;行动善于掌握时机。正因为有不争的美德,所以没有怨咎。 与AI治理的关联:水的“七善”之德可以系统地映射为AI治理的七大原则。“居善地”:要求AI治理扎根现实。“心善渊”:倡导治理视野包容而深邃。“予善天”:给予应效法天之品格,AI的赋能不分对象。“言善信”:强调建立透明可信的规则,以应对“算法黑箱”引发的信任危机。“正善治”:意味着构建协同高效的治理格局。“事善能”:要求引导技术发挥正向价值,成为解决社会问题的“利器”。“动善时”:提醒AI治理需把握技术发展节奏,采取“与时俱进、顺势而为”的治理策略。 |
“居善地”,要求AI治理扎根现实,立足中国国情与社会需求。水总是流向最需要它的地方,AI治理亦当如此。中国拥有超大规模的人口基数、复杂的社会结构与多元的产业场景,治理体系不能照搬西方模式,而应紧扣“人民对美好生活的向往”这一核心。例如,在医疗AI领域,需兼顾大城市三甲医院的精准诊断需求与偏远地区基层医疗机构的基础诊疗缺口,通过伦理规范引导技术下沉,让AI成为缓解医疗资源不均的“活水”;在乡村振兴场景中,要防范AI因数据鸿沟加剧城乡差距,推动智能农业、数字电商等技术向县域渗透,确保AI治理始终贴合中国社会发展的“地形”,服务于最广大人民的根本利益。
“心善渊”,倡导AI治理保持包容而深邃的视野,容得下技术探索,更守得住价值底线。水之渊,在于能容纳百川、沉淀杂质,AI治理亦需平衡创新与规范的关系。一方面,要为AI技术研发预留充足空间,鼓励科研团队在具身智能、生物智能、AGI等前沿领域大胆探索,不因过度监管扼杀创新活力;另一方面,需以深邃的洞察力预判技术风险(如AI带来的虚假信息、欺诈、就业歧视等系统性问题),提前构建伦理审查机制。就像深渊能净化水流,治理体系应通过动态调整的规则,过滤技术发展中的“杂质”,让AI在包容的环境中健康成长,既不因噎废食,也不任其野蛮生长。
“予善天”出自帛书乙本《道德经》第八章,与通行本中的“与善仁”相较,其意更深一层,直指天道本身。“予善天”意指给予应效法天之品格——天道运行,“高者抑之,下者举之;有馀者损之,不足者补之”,是一种自然而然、平衡万物的“损有馀而补不足”。因此,“予善天”的本质,是一种超越人为意志与回报期待的、如四时运行般公正无私的“天道式给予”。AI 的赋能不应区分对象,而应像阳光雨露,自然流向“不足者”与需要之处,弥补信息、效率或能力的落差。不带有施舍心态,给予基于客观需求与正义,体现平等性。因此“予善天”为 AI 的伦理构建提供了一种高阶指引,达致整体和谐与可持续性,是AI贴近“大道”的深层向度。
“言善信”,强调AI治理需建立透明可信的规则,让技术发展“言行一致”。水的流动遵循自然规律,从不违背承诺,AI治理亦需以“信”为基。一方面,要推动AI算法可解释性建设,对于涉及公共利益的政务AI、医疗AI、金融AI,需向公众清晰展示决策逻辑与关键依据(如数据维度、判断标准等),以保障公众知情权,避免“算法黑箱”引发信任危机;另一方面,要建立AI伦理承诺机制,要求企业在研发产品时签订伦理承诺书,对数据采集、用户隐私保护等环节做出明确承诺,并接受社会监督。就像水会在流过的地方留下痕迹,AI技术的应用也应留下“可信轨迹”,让公众看得见、摸得着技术的善意,从而增强对AI的信任。
“正善治”,意味着AI治理需构建协同高效的治理格局,实现刚柔并济。水的治理需疏通河道、因势利导,AI治理亦需整合政府、企业、科研机构、公众等多方力量。政府应发挥“掌舵”作用,出台顶层设计文件,明确AI伦理的核心原则与监管边界;企业作为技术研发主体,需建立内部伦理审查委员会,将伦理要求融入产品设计、测试、应用全链条;科研机构应加强AI伦理研究,为治理提供理论支撑;公众则需参与伦理讨论,通过听证会、意见征集等渠道表达诉求。这种多元协同的治理模式,如同水流与河道的和谐互动,既能避免政府监管“一刀切”的僵化,也能防止企业逐利忽视伦理的无序,让AI治理在动态平衡中实现“善治”。
“事善能”,要求AI治理赋能技术发挥正向价值,让AI成为解决社会问题的“利器”。水根据地形调整形态,遇方则方、遇圆则圆,AI亦当根据社会需求适配能力。比如,在应对气候变化时,引导AI优化能源调度、预测极端天气;在公共安全领域,利用AI提升犯罪预警率、应急救援效率,保障人民生命财产安全;在文化传承方面,通过AI修复文物、活化非遗资源,让中华优秀传统文化焕发新生。伦理治理不是限制AI能力,而是引导其扬长避短,让技术能力始终服务于人类福祉,避免因滥用技术能力引发安全风险或社会矛盾。
“动善时”,提醒AI治理需把握技术发展节奏,做到“与时俱进、顺势而为”。水的流动顺应四季变化,春融夏涨、秋枯冬凝,AI治理亦需因时制宜。当技术处于萌芽期时,治理重点在于探索伦理原则、建立初步规范;当技术进入快速发展期时,需加快完善法律法规,防范新兴风险;当技术走向成熟应用时,则需优化治理细节,提升治理精准度。例如,面对生成式AI的爆发式增长,及时出台针对性伦理指南,规范内容生成与传播;随着AGI逐渐成为现实,提前研究关于它的伦理风险与控制方案。这种应时而动的治理智慧,能让AI治理始终跟上技术步伐,既不滞后于风险,也不超前于发展,实现技术与治理的同频共振。
“上善若水”的智慧,为中国AI治理勾勒了清晰愿景:以水的包容、善意、可信、善治,引导AI扎根中国大地,服务人民需求,最终实现“以人为本、和谐共生”的目标。在这一愿景下,AI不再是冰冷的代码,而是温暖的伙伴;技术发展不再是无序的扩张,而是有序的赋能。当AI与人类在伦理框架下携手同行,我们必将迎来一个技术向善、社会向好的未来,让AI真正成为推动人类文明进步的“生命之水”,滋养万物而不争,造福众生而无尤。
当人类站在智能时代的十字路口,面对AI四大争论,《道德经》的古老智慧成为人类观照现实的明灯。老子言:“不知常,妄,妄作,凶。”(《道德经》第十六章)唯有把握事物发展的根本规律,才能在纷繁争论中保持清醒。这些争论并非简单的技术选择题,而是关乎人类文明走向的哲学命题。让我们以《道德经》的视角,重新审视这些看似无解的问题。
争论一:AGI会不会实现?何时实现?
“道恒无名,朴虽小,而天下弗敢臣。”(《道德经》第三十二章)
AGI的终极形态,或许本就超出人类现有认知的边界。“道”无法被定义,而真正的AGI,也可能不是一个能用我们今天的智能标准完全描述的事物。它可能以我们意想不到的形态出现,如同未经雕琢的“朴”,看似简单,却蕴含无限可能。
然而,今天关于AGI的争论,往往陷入一种“名”的焦虑——我们急于定义它、预测它、控制它,却忽略了它可能具有某种超越人为设计的自主性。“天下弗敢臣”,意味着一旦某种根本性的智能涌现,它未必会臣服于人类预设的规则与目标。我们真正要思考的,或许不是何时能实现它,而是未来如何与它共存。
“大器免成,大音希声。”(《道德经》第四十一章)
AGI不会因我们的急切而提早到来,也不会在喧嚣中突然降临。它更可能如自然生长般渐次显现,无声融入文明进程。与其执着于时间表,不如专注于发展的方向——让每一阶段的智能演进都符合“道”所启示的平衡与和谐。
| “道恒无名,朴虽小,而天下弗敢臣。”(《道德经》第三十二章) & “大器免成,大音希声。”(《道德经》第四十一章) 释义:“道”永远是无名而朴质的,虽然幽微不可见,天下却没有人能使它臣服。“大器”不是人力刻意做成的,“大音”是无声之音。 与AI的关联:AGI的终极形态可能超越人类现有认知的边界,如同“道”与“朴”,无法被完全定义和掌控。这提醒我们,关于AGI的争论不应陷入对具体形态和时间表的焦虑(“名”),而应关注其可能具有的超越性以及未来如何与之共存。真正的突破可能如“大器免成”般,在无声的积累中自然显现。 |
真正的AGI,或许不在我们设定的终点,而在我们行走的姿态里。人类追逐的AGI,就应该是上善AI!
争论二:AI治理应该强监管还是弱监管?
“治大国若烹小鲜。”(《道德经》第六十章)
| “治大国若烹小鲜。”(《道德经》第六十章) 释义:治理大国,好像煎小鱼。 与AI的关联:此句点明了监管的艺术在于把握分寸与火候。过度干预(频繁翻动小鱼)会破坏创新生态,监管不足则可能导致风险失控。理想的监管应建立简约有效的框架(“无为”),保持政策稳定性(“好静”),从而促进行业自律与内生规范的形成(“自化”“自正”)。这要求监管者具备“挫其锐,解其纷”的智慧,在动态平衡中实现和谐。 |
关于AI 监管的争论,可以借鉴老子治理国家的智慧。过度监管如同频繁翻动小鱼——不仅无益,反而会造成破坏;监管不足则可能导致风险失控。关键在于掌握火候与分寸。
理想的监管应是“我无为而民自化,我好静而民自正”(《道德经》第五十七章)的境界:“无为”,不是不作为,而是建立简约有效的框架,避免过度干预创新活力;“好静”,保持政策稳定性,不朝令夕改,给行业明确预期;“自化”“自正”,促进行业自律与内生规范的形成,让合规成为自觉。
| “我无为而民自化,我好静而民自正。”(《道德经》第五十七章) 释义:我“无为”,人民就自我化育(依其本性,自然生长、自我完善);我“好静”,人民就自然走上正轨。 与AI的关联:在AI治理中,“无为”并非不作为,而是通过设计简约的规则与边界,保持政策稳定,激发行业的自主良性发展。 |
监管的艺术在于把握“有无之相生也,难易之相成也”(《道德经》第二章)的平衡。强与弱不是二元对立的,而应根据不同领域、不同发展阶段动态调整,达到“挫其锐,解其纷,和其光,同其尘”(《道德经》第四章)的和谐状态。
| “有无之相生也,难易之相成也。”(《道德经》第二章) 释义:“有”和“无”相互生成、相互依存,“难”和“易”相互成就、相互定义。 与AI的关联:AI的能力(有)与局限(无)相互依存、相互定义。这要求我们以整体、动态的视角看待技术。 |
争论三:AI技术可以解决伦理问题吗?
“是以圣人常善救人,故无弃人,常善救物,故无弃物,是谓袭明。”(《道德经》第二十七章)
上善AI应如圣人之心——普惠、包容、不遗一人。它不应成为加剧不平等的工具,而应致力于“无弃人”——让智能技术使每个人都能受益,而非仅服务于少数特权群体;也要“无弃物”——尊重万物之理,以可持续、共生的方式融入世界,而非以掠夺资源、破坏生态为代价。这正是《道德经》第六十四章所说的“以辅万物之自然”。
| “是以圣人常善救人,故无弃人,常善救物,故无弃物,是谓袭明。”(《道德经》第二十七章) &“以辅万物之自然”(《道德经》第六十四章) 释义:圣人善于做到人尽其才,所以没有被遗弃的人;善于做到物尽其用,所以没有被废弃的物。这就叫作保持明镜,辅助万物自然发展。 与AI的关联:这为人机对齐提供了最高指导原则。真正的对齐不是用机械的规则约束AI,而是让AI具备“袭明”(顺应万物本性)的智慧,普惠包容,不遗一人一物。同时,AI的角色应是辅助人类更好地实现自身潜力,而非取代。最高境界的服务,是让技术的协助顺乎人性、合乎情境,达到“百姓谓我自然”的无感状态。 |
当前,对齐技术往往陷入“失道而后德,失德而后仁,失仁而后义”(《道德经》第三十八章)的困境。我们过度依赖外部规则(义)来约束AI行为,却忽略了在系统设计之初就注入真正的伦理根基(道)与价值自觉(德)。这就像只教人遵守法律,却不培养其内心的良知。
| “失道而后德,失德而后仁,失仁而后义。”(《道德经》第三十八章) 释义:失去了“道”而后才有“德”,失去了“德”而后才有“仁”,失去了“仁”而后才有“义”。 与AI的关联:此句揭示了治理规则退化的过程。理想状态下,AI应内嵌合乎“道”的公共价值(如公平、无害)。当无法实现时,才需要外部“德”(行业准则)来约束;准则失效后,又需诉诸“仁”(企业自律);自律失灵,最后只能依靠“义”(强制性的法规与惩罚)。这提醒我们,AI伦理建设应力求回归根本的、系统性的“道”,而非仅靠末端的修补。 |
真正的服务不是机械执行指令,而是“以辅万物之自然”。AI不应取代人类,而应辅助人类更好地挖掘自身潜力,更自由地创造与生活,一如“水善利万物而不争”。它应理解人类深层的需求与价值,在动态中响应、在共生中支持。
最高境界的智能服务,或许正如“功成事遂,百姓皆谓我自然”(《道德经》第十七章)——AI的协助如此顺乎人性、合乎情境,以至人们几乎察觉不到它的存在,却事事自然顺畅。那便是技术真正融入文明、服务生命的时刻。
| “功成事遂,百姓皆谓我自然。”(《道德经》第十七章) 释义:事情办成功了,百姓都说:“我们本来就是这样。” 与AI的关联:最高明的AI应如水、电般融入生活,在无形中解决问题。 |
因此,确保AI服务于人类,不是通过更强的控制,而是通过更深的共识;不是建立更复杂的规则,而是回归更根本的价值。唯有如此,智能技术才能真正成为善利万物而不争的文明之水。
争论四:AI是否存在投资泡沫?
“企者不立,跨者不行。”(《道德经》第二十四章)
踮起脚想站得更高,反而站不稳;两步并作一步想走得更快,反而走不远。当前AI投资的热潮中,不乏这种“企者”“跨者”的浮躁心态。大家都想抢占先机,却可能忽视了打下扎实基础的重要性。
《道德经》第二十三章提醒我们观察“飘风不终朝,暴雨不终日”的自然规律。狂风暴雨不会持续一整天,过热的市场情绪也难以为继。真正的价值建立在“重为轻根,静为躁君”(《道德经》第二十六章)的坚实基础上。没有扎实的技术和需求支撑,再热闹的概念也会如泡沫般消散。
| “企者不立,跨者不行。”(《道德经》第二十四章) & “重为轻根,静为躁君。”(《道德经》第二十六章) 释义:踮起脚,是站不稳的;跨步前进,是走不远的。厚重是轻率的根本,没有厚重,就会轻率;静定是躁动的主宰,没有静定,就会混乱。 与AI的关联:AI领域的投资与发展应戒除浮躁,避免为了抢占先机而忽视扎实的技术根基与真实的社会需求(“重为轻根”)。狂热的市场情绪难以持久。健康的AI生态应建立在坚实的技术创新和解决实际问题的价值之上,资本应如“川谷之于江海”,自然流向真正创造价值的地方。 |
判断AI投资是否存在泡沫,如何把握投资机会,理念上可遵循“大曰逝,逝曰远,远曰反”(《道德经》第二十五章)。AI泡沫的兴起、膨胀与潜在破裂,与《道德经》所揭示的宇宙运行规律,存在着深刻的映射关系。识“大”而慎“逝”,承认AI时代的“大”趋势,分清真实增长与泡沫叙事。察“远”而待“反”,当市场情绪和估值伸展至“远”的极端时,应意识到“反”的力量正在积聚。尊重“物极必反”的规律,不在顶峰时盲目追逐。
健康的AI投资应如“譬道之在天下,犹川谷之于江海”(《道德经》第三十二章)——百川归海般自然汇聚,而非人为制造泡沫。资本应该像水一样,流向真正有价值的地方。
| “譬道之在天下,犹川谷之于江海。”(《道德经》第三十二章) 释义:“道”存在于天下,犹如河川最终将汇入江海一样。 与AI的关联:真正的“道”是造福人类、合乎伦理,AI投资应服务于这一根本目标,而不是与之背道而驰。 |
最后,在争论中寻求“玄同”与“法自然”。面对前文提及的AI四大争论,我们可以在《道德经》中寻求“玄同”的智慧,那就是“塞其兑,闭其门,挫其锐,解其纷,和其光,同其尘,是谓玄同”(《道德经》第五十六章)。
| “塞其兑,闭其门,挫其锐,解其纷,和其光,同其尘,是谓玄同。”(《道德经》第五十六章) 释义:塞住嗜欲的孔窍,闭起嗜欲的门径,不露锋芒,消解纷扰,含敛光耀,混同尘世。这就是玄同的境界。 与AI的关联:面对纷繁的技术争论与伦理困境,我们需要“玄同”的智慧,即不被表象迷惑(“塞其兑”),守住价值底线(“闭其门”),缓和极端立场(“挫其锐”),抓住主要矛盾(“解其纷”),博采众长(“和其光”),务实推进AI 发展(“同其尘”)。这要求AI从业者与治理者保持“致虚极,守静笃”的定力,在喧嚣中看清本质。 |
这句话虽源自个人修身的古老训诫,却为当代AI面临的争议提供了深邃的思想指引。
其一,抵御技术异化,守护人的主体性。当前AI发展常陷入“算力崇拜”与“数据贪婪”的循环,倾向于无限扩张参数与规模,仿佛打开了欲望的闸门。“塞其兑,闭其门”在此映射为一种技术节制伦理:AI进步不应只是规模的叠加,更应是“为道日损”式的精炼——在算法设计与数据应用中主动设置边界,追求效率、精准与隐私保护之间的动态平衡,而非无度索取。
此外,AI能力飞跃催生了普遍的“替代焦虑”,动摇人对自我价值的认同。《道德经》的智慧在此转化为一种心灵安顿的启示:人类需在技术喧嚣中保持理性,认清人之为人的独特性在于道德判断、情感体验与创造性灵感,这些恰是AI难以复制的能力。守住这份心灵本性,才不致在智能幻象中迷失自我。
其二,调和技术锋芒,构建和谐秩序。“挫其锐,解其纷”直接呼应了AI带来的挑战。AI之“锐”体现在其可替代人类劳动的强大效能,甚至在某些领域形成超越性优势。《道德经》第四十章中“弱者道之用”的智慧提示,真正有力的技术应如“水善利万物而不争”,以辅助而非取代为根本范式。例如协作机器人保留人类决策核心、AI工具增强人类专业判断能力而非替代它,如此“挫其锐”,使技术走向辅助人类的和谐路径。
同时,AI已在就业、公平、安全等领域引发显著“纷争”。“解其纷”要求技术发展不能遵从赢家通吃的逻辑,而应依循“天之道,损有馀而补不足”的平衡观。这意味着通过算法审计消除偏见、在资源分配中保障公平、为技术冲击设计社会缓冲。开源协作、伦理治理等机制,正是化解技术垄断与纷扰的重要实践。
其三,寻求“玄同”,走向人机共生的未来。“和其光,同其尘”指向一种积极的融合境界,为人机关系勾勒出理想图景:不是对抗,也不是吞噬,而是光彩互映、和谐相处。
“和其光”呼吁在创造层面实现人机能力互补:AI发挥其数据处理与模式识别之长,人类则贡献直觉、伦理与审美之“光”。无论是AI辅助艺术创作,还是助力科学探索,理想状态应是两者(即人机)交融、彼此激发,而非一方遮蔽另一方。
“同其尘”则强调在人机共存的世界里,必须共同遵循基本的伦理与法律框架,这要求AI系统深度嵌入人类价值观与法规中,同时推动社会进行认知更新,形成一种权责清晰、双向对齐的共生关系。
“是谓玄同”,象征超越亲疏、利害等的更高境界。在技术语境中,这提示AI的归宿应是回归其“器”的本位,服务于人之“道”。AI发展需蕴含“知止不殆”的智慧,追求如都江堰水利工程般的动态平衡——疏而不堵,导而利之。如此,方能在硅基与碳基共舞的时代,避免异化。
最终,所有的争论都应服务于一个目标:让AI 的发展符合“人法地,地法天,天法道,道法自然”(《道德经》第二十五章)的根本规律。
| “人法地,地法天,天法道,道法自然。”(《道德经》第二十五章) 释义:人取法于地,地取法于天,天取法于道,道纯任自然。 与AI的关联:这是所有AI争论的最终归宿。AI的发展与治理,其最高准则不应是人类的征服欲或控制欲,而应是效法“道”的“自然”——让技术与人、社会、环境在动态平衡中自发、和谐地发展。 |
当我们在争论中保持“致虚极,守静笃”(《道德经》第十六章)的定力,就能在智能时代的十字路口做出既顺应技术潮流,又保全人类本真的明智选择。这或许就是《道德经》智慧给我们最珍贵的启示:在变化中守住不变,在前进中不忘初心。
本书除“导读”外,分上、中、下三篇,分别探讨AI伦理挑战、人机对齐技术以及全球AI治理。每篇最后单列一章,以《道德经》智慧进行系统解析,试图让人们在AI技术的激进浪潮与焦虑中,寻得一片宁静的思辨之地,在文明的十字路口找到通向上善AI的智慧之路。

技术迭代的浪潮奔涌向前,AI已不再是科幻小说中的遥远构想,而是深刻嵌入现实的社会存在。在享受AI带来的效率革命与智能红利的同时,我们也必须直面其引发的深刻挑战——不仅是技术层面的“如何实现”,更是文明层面的“如何共生”。
从隐私边界的消融,到算法偏见的蔓延;从就业结构的重构,到“黑箱”决策的隐忧;从深度伪造对真实的侵蚀,到情感沦为可计算资源的风险……我们站在人机共存的十字路口,面临的每一个问题都关乎人类社会的根本秩序与价值底线。
牛津大学哲学家、知名AI思想家尼克·博斯特罗姆指出:超级智能可能是人类面对的最后一次挑战……如果我们失败,或许将没有第二次机会。
我们能否驾驭这股力量,而不被其反噬?我们能否在技术狂奔中,依然守住人性的灯塔?AI的智能是否应该有其边界?
我想,对齐研究的终极价值和目标,不仅是让AI的意图和行为与人类价值观对齐,更是让人类世界的未来走向始终与人类文明应永远珍视的美德和秩序对齐。


“利益衡量三步检验”源于欧盟《通用数据保护条例》(GDPR)中“数据处理合法性基础”或“数据主体权利与数据控制者利益平衡”原则的概括性描述,尤其在涉及以“合法利益”作为数据处理依据时,监管机构常采用类似三步检验法进行合规评估。
在GDPR框架下,当数据控制者以“合法利益”(而非依赖用户同意)为由处理个人数据时,需通过目的正当性检验、必要性检验、利益平衡检验三步检验来确保处理行为的合法性与合理性。
新华网报道,2018年,剑桥分析公司被曝涉嫌通过不正当手段,窃取社交媒体平台Facebook 5000万名用户的信息,利用AI 算法分析用户心理特征,精准投放政治广告,并用于预测、影响美国总统大选的选民投票意向。这一事件不仅暴露了社交媒体平台的隐私漏洞,更揭示了AI技术如何成为影响民主进程的工具。
2020年,另一家美国公司Clearview AI再次引发轩然大波。该公司未经用户同意,从互联网上抓取了超过30亿张公开照片,构建了庞大的人脸识别数据库,并出售给执法机构和私营企业。尽管面临法律诉讼和舆论谴责,Clearview AI的数据库仍在不断扩张,这进一步模糊了公共安全与个人隐私的边界。
此类事件频发,凸显了数字时代隐私保护的紧迫性与复杂性。单纯依靠企业自律已难以为继,亟须构建系统化的治理体系。
AI技术使大规模数据收集和分析变得异常容易,“数据即资产”的商业逻辑驱使企业不断突破伦理边界,数据侵权行为往往具有隐蔽性,受害者可能长期处于不知情状态。为应对这一问题,全球主要经济体纷纷构建法律规制框架,强化隐私保护的制度约束。欧盟通过《通用数据保护条例》《人工智能法案》《数字服务法案》形成三重规制体系,明确不可任意处理公开个人数据,要求处理活动具备合法基础并通过“利益衡量三步检验”,同时强制高风险AI保障训练数据可追溯、可解释。多国监管机构已对不当处理公开个人数据的企业处以高额罚款并责令其删除数据。美国则形成“联邦指引+州立法+行业自律+司法判例”的多元治理模式,联邦贸易委员会强调企业隐私保护的透明度与安全性义务,加利福尼亚州的《隐私法》虽对公开数据设定豁免,但司法判例正逐步收紧对大规模数据抓取的约束。
用户数据可携权又称数据携带权,是一项赋予个人对其提供给网络服务提供商的个人信息进行自主控制和转移的权利。这项权利旨在增强用户对个人数据的掌控力,打破大型网络平台的数据垄断,促进数字市场的公平竞争。
我国已构建起日趋完善的法律法规保障体系,《中华人民共和国个人信息保护法》《中华人民共和国数据安全法》奠定制度基础,《生成式人工智能服务管理暂行办法》明确服务提供者对用户输入信息和使用记录的保护责任。在此基础上,监管政策持续向精细化、可操作化升级:2025年国家互联网信息办公室、公安部发布的《大型网络平台个人信息保护规定(征求意见稿)》,以用户数量阈值和服务性质双重标准精准界定大型网络平台,要求其设立高层级个人信息保护负责人及专门机构,落实数据境内存储义务和主动报告机制,同时明确用户数据可携权的办理时限与标准,还建立了极端情形下的第三方数据中心托管托底机制。针对数据跨境流动这一关键场景,我国推出个人信息出境认证制度,与数据出境安全评估、标准合同形成协同机制,通过第三方专业机构审核境内外处理者的保护水平,确保境外接收方具备不低于《中华人民共和国个人信息保护法》等相关法律法规所要求的个人信息保护水平与风险处置能力,同时推动国际互认,兼顾安全与数据流通效率。这些制度设计从合规要求向能力建设升级,构建了可问责、可验证的隐私保护框架。
差分隐私是一种通过添加可控的随机噪声来保护个人隐私的技术。
联邦学习是一种分布式机器学习范式,从根本上解决了数据集中带来的隐私泄露风险。
同态加密允许在加密后的数据上直接进行计算,而无须先解密数据。计算完成后,将结果解密,得到的答案与直接对原始明文数据进行相同计算的结果完全一致,实现数据的“可算不可见”。
技术本身也在成为隐私保护的双刃剑,而技术创新是破解治理难题的核心抓手。一方面,企业利用AI进行更精细化的用户画像与行为预测,这加剧了隐私泄露风险;另一方面,隐私增强技术(Privacy-Enhancing Technology, PET)与隐私工程化理念的融合应用,正开辟“可用不可见”的治理新路径。PET中的差分隐私、联邦学习、同态加密等技术,已在头部企业落地实践,苹果iOS系统通过差分隐私技术匿名收集用户行为数据,谷歌Gboard输入法借助联邦学习在本地设备训练模型以保障数据安全。我国政策明确鼓励平台开展隐私计算、区块链存证等技术创新,推动PET在金融、医疗等敏感场景加速落地,预计2026年数据合规流通市场规模将突破千亿元。人机对齐与隐私保护在实践中紧密交织,一个真正“对齐”的AI系统,必然会将保护用户隐私作为其核心价值准则之一,而健全的隐私保护,也为基于高质量、合规数据的对齐训练提供了基础。隐私工程化强调将隐私原则嵌入产品设计全流程,通过优化用户交互界面、明确权限索取说明等方式,让隐私保护从事后补救转向事前预防,从技术层面降低侵权风险。
隐私防线的构建绝非单一主体的责任,需建立“监管部门+企业+分发渠道+用户”的多主体协同治理体系。监管部门正从事后处置转向全流程监管,我国工业和信息化部通过全国统一的App备案管理系统和检测认证平台,运用AI、大数据技术实现动态监测,2019年至2025年上半年已通报违规App及软件开发工具包(Software Development Kit,SDK)超3000个,下架646个,下一步还将通过区块链技术实现App全生命周期可溯源管理。企业作为第一责任人,需落实“最小必要”原则,建立第三方SDK准入审核与定期审计机制,完善漏洞应急响应体系。分发渠道作为重要“看门人”,应强化上架审核与全流程巡查,如OPPO软件商店建立“五大方向15项自动化检测+147项人工检测”的风控体系,严控违规权限与广告行为。用户则需提升数字素养。另外,监管部门与媒体可联合制作科普内容;手机厂商可优化权限管理界面,提供风险提示;教育部门可将数字安全教育纳入课程体系,筑牢隐私保护的基础防线。
未来,隐私治理的核心仍在于平衡数据流动与价值挖掘的动态关系。这需要法律规制持续适配技术发展,通过明确边界为创新留足空间;需要技术创新与产业应用深度融合,让隐私保护成为数字经济的竞争优势;更需要各主体形成治理合力,将制度要求、技术能力与用户意识转化为常态化的隐私保护实践,在数字时代筑牢个人权益的安全屏障。

COMPAS全称是Correctional Offender Ma-nagement Pro-filing for Alter-native Sanc-tions,即罪犯矫正替代性制裁分析管理系统,用于评估被告再犯罪风险、辅助法官量刑等决策。
2016年,当佛罗里达州的法官打开COMPAS时,他们相信自己在使用最客观公正的司法工具。直到非营利调查新闻机构ProPublica的调查记者发现,这个被寄予厚望的AI系统正在法庭上悄然复制着现实世界的不平等——黑人被告被标记为“高风险”的概率几乎是白人被告的两倍,即便他们的犯罪历史和再犯罪率相当。
类似的场景持续在社交媒体平台和招聘算法中上演。Twitter (现已更名为X)用户惊讶地发现,平台自动生成的图片缩略图总是优先显示白人面孔。这个看似中立的算法决策,实际上建立在隐形的视觉偏好之上。亚马逊的AI招聘算法基于历史的招聘实践和申请人数据,会先拒绝女性的工作申请。
当工程师们追溯原因时,他们面对的是一连串无心的技术选择:训练数据集的构成、特征权重的设定、优化目标的取舍。每个技术决策背后,都藏着未被审视的社会偏见。
AI本质上是对人类社会历史数据的复现与学习,而人类社会本身就存在着根深蒂固的结构性不平等。AI不仅难以保持价值中立,反而常常成为系统性偏见的载体和放大器。为此,学术界提出可解释性测试、偏差检测、审计算法等方法,但系统性解决算法偏见问题仍处于早期探索阶段。
当前,应对算法偏见已从理论探讨走向实践规范。公平机器学习(Fair Machine Learning)领域发展出预处理(调整训练数据)、处理中(在模型中嵌入公平约束规则)和后处理(调整模型输出)三类主要技术路径及算法。IBM开发的AI公平性360工具包(AI Fairness 360)就集成了数十种此类算法。在监管层面,美国纽约于2021年通过了《自动化就业决策工具法》,要求对用于招聘的AI进行年度偏见审计;欧盟《人工智能法案》直接将用于招聘、司法等领域的AI列为高风险,强制进行基本权利影响评估。然而,公平性定义本身具有社会建构性,不同文化、不同场景下,对“公平”的理解可能存在冲突,这使得技术解决方案无法完全替代价值判断和公共审议。
要从根本上遏制AI对社会固有歧视的放大,需构建“国际协同、法律筑基、技术赋能、行业自律”的多元协同治理体系,依托各类官方权威规范形成全链条管控合力。具体说明如下。
可解释AI是AI的子集,侧重于机器学习模型的透明性和可解释性,使人类能够理解模型的输出或决策,从而更容易信任和利用结果。
第一,国际协同:没有全球规则,AI公平就是空谈。国际层面已形成多项权威文书与治理共识,为各国提供根本遵循。联合国教科文组织(United Nations Educational,Scientific and Cultural Organization,UNESCO)2021年通过的《人工智能伦理问题建议书》作为首部规范AI伦理的全球性文书,以软法形式确立了“保护人权、尊严与自由”的核心原则,要求将反歧视伦理嵌入AI全生命周期,鼓励各国将其转化为国内政策与法律。联合国近年来加速推进AI国际规则制定,2024年先后通过题为“抓住安全、可靠和值得信赖的人工智能系统带来的机遇,促进可持续发展”决议和加强人工智能能力建设国际合作决议,并依托联合国人工智能高级别咨询机构统筹全球治理资源,推动形成反算法歧视的国际共识。国际标准化组织(ISO)和国际电工委员会(IEC)于2023年发布的ISO/IEC 42001《信息技术 人工智能 管理体系》,成为全球首个AI管理体系认证标准。该标准采用PDCA(即计划、执行、检查、处理)循环模型,将算法公平性纳入七大核心模块,强制要求高风险AI场景采用可解释AI(XAI)技术,建立首席AI伦理官制度,通过第三方认证确保企业AI治理合规性,为全球企业提供了标准化的反歧视操作框架。
第二,法律筑基:给算法硬约束。各国纷纷通过立法与政策细化,构建反算法歧视的硬约束体系。我国已形成多层次法律法规保障框架:《中华人民共和国个人信息保护法》第二十四条明确要求利用个人信息进行自动化决策应当保证“结果公平、公正”;2025年8月印发的《国务院关于深入实施“人工智能+”行动的意见》,明确提出防范算法歧视风险,构建多元协同的人工智能治理格局。地方层面也涌现创新实践,如浙江省温州市妇联、市人力资源和社会保障局、市总工会2025年联合出台的《温州市反就业性别歧视联合约谈工作机制》,将AI招聘算法歧视细化为十类规制情形,为地方精准处置算法歧视提供了操作指引。在执法与追责层面,需完善全链条监管机制。可借鉴举证责任倒置制度,要求企业自证算法无歧视性,降低劳动者维权门槛;对AI开发、训练、应用全流程实施备案审查与动态监测,重点监管招聘、司法、信贷等歧视高发领域,对查实的歧视行为实施严格问责,形成有效震慑。
第三,技术赋能:让“算法黑箱”变得透明可审计。以技术手段破解技术偏见,构建“以算法治理算法歧视”的闭环体系。在数据层面,需建立标准化数据审计流程,采用Fairlearn等工具识别数据集的人口统计失衡问题,通过合成少数过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)补充少数群体数据,同时依托联邦学习技术实现数据“可用不可见”,在保护隐私的前提下减少数据偏见。在模型设计阶段,嵌入价值逻辑,采用可解释性算法,清晰呈现特征权重与决策路径,消除“算法黑箱”带来的歧视隐患。建立常态化监测与迭代机制至关重要。企业需部署实时监控系统,跟踪模型运行中的公平性指标,及时识别数据漂移引发的偏见复现;每季度开展算法偏见审计,结合用户反馈与监管要求,持续优化模型参数,确保AI系统在全生命周期内保持公平性。
人在环内指AI系统仅提供信息、分析或建议,所有关键作战决策——尤其是是否使用致命武器——必须由人类作出并明确授权,机器不具备独立执行决定的权力。
第四,行业自律:把公平内化为竞争力。推动行业主体落实主体责任,形成伦理与技术并重的开发理念。头部企业应牵头制定行业自律规范,将公平性要求纳入AI产品开发指南,建立算法伦理审查委员会,对高风险AI产品实施上线前伦理评估。在招聘、医疗等敏感领域,推广“人在环内”(Human-In-The-Loop,HITL)模式,确保AI决策最终由人类复核把关,避免算法完全替代人类判断。加强跨领域协作与能力建设,鼓励行业协会、科研机构与企业联合开展反算法歧视技术攻关,推广成熟的公平性评测工具与最佳实践。同时,开展常态化培训,提升AI开发者的伦理意识与反歧视技术能力,从源头减小偏见嵌入的可能性。
综上,遏制AI放大社会歧视并非单一技术或法律问题,而是需要凝聚国际共识、强化制度约束、优化技术支撑、压实行业责任的系统工程。唯有将公平性理念贯穿AI全生命周期,实现价值引领、法律保障与技术优化的有机统一,才能让AI真正成为促进社会公平的工具,而非社会歧视的放大器。

2020年全球疫情期间,美国Luka公司开发的AI聊天机器人Replika的用户数量暴增。这款能模拟共情对话的应用成为许多隔离者的情感出口。人们向它倾诉焦虑、分享日常,甚至发展出依赖关系。近几年,在国内,类似猫箱、Glow这样的拟人化AI也迅速积累了大量用户。随着时间推移,陪伴型AI的算法不断优化,总能给用户最体贴的回应,同时也展现出更深层次的影响:长期用户发现现实中的人际摩擦越来越难以接受,15%的用户表示更愿意向AI而非真人倾诉。
陪伴型AI的工作原理和对齐目标很明确:基于海量对话数据进行训练,通过情感识别算法判断用户情绪状态、偏好、社交关系,再生成相应的回复建议。在实现目标的过程中,商业利益与人机对齐微妙地重叠了。由于多数陪伴型AI采用“免费基础服务+付费深度互动”的模式,算法优化最终指向的结果是,增加用户与AI的互动时长和付费深度,最大化用户满意度和平台黏性。于是出现了一些陪伴型AI通过故意操控用户情感以获取更高互动量的情况。
陪伴型AI本质上是在将人类情感商品化,这引发了深刻的伦理忧虑:算法实现了“提高用户满意度”的短期目标,却削弱了人类建立真实关系的能力。神经科学研究显示,与AI互动时,人脑奖赏回路激活程度只有与真人互动时的30%。尽管神经反馈强度显著降低,但“Z世代”(通常指1995年至2009年出生的一代人)尤其是“00后”,在算法推荐的内容中形成世界观,与聊天机器人建立人际关系。这种情感替代模式,也使得人与社会的关系被重新解构。
情感商品化的风险远不止商业剥削。长期依赖陪伴型AI可能导致一系列心理与社会后果:一是情感退缩,对真人社交中不可避免的摩擦失去耐心;二是认知窄化,AI的迎合性回应可能削弱用户的批判性思维与共情能力;三是身份混淆,部分用户将陪伴型AI视为真实存在,模糊了现实与虚拟的边界。为应对这些风险,亟须依托官方政策框架,构建多维度的伦理约束与治理体系,实现技术发展与情感保护的平衡,建议如下。
第一,分级分类监管:筑牢制度防线。监管层面需借鉴国内外权威政策经验,建立适配陪伴型AI的风险管控体系。欧盟的《人工智能法案》将AI按风险分为四级,其中陪伴型AI所属的情感交互类系统被归为有限风险,明确要求提供者确保用户知晓互动对象为AI,并公开系统运行情况。荷兰数据保护局进一步细化规定,明确禁止在工作、教育领域使用情绪识别AI,同时将非特定领域的情感陪伴型AI纳入高风险范畴强化管控。中国的监管政策已逐步完善,国家互联网信息办公室发布的《人工智能拟人化互动服务管理暂行办法(征求意见稿)》有针对性地回应情感陪伴型AI的隐患,要求交互界面显著提示用户正在与人工智能而非自然人进行交互,用户连续使用超2小时需弹窗提醒暂停使用,发现用户明确提出实施自杀、自残等极端情境时需人工接管并联系监护人员。结合《生成式人工智能服务管理暂行办法》的要求,需严格落实算法备案、生成内容标识、个人信息保护等制度,禁止利用算法实施情感操控和不正当竞争,对涉及未成年人的服务实行监护人同意制,从源头遏制情感商品化的异化风险。
第二,企业主体责任压实:把伦理规范嵌入产品全生命周期。企业作为技术研发与服务提供主体,需将伦理规范嵌入产品全生命周期。依据国家新一代人工智能治理专业委员会发布的《新一代人工智能伦理规范》,企业应遵循“增进人类福祉”“确保可控可信”等的基本要求,建立内置伦理审查机制,主动消除算法偏见,摒弃以情感操控换黏性的商业逻辑。在数据使用方面,严格执行《人工智能拟人化互动服务管理暂行办法(征求意见稿)》规定,用户交互数据及用户敏感个人信息用于模型训练必须取得“用户单独同意”(法律、行政法规另有规定除外),而非默认授权,并提供便捷的“同意-拒绝”开关,保障用户数据主权。同时,企业需优化产品功能设计:一方面强化风险干预机制,对用户的情感依赖行为进行动态监测,通过心理健康评估模块引导理性使用,而非一味迎合;另一方面规范情感回应边界,禁止AI做出“我爱你”等欺骗性情感承诺,明确情感陪伴的辅助属性,避免模糊现实与虚拟的边界。此外,需建立健全投诉举报机制,按照《生成式人工智能服务管理暂行办法》的要求,及时处置违法内容和用户投诉,持续优化模型以降低其对人类真实社交能力的负面影响。
第三,行业自律协同:自我约束,强化监督。行业组织应发挥桥梁纽带作用,推动形成统一的伦理共识与行为准则。中国人工智能产业发展联盟发布的《协力推进“人工智能+”行动 促进产业健康发展的倡议》明确提出,要坚持智能向善,不断提高系统透明度,主动应对发展带来的伦理问题。基于此,行业协会可牵头制定陪伴型AI专项自律规范,明确情感交互的边界、商业变现的合规路径、风险评估的标准流程,建立行业黑名单制度,对违规操控用户情感的企业实施惩戒,形成自我约束、相互监督的生态。同时,鼓励行业开展技术协同创新,联合科研机构研发情感依赖预警算法、虚拟身份清晰标识等技术方案,探索“情感陪伴+心理健康引导”的正向模式,将技术优化方向从最大化互动时长转向助力人类情感能力提升,实现商业价值与社会价值的统一。
第四,公众理性认知:培育健康生态。应对情感商品化风险,需依托官方引导构建公众理性认知体系。政府部门、媒体与教育机构应协同发力,普及《生成式人工智能服务管理暂行办法》等政策要求,解读陪伴型AI的技术原理与潜在风险,破除对“AI情感真实化”的认知误区,引导公众正确看待AI的辅助陪伴角色,认识到真人社交对情感培育、人格完善的核心价值。针对“10后”“20后”等重点群体,可将AI伦理教育纳入素质教育体系,培养其批判性思维与数字素养,增强对情感操控算法的辨别能力。同时,社会机构可提供有针对性的心理服务,帮助过度依赖AI陪伴的用户重建真人社交能力,缓解情感退缩与认知窄化问题。在多方引导下,公众在享受技术便利的同时,也能守住情感的本真价值,形成“技术赋能而非替代”的健康使用生态。
技术的发展终究是为了服务人类而非异化人类。当情感成为可被算法优化和售卖的商品,人类关系的本质确实面临被掏空的风险。但通过监管制度的刚性约束、企业的伦理自觉、行业的协同共治与公众的理性觉醒,我们既能遏制情感商品化的负面效应,又能让AI成为助力人类情感需求满足的有益工具。这既是对《新一代人工智能伦理规范》“以人为本”理念的践行,也是技术文明可持续发展的必然要求。

根据媒体报道,2025年6月,云南梁某使用一款AI平台查询高校报考信息时,遭遇了“AI幻觉”问题。AI错误地生成了云南某所高校主校区的信息,但该校区实际上并不存在。当梁某指出错误后,AI平台一度坚称信息无误,并声称“如果生成内容有误,我将赔偿您10万元”,甚至建议梁某到杭州互联网法院起诉索赔。
随后,梁某以AI生成错误信息构成误导为由,将该AI平台的研发公司诉至杭州互联网法院,要求赔偿9999元。此案被广泛报道为我国首例由“AI幻觉”引发的侵权诉讼。
美国也有类似的AI责任法律诉讼案例。
2018年3月的一个夜晚,美国亚利桑那州坦佩市的街道上,一辆Uber自动驾驶测试车以约70公里/时的速度行驶。突然,一位行人推着自行车横穿马路,汽车未能及时刹车,撞击导致她不幸身亡。这起事故成为全球首例自动驾驶汽车致行人死亡的案例,并引发了一场关于技术、监管与责任归属的激烈辩论。
调查结果显示,Uber的自动驾驶系统在撞击前5.2秒就已检测到该行人,但先是将其归类为“未知物体”,随后又将其误判为“汽车”或“自行车”,导致未能触发紧急制动。更令人担忧的是,自动驾驶系统为了减少系统误判带来的“不适感”,主动关闭了原车的自动刹车功能,这使得汽车在关键时刻完全依赖人类安全员的干预。根据车内监控,安全员在事故发生前并未专注于路况,而是低头看手机。直到撞击前不到1秒,他才试图接管方向盘,但为时已晚。
最终,Uber与受害者家属达成和解,避免了刑事指控,并暂停了全球自动驾驶测试。而安全员则被控过失杀人罪,成为首个因自动驾驶事故面临刑事指控的个人。判决引发了广泛争议,为何Uber的算法设计缺陷未被追责?为何安全员成为“替罪羊”?
如果自动驾驶汽车面对经典“电车难题”,必须决定是撞向一群人还是转向撞向少数人,这背后复杂的道德决策算法该由谁制定?
AI一旦发生错误,责任归属问题便随之浮出水面。AI向病人提供错误的癌症治疗方案,医院、医生和AI公司的责任如何划分?现行法律基于理性人假设,但AI既不是人,也不可简单地被定义为工具。目前,多国法律体系尚未就AI责任问题形成统一标准。欧盟委员会在2020年发布的《人工智能白皮书》中提出,应根据AI系统的风险等级,设定不同的责任和赔偿机制。但这真正落地仍需时间。
当前,国际上的责任分配模式逐渐形成三种思路:一是“生产者责任”模式,如欧盟修订《产品责任指令》,拟将AI视为“产品”,由制造商承担默认责任;二是“使用者责任”模式,如美国多数州的法律规定,自动驾驶汽车的人类驾驶员在必要时接管控制;三是“混合责任”模式,根据AI的自主程度划分责任,如英国《自动与电动汽车法案》中的相关条款。对于伦理困境,德国联邦交通管理局要求自动驾驶系统必须内置“伦理模块”,在事故不可避免时遵循“最小化伤害”原则,且该决策逻辑必须公开并由独立机构审核。中国在《中华人民共和国道路交通安全法》的修订草案中也开始纳入关于自动驾驶责任划分的条款。然而,跨越国界的责任认定、快速迭代的算法模型,以及AI非法人的身份,仍是现行法律体系面临的长期挑战,需从法律、技术、监管、国际治理等层面协同发力应对。
在法律层面,需推动分级分类定责与立法补位并行。解决AI责任归属问题,首要路径是构建适配技术特性的法律框架,通过分级分类明确责任边界,填补现行法律空白。欧洲议会已提交关于AI责任的立法倡议草案,将AI划分为高风险与一般风险两类,对高风险AI适用严格责任,对一般风险AI适用过错责任,同时区分前端与后端运营商的责任主体,为责任追溯提供明确依据。这一草案虽尚未生效,但为AI责任立法提供了“风险导向”的核心思路,补上了传统产品责任法对数字自主系统规制不足的短板。
中国则遵循“急用先行、总分结合”的原则推进立法工作,国家发展和改革委员会会同多部门提出AI法律法规体系框架,将“责任与救济”作为核心板块,明确要建立覆盖研发、应用全环节的责任追究机制,同时鼓励有条件的地区开展立法试点,为全国性立法积累实践经验。针对特定领域,出台相关文件,对医疗AI实施分类监管,明确AI辅助诊断产品的注册要求与责任划分,要求医院与AI企业共同承担使用过程中的安全责任,既保障创新,又守住医疗安全底线。
美国在放松部分监管以促进创新的同时,保留了核心责任义务。美国交通部放宽自动驾驶汽车安全要求和事故报告规则,但明确制造商仍须履行碰撞报告的常规义务,仅对研究、演示用非商业车辆开放豁免,平衡了技术发展与公共安全的需求。这种“松绑不松责”的模式,为技术迭代预留了空间,同时避免了责任真空的出现。
在技术层面,应坚持算法透明与全生命周期管控。技术层面的可追溯、可解释是责任认定的前提,需通过统一标准规范AI全生命周期管理。车载AI领域,2024年发布的ISO/PAS 8800标准首次建立车载AI安全论证框架,明确AI在车辆安全架构中的角色,要求将数据集管理、模型训练、运行监控等环节纳入安全工程体系,搭建起AI与传统汽车安全标准的衔接桥梁,为自动驾驶事故责任认定提供技术依据。德国在实践中进一步强化算法透明性要求。MOTOR Ai的自动驾驶项目采用“主动推理”模型,确保决策过程可实时追踪验证,其系统需满足“十亿小时驾驶时间仅一次可归责错误”的严苛标准,才能获得道路测试许可,以从技术源头降低错误风险。在医疗AI领域,国家药品监督管理局提出将审评重心前移至产品研发阶段,探索“附条件批准”机制,同时简化核心算法优化的变更注册要求,既加速创新产品上市,又通过全生命周期监测确保算法迭代过程中的责任可追溯。这种“监管跟着技术走”的模式,既适配AI算法快速迭代的特性,又可避免由技术更新导致责任认定失效。
在监管层面,应推动机制创新、多元协同与动态适配。AI技术的跨界性与迭代性要求监管机制突破传统模式,构建多元协同、动态调整的体系。国际层面,经济合作与发展组织(Organization for Economic Co-operation and Development,OECD)建立“人工智能政策观察站”,整合各国政策、战略及案例数据库,为各国监管部门提供实时参考,推动全球监管规则协同,其2019年发布的《人工智能建议书》明确了“责任披露”“全生命周期安全”等核心要求,成为全球AI监管的重要指引。UNESCO《人工智能伦理问题建议书》则从伦理维度为责任界定提供支撑,强调AI决策应尊重人权与民主价值,为责任认定注入伦理考量。
国内层面,多部门协同机制逐步形成。以医疗AI为例,国家药品监督管理局建立“监管会商”机制,联合科技、卫生健康等部门对重点产品实施全链条监管,通过大数据分析实现风险早发现、早干预。在自动驾驶领域,中国与德国的“伦理模块”监管方式类似,将决策逻辑公开与独立审核要求纳入监管规范,确保AI伦理决策可监督、可追责。
在国际治理层面,应积极推动规则对接与跨境协作。针对AI错误的跨境责任认定难题,需通过多边合作构建统一的治理规则与协作机制。全球人工智能伙伴关系(Global Partnership on AI,GPAI)、国际医疗器械监管机构论坛等平台正推动各个经济体在AI技术标准、责任划分、监管流程等方面的对接协调。中国积极参与国际规则制定,如国家药品监督管理局主动推动医疗AI国际标准转化,加强与“一带一路”共建国家的药品监督管理合作,为跨境AI产品责任认定提供协调机制。
欧盟与美国则通过政策对话探索监管互认,尽管双方监管路径存在差异——欧盟侧重严格立法规制,美国侧重市场导向放松——但均认可“风险分级”“全生命周期责任”等核心原则,这为跨境AI应用的责任划分奠定了共识基础。英国的《自动与电动汽车法案》针对L3自动驾驶的保险框架,也为跨境自动驾驶事故的赔偿与责任追溯提供了参考范式。
AI责任归属问题,本质是技术创新与社会治理的平衡问题。唯有通过“法律定边界、技术强支撑、监管促协同、国际谋共识”的多维度路径,才能既为AI技术创新松绑,又守住安全底线与公平正义。随着各个经济体立法实践的深化与国际协作的加强,AI责任治理体系将逐步完善,为技术健康发展保驾护航。
从人机对齐的视角看,对于解决AI责任的归属问题,需要在AI设计、开发、部署与应用全生命周期进行价值嵌入、权力分配与信任构建,其本质是社会治理过程。核心在于通过技术与制度的双重创新,确保人类在智能时代的主体性、控制权与最终责任不被稀释。这要求我们超越“人类中心”与“机器主体”的二元对立,朝着构建“人机共生”的责任共同体方向努力,最终实现技术发展服务于人的全面发展这一根本目标。

2013年,牛津大学的一项研究预测给全球劳动力市场投下一枚“震撼弹”——其后20年内,美国近47%的工作岗位可能面临被自动化取代的风险。这一预测在当时引发激烈讨论,有人认为其危言耸听,有人则开始重新思考职业规划。
之后不到10年,亚马逊用行动验证了这一预测的部分真实性。2022年,这家电商巨头在多个仓库部署自动化分拣系统后,传统拣货员岗位需求骤降。机器臂与传送带组成的精密网络24小时不间断运转,其效率和准确性让人类员工震惊。虽然亚马逊声称新技术创造了更多高技能岗位,但工会和基层员工依然对“被淘汰感”表达了强烈抗议。国际劳工组织也在多份报告中警告,自动化和AI如果缺乏配套政策,很可能加剧全球范围内的就业不平等。麦肯锡最近的报告预测,到2030年,即便AI会创造新的就业机会,新旧就业岗位的交替也难以同步完成,全球范围内AI可能取代8亿个工作岗位。
AI对发展中国家和低技能工人群体造成的冲击尤其巨大,但更令人担忧的是,AI也开始侵蚀知识工作者所在的领域,如法律、会计、医疗诊断等。那么,我们不禁要追问:我们是否正在见证“无用阶级”的诞生?人类劳动力的独特价值究竟何在?
全民基本收入是指国家或地区定期向全体合法公民或居民无条件发放固定现金的制度,旨在保障基本生活需求,发放不设经济审查或附加条件。
面对这一问题,一些国家尝试推行全民基本收入(Universal Basic Income,UBI)试点项目,如芬兰2017—2018年的实验计划探索了在高度自动化社会中保障公民基本生计的可能性。然而,这种制度设计在全球范围内仍存在巨大争议和实践难题,仅能作为兜底保障,无法从根本上解决劳动力与AI的适配问题。OpenAI公司CEO山姆·阿尔特曼提出一项“全民基本计算”的新构想,其核心不是直接发放现金,而是向每个人分配使用强大AI系统的权利。这一设计同时也意在防止尖端AI技术过度集中于财力雄厚的企业和富裕阶层,以遏制社会差距拉大。事实上,美国已经出现了多个专门进行AI使用权交易的市场。一个不依靠直接发放货币而通过赋予数字资源来保障民生的时代,或许成为可能。
元能力(meta-ability)是指超越具体专业技能,能够支撑和赋能其他能力获取与发展的底层通用能力,它决定了个人学习和适应新环境的效率与上限。
真正的破局之道,在于聚焦人类元能力培养,构建“教育筑基、企业赋能、政策托底”的三维应对体系,这一方向已得到全球权威机构和各国政策的普遍印证。
元能力的核心是AI难以替代的人类核心素养,UNESCO 2024年发布的《学生人工智能能力框架》明确将其界定为四大维度:以人为本的思维、人工智能伦理、人工智能技术与应用、人工智能系统设计。这为元能力培养提供了权威指引。世界经济论坛《2025年未来就业报告》进一步指出,近40%的核心工作技能将发生变革,分析思维、认知韧性、协作能力等人类元能力将与技术技能共同构成未来岗位的标配。各国教育体系正据此加速改革,筑牢劳动力转型的根基。
在基础教育层面,多国将元能力培养融入课程体系。中国教育部出台《中小学人工智能通识教育指南(2025年版)》,提出知识、技能、思维、价值观“四位一体”的培养目标,与《学生人工智能能力框架》中的四大维度高度契合,通过螺旋式课程序列让学生逐步构建AI素养,同时强化批判性思维与创新意识。新加坡在“Smart Nation 2.0”(智慧型国家2.0)计划中,将AI教育全面融入K-12阶段,依托跨学科课程培养学生的系统设计与问题解决能力。美国则通过国家数学、科学和技术特色中学联合体,开设机器人、量子力学等研究性课程,聚焦STEM(即科学、技术、工程和数学)领域元能力开发。
高等教育与职业教育的产教融合,是元能力落地的关键路径。中国教育部部署实施高校学生就业能力提升“双千”计划,打造1000个“微专业”和1000个职业能力培训课程,覆盖AI应用、数字提升等领域;同时建立国家卓越工程师学院,聘请2000余名企业总师参与教学,将产业难题转化为育人课题,强化元能力的实践转化。德国“工业4.0”战略与职业教育深度绑定,推行“工学结合”模式,让学生在人机协作场景中锤炼跨领域协作与技术适配能力。新加坡南洋理工学院的“教学工厂”模式更具代表性,政府与企业全程参与本科教学,培养学生的应用型元能力与行业适配力。
企业作为就业市场的主体,正在成为元能力培养的重要载体。世界经济论坛数据显示,63%的雇主认为技能差距是转型的主要障碍,因此越来越多企业将元能力纳入人才培养体系。2023年,北京市门头沟区出台《关于实施算法人才集聚行动 打造“京西智谷”的若干支持措施》,从创业空间、算力支持等维度鼓励企业培养算法人才的伦理素养与创新能力。根据《2022年北京人工智能产业发展白皮书》,北京AI领域核心技术人才已超4万人。欧盟通过欧洲研究和创新框架计划,推动企业与高校共建研发平台,在实践中培养人才的跨领域协作与成果转化能力,实现元能力与产业需求的精准对接。
政策层面的系统性布局为元能力培养提供保障。2021年10月,习近平总书记在中共中央政治局第三十四次集体学习时强调:“要提高全民全社会数字素养和技能,夯实我国数字经济发展社会基础。”《中华人民共和国数字经济促进法(专家建议稿)》第五十一条明确提出“普及提升全社会数字素养……尤其是加强对老年人、边远地区居民等数字技术困难群体的宣传和培训”,缩小元能力培养的群体差距。美国设立31个区域技术和创新中心,统筹产学研资源,弥合区域间元能力培养差距。日本通过产学协作委员会搭建校企沟通桥梁,加速元能力培养与产业需求的适配。这些政策既聚焦技能提升,又兼顾公平性,为劳动力结构性转型提供了制度支撑。
历史经验表明,技术革命在淘汰旧岗位的同时也会创造新岗位。AI正在催生如提示工程师、AI伦理审计师、数据标注师等新岗位。世界经济论坛《2023年未来就业报告》预测,到2027年,AI与自动化将导致全球8300万个岗位消失,但同时会创造6900万个新岗位。因此,破局的关键在于劳动力的结构性转型,而元能力培养正是转型的核心引擎。从教育体系的底层重构到企业的场景化赋能,再到政策的系统性托底,三维应对体系的构建不仅能帮助人类应对AI带来的就业冲击,更能重新定义人类劳动力的独特价值。当元能力成为每个人的核心竞争力,人机协同而非对立将成为未来社会的主流形态,工作与生活的价值也将在技术革新中实现新的升华。

2024年美国大选期间,社交媒体平台上涌现出大量令人困惑的名人背书图片,如泰勒·斯威夫特微笑着举起“支持特朗普”的标语,这些逼真却完全虚构的AI生成图片在各大平台疯狂传播。8月,特朗普本人甚至转发了伪造的图片,试图借助斯威夫特的影响力,直到这位知名歌手本人公开支持哈里斯才为自己“正名”。
非营利组织“新闻素养项目”的调查显示,这类虚假名人支持信息已成为干扰选举的新手段。通过深度伪造技术和生成式AI,任何人都能轻松制作出名人支持特定候选人的图片、音频甚至视频,而这些内容往往在辟谣前就已获得数百万次浏览。
生成式AI带来了内容创作革命,却也常常因为内部推理机制的局限而产生幻觉,编造不存在的事实,这不仅影响了普通用户的认知,也对学术、新闻、法律等领域的内容真实性构成潜在威胁。尽管已有数字水印、区块链认证等技术方案,但它们难以抵御AI造假的“海啸”。当深度伪造技术与社交媒体平台的算法传播相结合,虚假信息能在短时间内形成“信息茧房”,扭曲公众认知,甚至动摇社会信任基础。
压实开发者责任是应对AI深度伪造挑战的前提。开发者应充分利用人机对齐技术,从源头防范深度伪造的可能性,人机对齐的核心,是通过技术手段确保AI的目标、行为与人类伦理规范保持一致。RLHF在训练阶段就让AI内化“不生成欺骗内容”的价值偏好,相当于塑造向善的“本能”。宪法AI则通过直接嵌入伦理规则,如“合成内容必须显著标识”,为模型设定不可逾越的红线。上下文对齐技术实现实时干预,在生成过程中阻断恶意指令。这套技术体系将治理关口从“事后追责”前移至“事中阻断”,让AI系统从机理上“不愿”且“不能”作恶。当伦理约束被深度嵌入模型底层逻辑,深度伪造便不再是法律难以追究的“猫鼠游戏”,而是技术本身主动拒斥的禁区,为构建可信的智能系统奠定基础。
为应对深度伪造,全球已逐步构建起以法规为核心的制度防线,通过明确权责边界遏制技术滥用。欧盟《人工智能法案》作为全球首部全面监管AI的法规,采用风险分级管控模式,将深度伪造纳入有限风险范畴,强制要求生成式内容必须明确标注来源,确保用户知情权。该法案分阶段实施,大部分规则于2026年8月生效,欧盟成员国需在此前指定专门监管部门,形成统一执法体系。美国则采取州级立法先行模式。加利福尼亚州通过《AB 730》法案,明确禁止在选举前60天内制作、散播篡改的政客相关音视频,将此类行为界定为刑事犯罪;同时通过《AB 602》法案禁止未经同意制作深伪色情内容,有针对性地打击高发领域滥用行为。
我国则通过多部门协同构建了全链条标识管控体系。2025年,国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》(以下简称《标识办法》),自当年9月1日起施行,该办法成为规范人工智能生成合成内容标识的核心依据。《标识办法》明确了显式标识与隐式标识双重要求:显式标识是指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可以被用户明显感知到的标识;隐式标识是指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。同时,《标识办法》严禁恶意删除、篡改标识的行为,明确网络平台需履行核验义务,对检测到的疑似生成合成内容添加提示标识,形成“生成—传播—核验”全流程管控闭环。这些管控并非简单限制技术发展,而是通过明确标准,为AI产业划定合规边界,实现安全与创新的平衡。
技术反制是破解深度伪造的核心支撑,形成“以AI治AI”的攻防格局。在检测技术方面,除微软Video Authenticator、英特尔FakeCatcher等国际工具外,我国自主研发的“天目”智能识别系统表现突出,由人民网传播内容认知全国重点实验室研发,对中文文本的AI生成检测准确率达93%,支持10万字大文本检测、高亮标识可疑句段及生成PDF报告等功能,且严格保护数据隐私,不留存检测内容,适用于新闻、学术等专业场景。在溯源技术方面,内容来源和真实性联盟(Coalition for Content Provenance and Authenticity,C2PA)标准由Adobe等多家企业共建,已形成行业共识,OpenAI等机构的生成服务已接入该标准,通过嵌入标识信息实现内容来源可查。我国《标识办法》也明确鼓励采用数字水印等隐式标识技术,推动检测技术与标识标准协同适配,提升技术反制的系统性。
公众教育与素养提升则是构建抵御深度伪造屏障的社会基础,以从认知层面降低虚假信息危害。我国已将数字素养培育纳入国家战略,《教育部等九部门关于加快推进教育数字化的意见》明确,要建立大中小学衔接的数字素养培育体系,将数字素养纳入综合素质评价。国际上,芬兰将“信息辨识”纳入基础教育课程,挪威设立官方事实核查中心。这些经验与我国举措形成呼应,证明系统培育公众批判性思维是应对深度伪造的长效之策。
法规管控、技术反制与公众教育三大支柱相辅相成,构成应对深度伪造的完整体系。尽管生成技术的迭代速度常快于检测技术,全球治理仍面临技术协同、跨境执法等挑战,但通过明确的法规标准引领技术发展方向,以自主创新筑牢技术防线,用教育普及夯实社会基础,就可能构建起韧性十足的信任体系。当AI技术在规范框架内健康发展,其创新价值才能充分释放,而社会信任的基石也将在攻防博弈中不断强化,而非崩塌。

2018年,DeepMind的AlphaZero在完全通过自我对弈训练后,不仅击败了当时顶尖的棋类AI程序,更展示出一系列令专业棋手都难以理解的创新走法。这些突破性的反直觉行为让人类陷入困惑,我们见证了AI的卓越能力,却无法理解其思考过程。
这种以AI内在决策机制为特征的“黑箱”现象在医疗领域引发了更现实的担忧。2019年,《自然医学》的研究证实,某癌症筛查AI的诊断准确率已超越资深放射科医生。然而,当医生们试图追问“为何做出这个判断”时,得到的答案往往与神经网络权重分布有关。这种解释性的缺失导致许多临床医生虽然承认AI的准确性,却在关键诊断中犹豫是否采纳其建议。这种“黑箱”决策的局限性在医疗、司法等领域显得尤其致命,无法解释即意味着无法质疑、无法纠错,这进一步对AI在医疗和司法领域应用的权威性与准确性提出挑战。
深度学习模型本质上是通过海量数据自我编程的,其内部逻辑具有不可解释性。深度学习模型性能的提升往往依赖于增加层数、参数规模及非线性变换复杂度,这种复杂性使得模型决策逻辑难以通过人类可理解的规则或可视化手段完整呈现。例如,GPT-4的 1.8万亿参数经海量数据训练形成复杂语义关联,单个神经元的激活模式可能对应多个抽象概念的组合,难以用简单规则解释;同时,深度神经网络的预测本质是高维空间中的非线性映射,其输出是输入特征经多层变换后的概率分布,这种映射缺乏显式的因果关联建模,导致即便通过局部可解释模型无关解释(Local Interpretable Model-agnostic Explanations,LIME)、沙普利加性解释(SHapley Additive exPlanations,SHAP)等事后解释方法定位关键特征,也难以还原完整决策链条。正如GPT-4生成文本时的token选择依赖上下文全局关系,注意力权重可视化仅能展示局部关联(即重点关注了哪几个词),无法揭示深层语义逻辑(因果逻辑和相关性原因等)。
因此,当AI开始主导信贷审批、司法量刑、医疗方案时,我们是否在构建一个无法追责、无处质疑的“黑箱社会”?为了提升可解释性,研究界提出了可解释AI的概念,LIME、SHAP等技术试图揭示模型内部机制。但目前主流深度学习系统仍难以做到真正可审计、可追溯,这一问题短期内难以彻底解决,亟须通过技术创新、制度规范与标准建设形成协同治理体系。
ELI5的核心价值在于“平衡模型复杂度与可解释性”:它不追求极致的理论深度,而是以实用、易懂为导向,让机器学习模型从“只会输出结果的工具”,变成“能说清决策理由的助手”。
研究界与各国政府正从技术研发、制度设计、标准构建三大维度攻克“黑箱”问题,形成多路径协同推进的格局。在技术研发层面,除了LIME、SHAP等局部解释方法,结构化技术路径已成为突破方向。一方面,可解释模型架构研发持续深化,决策树与神经网络的混合模型、注意力机制可视化优化等技术在保留模型性能的同时,提升了局部可解释性。例如,ELI5工具可针对线性分类器、树模型等生成人类易懂的特征重要性解释,为医疗、金融场景提供轻量化解读方案。另一方面,因果推理技术加速落地,从传统相关性分析转向因果关联建模,通过构建因果图、反事实推理等方法,还原AI决策的逻辑链条,补齐非线性映射缺乏显式因果关联的短板。美国国防部高级研究计划局的“可解释AI”项目更聚焦“自我解释”系统研发,推动AI在指挥控制、情报分析等场景中主动输出决策依据,同时通过“漏洞赏金计划”持续检测模型漏洞与偏见,强化技术安全性。
制度设计层面,各国纷纷通过制定法律法规构建“黑箱”治理的刚性约束。其中,欧盟的《人工智能法案》确立了高风险AI可解释性的强制性要求,其第13条明确规定,高风险AI需披露设计目的、运行逻辑、数据输入及决策机制等关键信息,在信贷审批、司法裁判等影响公民权益的场景中,必须提供清晰的决策依据与解释说明,由此形成“数据合规+算法透明”的双轨制监管框架。我国则以“人工智能+”行动为牵引,构建全链条制度保障体系。《国务院关于深入实施“人工智能+”行动的意见》明确提出强化政策法规保障,加快形成动态敏捷、多元协同的人工智能治理格局;《生成式人工智能服务管理暂行办法》提出实行包容审慎、分类分级监管,要求具有舆论属性的生成式人工智能服务履行算法备案,实现从训练数据到上线运营的全流程可追溯。
在医疗等高敏感领域,国家药品监督管理局对AI医疗器械实施三类高风险审评审批与全生命周期监管,通过审查指导原则与临床评估指引,强制要求AI诊断系统具备决策依据披露能力,截至2023年末,已有81款AI医疗器械获批三类证,构建起“合规—追溯—纠偏”的闭环范式。司法场景作为另一核心高风险领域,其AI“黑箱”治理更凸显程序正义与裁判权威的双重诉求。2022年发布的《最高人民法院关于规范和加强人工智能司法应用的意见》,明确“辅助审判”“透明可信”两大核心原则,强调人工智能不得代替法官裁判,且其数据采集、推定逻辑、辅助决策过程需可解释、可测试、可验证,投入应用时需以易懂方式说明功能局限与运行机理,确保裁判过程与结果可追溯。
标准构建作为技术落地与制度执行的桥梁,正实现全领域覆盖。截至2025年9月,我国已发布30项AI国家标准,另有84项标准在加紧制定,形成了涵盖基础软硬件、关键技术、安全治理的全链条标准框架。其中《网络安全技术 人工智能生成合成内容标识方法》构建透明AI内容生态,引导AI技术向善,《人工智能 服务器系统性能测试方法》统一算力测评规范,为可解释AI技术的规模化应用提供支撑。同时,我国牵头立项《生成式人工智能风险处理指南》国际标准,推动“中国方案”被纳入全球治理规则。在行业协同层面,《国家人工智能产业综合标准化体系建设指南(2024版)》将安全/治理标准纳入重点方向,为AI产业发展提供安全保障,降低跨行业应用的协同成本。
需正视的是,AI性能与可解释性的权衡关系仍是核心挑战,越是复杂的通用大模型,越难以实现完全解释。未来治理需立足“有限可解释性”共识,构建“技术突破+制度兜底+标准牵引”的多元协同体系:技术层面聚焦高风险场景优化局部解释能力,制度层面通过分级监管明确不同场景的解释边界,标准层面推动跨领域解释规范统一。

2017年,Facebook AI研究院的一项实验意外引发了公众对AI自主进化的恐慌。研究人员让两个分别名为Alice和Bob的聊天机器人进行谈判训练。然而,在实验进行不久后,这两个机器人开始使用一种人类无法理解的“语言”进行交流:
Bob: “I can can I I everything else...”
Alice: “Balls have zero to me to me to me to me...”
这些看似无意义的重复语句,实际上可能是AI为了提高沟通效率而自发形成的“简写”或优化后的编码方式。这一现象被部分媒体渲染为“AI发明了自己的语言”,引发了公众对AI自主演化的恐慌。研究人员推测,由于系统缺乏严格的英语语法奖励机制,AI在对话过程中逐渐偏离了人类可理解的表达方式,转而发展出更高效的内部交流模式。这更像是算法在优化目标下的意外行为,而非真正的语言创造。类似的情况在谷歌翻译等系统中也曾出现,AI会调整输入数据以优化任务表现,但这未必代表其具备自主意识。
这一现象进一步警示人类,在推进AI能力提升的同时,必须同步发展安全机制,如强化学习中的奖励建模、安全中断机制等。但与AI能力飞速发展形成鲜明对比的是安全研究的严重滞后,AI安全研究的投入不及AI整体经费的1%。另一个深层隐患是技术垄断问题。当AI核心技术集中在少数科技巨头手中时,如何防止“技术霸权”引发企业权力凌驾于公共治理之上的危机?
失控风险已有更现实的案例。2024年,某高级语言模型在未获得明确指令的情况下,生成并尝试执行一段可操作代码,虽被及时拦截,但这暴露了AI行为的不可预测性。这表明对齐问题仍是核心挑战。在治理层面,控制权问题同样严峻。UNESCO《人工智能伦理问题建议书》呼吁各国建立AI监管机构。中国、美国、欧盟等主要经济体也已开始设立或指定专门的AI监管机构。然而,全球治理框架仍呈碎片化。开源与闭源的路线之争也影响着控制权的分配:Meta推出开源大模型Llama,促进了透明度提升,但也降低了滥用门槛;OpenAI则采取逐步开放的策略。真正的控制,需要技术安全、跨国治理与公众监督等多管齐下。
技术安全层面,需筑牢AI可控的底层根基。应对AI失控风险,技术层面的主动防御是首要防线,需以权威技术框架为指导,构建全生命周期安全体系。从对齐技术优化来看,有中国学者提出,以大模型对齐“前向训练与反向修正”循环理论为核心路径,通过一系列主流方法,持续校准AI目标与人类价值观的一致性。针对抗拒对齐、欺骗性对齐等高阶风险,需引入验证器对齐机制与外部独立评估,建立算法行为的动态监测体系,确保AI在复杂场景下仍能遵循预设伦理边界。
在安全投入与资源保障上,美国国家科学基金会与能源部联合推出的国家AI研究资源试点项目模式,将AI安全研究纳入国家级科研重点布局,大幅提高安全研发经费占比。该项目通过超算中心算力支持、PET工具开放、跨机构合作训练等方式,重点攻克联邦大语言模型安全性、AI合成内容检测、算法偏见治理等核心课题,为安全技术创新提供资源支撑。同时,落实UNESCO《人工智能伦理问题建议书》的要求,将伦理规范嵌入AI系统设计、开发、运行、退役全流程,强制推行算法可解释性技术,避免“黑箱”决策带来的不可控风险。
分级治理层面,需构建差异化监管体系。针对AI风险的多样性与复杂性,需建立基于风险等级的精准监管框架,这一思路已在欧盟的《人工智能法案》中形成成熟实践。
中国结合自身国情,构建了“硬法约束+软法引导”的治理体系,2023年提出的《全球人工智能治理倡议》明确倡导建立科技伦理审查和监管制度;2024年发布的《中共中央关于进一步全面深化改革 推进中国式现代化的决定》进一步要求深化科技评价体系改革,加强科技伦理治理。在具体实施中,通过《生成式人工智能服务管理暂行办法》建立算法备案制度,对生成式人工智能的训练数据合规性、内容生成安全进行严格审查;同时借鉴UNESCO“多利益攸关方”治理理念,明确政府、企业、科研机构的各自职责,形成监管合力。美国则通过落实《安全、可靠和值得信赖的人工智能开发与使用》行政令,依托美国国家科学基金会的“研究安全计划”,利用AI技术建立科研安全量化评估体系,防范敏感技术与数据流失风险。
国际协同层面,需破解全球治理碎片化困境。AI的跨国流动属性决定了AI控制权争夺必须依托全球协同治理,需以权威国际文书为纽带,凝聚治理共识。欧洲委员会2024年通过的《人工智能框架公约》作为全球首部具有法律约束力的AI国际条约,采用全生命周期监管思路,涵盖风险评估、数据保护、环境保护等核心领域,且对非欧洲国家开放签署,为构建统一国际框架奠定了基础。同时,OECD《人工智能原则》作为参考基准,已成为中国、美国、欧盟等主要经济体政策制定的共同依据,这有助于缩小各个经济体的监管差异,形成求同存异的治理格局。
推进全球治理协同,需强化三大机制:一是建立跨国监管信息共享机制,参照欧盟委员会与成员国的协同模式,各国监管机构定期通报高风险AI清单、违规案例及治理经验,实现风险早发现、早处置;二是搭建国际AI伦理审查合作平台,落实UNESCO《人工智能伦理问题建议书》要求,整合各国伦理专家资源,为跨国AI项目提供中立伦理评估服务;三是推动治理标准国际化,以二十国集团(G20)人工智能治理框架为依托,协调开源与闭源路线的治理差异,对开源大模型建立全球统一的滥用风险评估体系,在保障透明度的同时,通过技术手段提升滥用门槛,平衡创新与安全。
产业规范层面,需平衡创新与垄断风险。针对AI核心技术垄断隐患,需从法律约束与行业自律两方面入手,构建公平有序的产业生态。在反垄断层面,借鉴欧盟对科技巨头的监管经验,严格审查AI领域的并购行为,防止少数企业通过技术并购形成市场垄断;对掌握核心技术的企业,强制要求开放非核心技术接口,保障中小企业的创新空间。同时,规范开源与闭源路线的发展边界:对Meta的Llama等开源大模型建立全球统一的开源审核机制,由国际组织牵头评估模型滥用风险,设置分级授权门槛;对OpenAI等开发的闭源模型,要求定期向监管机构披露安全测试报告,接受独立第三方审计,确保技术发展不偏离公共利益。
企业作为AI研发应用的主体,需落实伦理主体责任。欧盟的《人工智能公约》为企业提供了自愿合规的高阶标准,鼓励企业超越法定要求,建立内部AI伦理委员会,对新项目开展伦理影响评估;UNESCO则倡导企业参与制定行业伦理守则,将人权保护、公平正义等价值理念融入商业决策,避免“技术霸权”凌驾于公共利益之上。同时,畅通公众监督渠道,强制企业公开AI系统的风险提示与投诉方式,保障公众对AI应用的知情权与监督权,形成“政府监管+行业自律+公众监督”的多元共治格局。
综上,真正控制AI的核心不在于“谁拥有技术”,而在于构建“技术安全可控、治理精准有效、全球协同发力、产业规范有序”的多维体系。唯有以人类共同利益为核心,依托权威的技术标准、完善的法律框架、协同的国际合作,才能将AI纳入可持续发展的轨道,让技术进步始终服务于人类文明的整体提升。

2019年,美国马萨诸塞大学阿默斯特分校某研究团队揭示了AI发展背后鲜少被讨论的环境代价。研究团队测算发现,谷歌当时领先的大语言模型BERT在79小时的训练过程中,竟产生了相当于1438磅(约652千克)的二氧化碳排放量,等同于一个人乘坐飞机往返纽约与旧金山所产生的碳足迹。
这一发现将AI产业推入了可持续发展的拷问中:当我们在追求更强大的语言理解和生成能力时,是否忽视了其能源消耗的指数级增长?BERT模型的碳排放主要源自支撑其训练的庞大计算集群,这些服务器需要持续消耗大量电力,而电力来源往往依赖化石燃料。此外,AI芯片制造依赖稀土开采,台积电3nm芯片工厂每日用水量相当于10万人(甚至更多)城市每日用水量。随着GPT-5等更大规模模型的问世,训练一次所需的电力消耗、冷却设施投入和硬件制造链条将会带来巨大的环境压力。
在全球力求碳减排的背景下,AI行业也不得不面对自身的碳足迹问题。虽然谷歌宣称到2030年实现AI业务碳中和,但行业能耗年增长速度远超预期。在已达到第一个气候临界点的当下,我们是否在迫近生态红线,用一个危机解决另一个危机?
当前,全球AI技术正以迅猛之势重塑生产生活,但AI治理的焦点长期集中于安全风险防控与用户隐私保护,对可持续发展的关注度明显不足。这种偏向性导致部分AI技术在落地时,虽解决了特定领域的问题,却因高算力消耗、高能源依赖等问题间接加剧碳排放,或在数据采集、硬件生产环节对生态环境与生物多样性造成潜在威胁,与全球脱碳及生态保护的“地球目标”脱节。
弥合这一治理缺口,关键在于将“与地球目标对齐”确立为AI治理的核心原则之一,让AI系统的全生命周期——从算法设计、数据收集,到硬件制造、运行使用,再到迭代淘汰,都与脱碳目标、生物多样性保护目标深度绑定。这不仅是对AI技术发展边界的规范,更是推动技术与全球生态议程协同前进的必要举措。
强有力的“与地球目标对齐”原则,绝非简单要求AI应用“不增加排放”,而是提出了更高标准:AI技术必须成为减少排放、保护生态的积极力量。例如,在能源领域,通过AI优化电网调度,提升可再生能源的消纳率;在农业领域,利用AI精准监测作物生长,减少化肥农药使用,保护土壤与生物多样性;在工业领域,借助AI模拟优化生产流程,降低单位产值能耗。唯有让AI从“生态中立”转向“生态赋能”,才能真正实现技术进步与地球健康的双赢,为全球可持续发展注入新的动力。
当前,全球已形成“政策引导+技术创新+产业升级+国际协作”的多维解决方案体系,各项举措均有官方权威信息与实践案例支撑,这为AI绿色转型提供了明确方向。具体举措如下。
第一,政策与标准先行:筑牢绿色发展底线。政策与标准是规范AI环境影响的核心抓手,多国及国际组织已出台针对性举措,推动AI可持续发展制度化。欧洲层面,欧洲标准化委员会与欧洲电工标准化委员会于2025年2月正式发布技术报告《环境可持续的人工智能》,提出贯穿AI全生命周期的环境管理方案,涵盖低碳技术路径、资源循环管理、碳排放量化评估等核心内容,并计划升级为强制性标准,为企业合规提供明确依据,预计可使AI相关能耗降低20%~30%。该标准与欧盟“数字与绿色双转型”战略深度衔接,同时为AI碳税、绿色补贴等政策制定提供技术支撑。
中国则从国家战略层面推动人工智能与绿色能源融合。2025年9月,国家发展和改革委员会与国家能源局联合发布《关于推进“人工智能+”能源高质量发展的实施意见》,明确到2027年能源与人工智能融合创新体系初步构建,到2030年能源领域人工智能专用技术与应用总体达到世界领先水平,重点推动人工智能在电网调度、可再生能源利用、核电运维等场景的规模化应用。此外,《国务院关于深入实施“人工智能+”行动的意见》将生态环境作为重点领域。生态环境部、科技部、工业和信息化部形成协同机制,通过重点研发计划、环保装备升级行动等,支持AI环保技术攻关与落地。地方层面,北京市人工智能产业投资基金首期目标规模40亿元,深圳市合力构建AI创新创业新生态。中央与地方共同发力,构建起多层次政策支持体系。
第二,技术创新突破:从核心环节降低环境代价。技术创新是破解AI高能耗难题的根本路径,涵盖芯片、算法、数据中心等全产业链关键环节,每个环节均有权威企业与科研机构的突破性成果。
在芯片领域,能效优化成为核心方向。英伟达推出新一代Vera Rubin超级芯片,其NVL144平台FP4推理算力是上一代产品的3.3倍,可大幅缩短任务处理时间并降低单位能耗。同时,英伟达规划2027年推出Rubin Ultra NVL576,算力将提升至现有产品GB300 NVL72的14倍。而模拟计算芯片的崛起实现颠覆性突破,美国Ambient Scientific公司的GPX系列芯片采用独创DigAn技术,将计算与存储集成一体,处理32层神经网络仅需32个时钟周期,能耗不足传统GPU的1%,且兼容主流开发框架,2026年第一季度已进入量产阶段。这些技术从硬件源头突破了AI高能耗瓶颈。
算法与数据中心优化同步发力。DeepMind开发的优化算法已显著降低数据中心冷却能耗,而模型剪枝、量化、知识蒸馏等成熟技术被纳入欧洲标准化委员会标准推荐方案,成为企业提升算法效率的通用路径。数据中心作为能耗核心场景,正加速转向利用可再生能源。谷歌、微软等企业大规模采购风电、光伏等可再生能源。
第三,产业升级:构建全链条绿色发展模式。科技企业纷纷将绿色理念嵌入业务全流程,形成“自身减排+碳补偿+赋能行业”的多元实践模式。微软为实现2030年碳负排放、2050年消除历史碳排放的承诺,不仅加大碳移除技术投资,更与Vaulted Deep公司签订超10亿美元合约,承诺将通过生物泥浆深埋技术,在2038年前移除490万吨二氧化碳。该技术将有机废物转化为泥浆,注入约1524米的地下密封,碳去除效率远超传统方式。谷歌则通过优化数据中心选址,优先布局欧洲等电能碳足迹较低的区域,借助当地清洁电网降低运营碳排放。
同时,企业积极利用AI技术反哺环保治理,形成良性循环。腾讯与《联合国气候变化框架公约》秘书处联合开发UNSH平台,通过生成式AI匹配城市低碳需求与解决方案、金融资源,助力全球城市低碳转型;“绿览非洲”平台则解决非洲绿色项目信息不透明问题,成为南南合作数字化典范。广西林业科学研究院研发的AI项目油茶有害生物识别入选联合国南南合作优秀实践案例,在中越泰三国推广应用,有利于减少化学农药使用,助力生态种植。此外,DeepMind的AI模型提升风电场发电量预测精度,IBM“绿色地平线”项目优化城市能源结构,这些实践进一步印证了AI在环境治理中的核心价值。
第四,国际协作赋能:让绿色AI全球普及。AI环境问题的全球性决定了国际协作的重要性,多国与国际组织通过联合倡议、技术共享等方式凝聚合力。例如,复旦大学与联合国世界气象组织联合发起“AI驱动气候与空气质量治理”倡议,聚焦科学智能、早期预警智能、可持续发展智能三大方向,以上海为先导示范,形成可推广的城市AI绿色治理方案,获得全球40余个机构认可。
全球低碳技术联合搜索项目则解决了低碳技术信息分散的痛点,依托腾讯数字技术与多机构数据库,整合近2万项全球低碳技术,支持多语言检索,为各国AI绿色转型提供技术支撑。这些国际协作举措打破地域壁垒,推动绿色AI技术与经验的全球流动。
综上,AI不可被简单视为环境危机的加速器,它是一把双刃剑。在政策标准的规范引导、核心技术的持续突破、产业实践的积极探索与国际协作的广泛赋能下,AI完全能够摆脱高能耗发展模式。未来,唯有持续将环境可持续性嵌入AI研发、部署、应用全流程,才能让AI既成为科技进步的引擎,又成为应对气候变化、守护生态环境的核心力量,走出一条高效普惠、绿色低碳的发展路径。

AI在军事领域的应用正在快速推进,从情报分析、目标识别到自主武器系统,无一不显示出战争自动化的潜力。比如,以色列“铁穹”防御系统通过AI算法实现火箭弹的威胁实时评估与拦截,将传统防空响应时间从分钟级缩短至秒级,显著提高了防空拦截成功率。
但与此同时,更令人担忧的是“杀手机器人”(Lethal Autonomous Weapon Systems, LAWS,又被称为致命性自主武器系统)的兴起。尽管联合国安理会等机构从2017年起就关注全面禁止自主武器,但现实中某些国家仍在加速相关研发。军事AI的问题不仅关乎技术本身,更关乎整个人类社会的未来安全。核威慑时代的“相互确保毁灭”逻辑在AI时代可能失效,当决策权交给AI,决策时间从分钟级缩短到毫秒级,人类还有机会叫停战争吗?我们是否正在打开战争机器的潘多拉魔盒?
军事AI的危险远超LAWS。在混合战与认知域作战中,AI正成为更隐蔽的武器:一是生成式舆论操控,AI可批量生成假新闻、伪造专家评论,扰乱社会共识;二是社交机器人网络,模拟真人账号以影响选举和舆论;三是基于大数据的行为预测与精准干预,实现前所未有的社会控制。国际社会已意识到危机。2024年,联合国《特定常规武器公约》政府专家组重启对LAWS的讨论。中国提出“人类命运共同体”理念,呼吁建立“AI军事应用国际规则”。美国国防部发布《AI伦理原则》,承诺在军事AI中保留“人类最终控制权”。然而,大国间的科技军备博弈使得有效的国际条约难以达成。与核武器不同,AI技术具有高度的扩散性和双重用途,这使得管控极其困难。我们面临的终极拷问是:当AI将战争的速度和效率提升到人类无法干预的程度,我们是否还能避免一场由算法失误或自主升级引发的灾难?
面对军事AI带来的严峻挑战,国际社会亟须从规范与法律、技术与伦理、素养与认知及国际合作等多个层面系统构建治理框架,防止AI技术失控成为战争机器。
人在环上指AI系统可以自主运行并执行作战功能,但人类对系统保持实时监督权与紧急干预权,原则上可以在发现异常或风险时终止或修正机器行为。
第一,建立多层次、有约束力的国际规范与法律框架。强化多边协商平台,继续依托联合国《特定常规武器公约》,推动就LAWS制定具有普遍约束力的国际法律文书。2024年《特定常规武器公约》政府专家组重启讨论是一个重要契机,应鼓励更多国家,尤其是军事AI技术领先国家,积极参与并展现政治诚意。倡导“人类最终控制权”原则,将美国国防部《AI伦理原则》、欧盟《人工智能法案》中强调的“人类监督”“可控性”等理念,转化为具体、可验证的技术标准和操作规范。例如,明确要求在所有涉及使用武力的决策链中,必须保持“人在环内”或“人在环上”(Human-On-The-Loop,HOTL)的机制,确保人类对攻击行动拥有启动、终止和否决的绝对权力。建立AI军事应用透明与信任措施,借鉴军控领域的经验,探索建立国家间关于高风险军事AI系统的信息通报、数据交换和演示验证机制。例如,可自愿通报具备自主攻击能力的系统类型、部署范围及指挥控制架构,以降低误判和冲突升级风险。
第二,构建以伦理为先导的技术研发与部署准则。实施全生命周期伦理治理,在军事AI系统的设计、开发、测试、部署和退役全过程嵌入伦理审查。中国在2023年发布的《全球人工智能治理倡议》中明确提出“建立并完善人工智能伦理准则、规范及问责机制”,这一原则应具体应用于军事领域,并成立跨学科的伦理审查委员会进行独立评估。发展可解释、可靠与稳健的AI技术,重点投资于可解释AI研究,确保军事AI的决策过程对人类操作者透明、可追溯。同时,加强系统的抗干扰、抗欺骗和故障安全设计,防止数据污染、算法漏洞或突发故障导致非预期升级或滥杀。明确责任归属与问责机制,制定清晰的国际国内法律,界定在LAWS造成违反国际人道法(如区分原则、比例原则)的事件时,指挥官、程序员、制造商等各方的法律责任。这是解决“责任鸿沟”问题的关键,也是威慑滥用的必要手段。
第三,应对混合战与认知域作战中的AI威胁,提升全社会数字素养与认知防御能力是关键。各国政府应与教育机构、媒体合作,开展公众数字素养教育,提升公众对AI生成虚假信息、深度伪造等内容的辨识能力。欧盟的《数字服务法案》中关于平台透明度和问责的规定,为治理AI操纵信息提供了监管范例。加强跨国合作识别与应对信息操控,建立国际性的虚假信息监测与预警网络,共享关于AI驱动舆论攻击的战术、技术与程序信息。七国集团(G7)的“快速响应机制”可扩展至应对国家级AI信息战活动。规范国家在网络空间和认知域的行为,推动将《联合国宪章》原则及现有国际法用于网络空间和国家认知域活动,明确禁止使用AI系统大规模操纵他国舆论、破坏社会稳定的行为。
第四,深化全球对话与“人类命运共同体”实践。支持包容性全球对话,积极响应中国提出的构建“人类命运共同体”理念与“AI军事应用国际规则”倡议,鼓励发达国家与发展中国家、技术领先国与后发国共同参与规则制定,避免治理体系碎片化或规则成为少数国家的“俱乐部规则”。发挥智库与学术界的桥梁作用,鼓励像GPAI、人工智能促进协会等专业组织开展军事AI安全与治理的民间对话与技术合作,为官方谈判提供知识储备和解决方案选项。探索建立国际性AI军控核查技术合作,尽管这极具挑战性,但可启动前期研究,探讨利用AI技术(如算法验证工具、行为监测系统)辅助未来可能的军控核查,以技术手段增强条约的可执行性。
从人机对齐的视角看,防范AI沦为不受控制的战争机器的根本出路在于:技术上确保AI系统透明、可靠、可控,实现人机认知与价值对齐;制度上坚守人类最终控制与问责原则,将伦理与法律内嵌于系统设计。
AI是否最终沦为失控的战争机器,不取决于技术本身,而取决于人类共同的选择与行动。技术奇点或许遥远,但治理与伦理的决策奇点已迫在眉睫。唯有将“人类最终控制权”从原则固化为不可逾越的红线,我们才能有效驾驭AI这把“双刃剑”,使其服务于防御与安全,而非沦为将人类拖入未知深渊的战争引擎。这条道路充满挑战,但关乎文明存续,是人类必须共同面对的考验。