书名:从线性代数到量子计算
ISBN:978-7-115-68210-9
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
著 裴 灵
责任编辑 单瑞婷
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
本书主要介绍量子计算的原理、著名算法及相关应用,旨在通过细致的讲解和直观的类比,降低量子计算的入门难度,帮助读者快速了解量子算法的典型应用思路、量子优越性的实现途径及量子算法的应用场景,为进一步学习奠定基础。
本书共6章,第1章介绍量子计算的物理基础,即量子力学;第2章概括性介绍量子计算的基本原理及著名量子算法;第3章介绍量子计算所需的数学基础;第4章介绍量子门与量子电路;第5章介绍几个基础量子算法;第6章介绍量子算法的实际应用场景。
本书适合具有一定大学数学基础,特别是线性代数基础,且对量子计算感兴趣的读者阅读。
作为一个正处于快速发展期的新兴领域,近几年量子计算方面涌现出了许多优秀教材和科普读物,呈现出百花齐放的盛况。
而作为一名对量子计算感兴趣的普通学习者,作者也搜集了很多教材和科普图书来阅读,它们有的通俗易懂,有的观点深刻,有的内容广博,有的贴近前沿……一路读来,几乎每一本书都能给作者带来新的收获。然而,在阅读时,作者也曾面临一些初学者的困境,例如在很长一个阶段都对量子算法如何利用并行计算的优势实现运算加速感到困惑,在学习一些必要的基础知识时不知道动机所在,在了解量子计算应用场景时缺乏必要的背景知识导致理解困难……
随着自身的思考、阅读的深入,以及对更多相关文献的查阅,这些困境最终都得以摆脱,但这个过程也让作者萌生了一个想法:将这些深入思考和阅读的信息整理出来,作为一份初学者的心得呈现出来,让更多初学者能够少走一些弯路,在学习的最初阶段就能对量子计算的基本思路以及应用场景有一个相对系统化的认识,并且在后续学习过程中感到困惑时能及时看到来自另一位初学者的理解。这就是作者撰写本书的动机。
基于上述动机,本书以贴近初学者为宗旨,用尽量直观的语言和尽量细致的解说,来解释量子计算的物理、数学基础,以及各种量子算法实现运算加速的过程。同时,在涉及具体应用场景时,会对相关背景知识进行易于理解的介绍,以使读者能更顺畅地理解量子计算如何解决实际问题。
当然,受限于作者自身的见识和能力,本书必然存在诸多不足之处,例如在追求直观的同时可能会牺牲一些语言的严谨性,在侧重细节的同时相较其他图书会缺乏一些基础理论上的深度和内容上的广度……
虽然深知书中可能出现诸多不足,但在初学者偶有所得时的兴奋和分享欲的驱使下,作者仍然斗胆写下这本拙著,唯愿它能为广大读者学习量子计算提供一些补充,为大家带来些许帮助。
本书共6章。
第1章介绍量子计算的物理基础,即量子力学,主要内容包括:量子态的直观理解及数学表现形式,量子测量的性质及测量结果概率分布的计算方法,不确定性原理的基本概念及直观理解方式,自旋的基本概念及其测量性质,薛定谔方程的物理意义及其解的结构。本章旨在让读者了解量子计算的物理基础。
第2章概括性介绍量子计算的基本原理及著名量子算法,主要内容包括:经典计算原理的快速回顾,通用计算的概念及实现途径,量子比特的数学形式及测量性质,量子优越性的实现途径,几个著名量子算法的快速预览。本章旨在让读者在学习之初就快速了解量子计算的基本原理及实现量子优越性的基本思路(而不必等到学习具体量子算法时才去摸索出这些内容),并且通过具体的量子算法来体会这些思路。
第3章介绍量子计算所需的数学基础,主要内容包括:线性代数知识的快速回顾,复线性空间中的向量和矩阵运算性质,向量和矩阵的张量积及其运算性质。本章旨在让读者熟悉量子门及量子电路中涉及的数学运算。
第4章介绍量子门和量子电路的运算规则,主要内容包括:单量子比特门和受控门的概念及其运算规则,量子电路的基本运算规则和特殊性质,量子计算通用性的理论依据,典型量子门的物理实现方案。本章旨在让读者掌握通过量子电路推算量子算法中各步变换以及最终输出结果的方法,同时深入理解量子计算与经典计算的异同点。
第5章介绍几个著名的、具有实际应用价值的量子算法,主要内容包括:格罗弗算法,量子相位估计算法,两个基于测量结果的概率分布输出计算结果的量子算法——SWAP测试和阿达玛测试。本章旨在让读者体验这些算法从基本思路的提出到量子电路的实现方式,再到得出最终计算结果的完整过程。
第6章介绍量子算法的实际应用场景,主要内容包括:数据搜索,最优化问题的求解,基于RSA加密算法的密码破解中所需的大数质因子分解,线性方程组的求解,量子机器学习,量子化学模拟,变分量子算法。在这些应用场景的介绍中会有相关背景知识的介绍。本章旨在让读者对量子计算如何走向实际应用有系统性了解。
本书旨在满足量子计算领域初学者的学习需求,特别是对量子算法基本原理及计算细节感兴趣的读者群体。在知识背景方面,本书预设读者已掌握大学数学的基本概念,特别是线性代数的基础知识,同时拥有高中物理的基本认知。当然,若读者已阅读过量子力学的科普读物或具备大学普通物理的相关知识,将有助于更深入地理解和把握本书的部分内容。
对于书中可能存在的不足之处,恳请各位读者不吝赐教,提出宝贵的批评与建议,以便我进行修正与完善。反馈意见可发至我的邮箱:peilingx@aliyun.com。
本书从构思到出版,承蒙人民邮电出版社傅道坤老师和单瑞婷老师的全程指导。傅老师从最初的选题策划到具体的写作建议,展现了独到而睿智的眼光,促成了本书写作的开始。单老师在内容编排与呈现方式上给予了细致的指导和建议,倾注了丰富的经验和智慧,使本书的质量得到了显著提升。
在撰写过程中,上海大学理学院物理系副主任李永乐教授对部分内容,尤其是量子计算在量子化学模拟中应用的相关章节提出了宝贵的修改意见。李教授的耐心指导与专业见解,让我受益匪浅,也使本书增色良多。
最后,特别感谢我的夫人蒋林宏女士。从我们初识时她提议我进行科普写作,到多年来始终如一的鼓励与支持,让我将科普写作的理想变成现实。
谨以此书,向所有给予帮助的师友与家人致以最诚挚的谢意。
裴灵
2025年6月
本书提供如下资源:
• 本书配套小册子;
• 本书思维导图;
• 异步社区7天VIP会员。
要获得以上资源,您可以扫描下方二维码,根据指引领取。

我们的联系邮箱是shanruiting@ptpress.com.cn。
如果您对本书有任何疑问、建议,或者发现本书中有任何错误,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。
如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们。
如果您所在的学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。
如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接发邮件给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。
“异步社区”(www.epubit.com)是由人民邮电出版社创办的IT专业图书社区,于2015年8月上线运营,致力于优质内容的出版和分享,为读者提供高品质的学习内容,为作译者提供专业的出版服务,实现作者与读者在线交流互动,以及传统出版与数字出版的融合发展。
“异步图书”是异步社区策划出版的精品IT图书的品牌,依托于人民邮电出版社在计算机图书领域多年的发展与积淀。异步图书面向IT行业以及各行业使用IT技术的用户。

在开始量子计算之旅之前,我们不妨来简单熟悉一下量子力学的一些基本概念,毕竟量子力学是量子计算的物理根基。虽然跳过量子力学直接学习量子计算也可行(适用于只关注量子算法部分的读者),但那会让我们感觉像是在参观一座浮在云海上的空中楼阁,看不到根基之所在,心里可能会觉得不踏实。从不那么功利主义的角度来说,量子力学本身也充满着一种完全不同于经典物理的“异域风情”,值得好好欣赏一番。

本书将虚构两个角色(匡老师
和康同学
)的对话,在对话中引出主要内容。
此外,为了帮助读者对量子力学的框架快速形成直观理解,第1章中会用到很多直观类比,这些类比可能会牺牲一些数学上的严谨性,本书剩余章节将根据需要补充更严格的定义。
看这标题,是打算先讲线性代数吗?听起来有点儿可怕啊……
不不不,不用怕,我们上来就直接聊量子力学。
那为什么要“用线性代数打开”呢?
你以前读过一些量子力学的科普书吧?
对对对,读过好几本呢。
挺好,说说你的读后感吧。
怎么说呢……有的书写得还挺不错,读起来也很吸引人,但读完之后会觉得量子力学里的现象和概念很零散。像什么波粒二象性啊,不确定性原理啊,“薛定谔的猫”啊,量子纠缠啊……这些概念听起来都很新奇,但我始终不知道它们有什么联系。那种感觉就像是作者带你透过窗户看了几个风格不同的房间,但又不带你进去,就让你在窗外看两眼,还没看清房间内部的结构,参观就结束了。
有这种感觉太正常了,那些科普书的任务本来就是“让你在窗外看两眼”,只要能成功“吊起你的胃口”,就说明作者已经做得相当不错了。
但我还是想“进门”去看看,这些“房间”是怎么连起来的,或者说,在这些“散装”的现象和概念中,有没有什么主线和理论体系。
想“进门”看看其实不难,只要你有开门的“钥匙”。
什么钥匙?
标题写着的——“线性代数”。
原来标题是这个意思啊……不过,线性代数学是学过,就是感觉没学懂,除了应对做题、考试,别的就不知道了。
别担心,我们不是在上数学课,不会给你砸一堆定义、定理和证明。我们只是借助一些线性代数的概念把量子力学的理论框架搭建起来,这样做还可以帮助你用几何图景和物理图景理解线性代数里的一些抽象概念。
这么一说我还有点期待呢!
在开始讲述之前,我们来讨论一个问题:量子力学和经典力学的区别是什么?
也许有读者会马上回答:这个问题我知道,量子力学描述的是微观粒子,经典力学描述的是宏观物体。
的确,这个回答在某种程度上可以体现量子力学的特点,但这并不是本质区别(因为微观世界和宏观世界并不是割裂的,所以描述微观粒子的方式理应能推广到宏观物体上)。量子力学更“本质”的特点,在于如何描述物理对象的状态。
在经典力学中,如果要描述物理对象的状态,就会用到具体的物理量,例如位置、速度、加速度、动量、能量等。而与经典力学不同的是,量子力学描述状态的方式听起来非常简单,简单到只需要一个概念:量子态(quantum state)。
这个概念可以帮助我们将科普书上那些零散的现象连贯起来,从而由浅入深地认识量子力学的理论体系,进而理解量子计算最基本的载体,也就是量子比特最关键的特征。
那么接下来的问题就是:这个听起来很玄的量子态到底是什么?
有意思的是,虽然量子态是一个物理概念,但如果一开始就尝试从物理的角度去理解它,反而会很费解,因为我们在量子力学中会遇到各种形式的量子态:物质波的波函数是量子态,氢原子的能态是量子态,两个粒子相互纠缠的状态是量子态,“薛定谔的猫”那种既生又死的诡异存在也是(一种虚构的)量子态……
要获得关于量子态的清晰图景,最快的方式反而是先了解它的数学形式及其“几何意义”,幸运的是,这个数学形式其实就藏在大学的线性代数教材里。

我们以后还会深刻地体会到,对于量子力学与量子计算中的很多概念和结论,讨论它们的代数形式及其几何意义,要比讨论物理现象本身来得更直观。
让我们以量子力学中最具传奇色彩的“薛定谔的猫”为例,细细体会叠加态的奥秘。
先来看一下“薛定谔的猫”这个著名的思想实验。
一个黑盒子里装了3件东西:一颗有50%的概率发生衰变的放射性粒子、一台可以被放射性粒子的衰变触发的杀猫装置(例如一个带阀门的毒气瓶,它的阀门会因粒子衰变而打开)和一只不幸被选中的猫,如图1.1所示。

图1.1 “薛定谔的猫”实验
盒子封闭,人们无法对盒子内部进行观测,对盒子外面的观测者来说,粒子是否发生衰变是一个不确定的状态。相应地,那只猫便处于一种“既生又死”的叠加态(superposition state)。
需要注意的是,这种不确定的叠加态并不意味着“猫已经死了或者还活着”,只是我们不知道盒子里面发生了什么。实际上,粒子是否发生衰变以及猫是死还是活,本身就处于一种叠加的状态。“猫已经死了”或者“猫还活着”这样的“事实”都没有发生,盒子中的猫本身就处于这种生与死叠加的状态。
这样的介绍也许并不能满足一些读者的胃口,因为无论文字描述多么精妙,这种不可捉摸的叠加态都超出了读者的直观经验。即使索尽枯肠,也很难找到一个既有的物理模型来匹配它。
实际上,要准确理解叠加态并不难,只需要借助线性代数中一个非常基础的概念——向量(vector)。
让我们忘掉物理中的概念,做一件更有“数学味道”(或者说“几何味道”)的事情:先找一张白纸,从纸张中心(或任意位置)向右水平画一个箭头(代表向量),将其标记为“死猫”,再从同一中心点向上垂直画另一个箭头,将其标记为“活猫”,分别对应打开盒子后的两种可能的观测结果,如图1.2所示。

图1.2 表示“死猫”与“活猫”的两个向量
这两个箭头(向量)所表示的就是“死猫”和“活猫”在量子世界中的对应(两种不同的量子态)。同时,“死猫”和“活猫”对应的两个向量正好是相互正交的。
从线性代数中可以知道,两个相互正交的向量可以作为一组正交基底,生成一个二维平面(二维线性空间),这个二维线性空间称作“薛定谔的猫”的态空间(state space)。这个态空间作为一个线性空间,还可能存在其他向量,不妨将其记为
(用红色箭头表示),如图1.3所示。

图1.3 态空间中的其他向量
此时,我们就可以理解什么是叠加态了。
在经典世界里,一只猫的状态要么是生,要么是死,对应到图1.3中,意味着猫的状态只能是那两个正交基底中的一个。但是在量子世界里,猫的状态可以是态空间中任意一个“方向”上的向量。

这种“方向”上的任意性,就是量子世界和经典世界最重要的区别之一,也是量子计算机在解决某些问题时相较于传统计算机(也称经典计算机)能够展现出压倒性优势的根本原因。本书后续章节将会对此进行深入讨论。
我们知道,一个
维线性空间中的向量,可以分解为
个线性无关的基向量的线性组合。以此类推,在图1.3所示的二维平面上,任意一个向量都可以表示为“死猫”和“活猫”两个正交基底的线性组合,现在我们用量子力学语言将它写出来。
量子力学中通常采用狄拉克符号(Dirac notation)来表示量子态或向量,它具有形如“
”这样的形式,即一个竖线加一个尖括号的右半部分,中间夹一个希腊字母、拉丁字母、数字或其他物理量相关符号。为了帮助理解量子态,我们假设“死猫”和“活猫”两个基向量对应的状态为
和
,那么图1.3中的向量就可以表示为式(1.1)中的线性组合:
(1.1)
其中,两个系数
(假设它们是实数)叫作投影系数,就是量子态
分别在
和
两个基向量上的“投影”,如图1.4所示。

图1.4 量子态及投影系数的几何意义

可以类比为线性代数中的列向量。此外,还有与行向量对应的形式,它表示为一个尖括号的左半部分加一条竖线,中间夹一个希腊字母、拉丁字母、数字或其他物理量相关符号,记作
。3.1节和3.2节将对它进行更多介绍。
此外,为了与量子计算中的表示方法一致,本书绝大部分场合都采用狄拉克符号来表示向量,而不采用数学和物理上常用的粗斜体字母(例如
)或斜体字母上加箭头(例如
)的形式。除非需要区分态空间和其他空间中的向量(例如6.3节和6.4节中对态空间和参数空间的区分,以及第3章部分内容中对态空间和三维欧氏空间的区分)。
在线性代数中,两个标准正交基底也可以写为列向量的形式
和
。因此,上述量子态还可以写为列向量的形式:
(1.2)
而这种线性组合就对应那个“生死不明”的状态,图1.5直观地展示了两种不同视角下的量子态。

图1.5 两种不同视角下的量子态
从数学上来说,量子态可以看成抽象的态空间中的一种广义的向量,满足向量的一切性质。在量子力学中,由于这种向量性质的存在,量子态也被称作态矢量(state vector)[1]。
[1] 物理学中的“矢量”和数学中的“向量”是同一个词,其英文都是vector。

也许有读者会好奇,式(1.1)中的投影系数
有没有什么“物理”意义?大家不妨先猜一猜,1.2节将揭晓答案。
此外,需要注意的是,在这个思想实验中,严格来说,猫的状态和粒子是否发生衰变处于一种纠缠态(2.2节将会详细介绍纠缠态)。这里为了方便理解,不妨忽略猫与粒子的纠缠,仅将猫看作一个独立的系统。
“薛定谔的猫”只是一个虚构的例子。我们更想知道,现实中真正存在的量子态是什么样的。在量子力学中,一个粒子或系统的完整量子态信息主要由波函数和粒子的自旋态(将在1.4节中专门介绍自旋)共同描述。现在先来简单认识一下波函数。
一些读者也许知道,微观粒子具有波粒二象性,会伴随着一种物质波。这种物质波在量子力学中用波函数(wave function)来描述。在位置表象下,波函数可以记作
,这是一个关于空间位置的函数。
包含粒子处于某个位置的概率信息(将在1.2节中讨论)。
大家也许会对这个不属于经典世界的概念感到困惑,但接下来我们将看到,波函数实际上是量子态的一种表现形式,也可以从向量的角度来理解。
这听起来很奇怪:一个函数怎么能和向量联系起来呢?为了从易到难地理解这一点,不妨先考虑一个简单的物理情形,然后从它出发去构造波函数。
假设一个粒子处于一维空间中,并且只会出现在
和
两个位置。
在经典力学中,这个粒子的位置总是确定的,要么在
处,要么在
处。但在量子力学中,这个粒子有可能处于一种位置不确定的状态。这个状态就类似于“薛定谔的猫”的状态,现在我们来给出它的数学形式。
当粒子确定地位于
处时,它的状态会对应一个量子态,不妨将其记作
;当粒子确定地位于
处时,它的状态会对应另一个量子态,不妨将其记作
,如图1.6所示。

图1.6 具有确定位置的粒子所对应的量子态
与
和
两个量子态一样,
和
在态空间中也是相互正交的,它们构成了一组标准正交基底。在量子力学中,这些具有确定位置的状态被称作位置的本征态(eigenstate),而相应的位置坐标值被称作位置的本征值(eigenvalue)。
在量子力学中,粒子对应的量子态也可以是除
和
以外的其他量子态,此时,粒子往往没有确定的位置,如图1.7所示。

图1.7 没有确定位置的粒子
这些量子态可以表示为两个位置本征态的线性组合,即
(1.3)
或者写成列向量的形式:
(1.4)
现在将这个简单情形推广到实际情形。
在实际情形中,粒子可能存在的位置有无穷多个,而不仅仅是
处或
处,这样,对应的位置本征态也就有无穷多个,它们在态空间中也就构成了无穷多个正交基底,于是一个粒子对应的量子态就变成了无穷多个基底的线性组合:
(1.5)

严格地说,由于
在连续的实数域上取值,因此应该以积分的形式表示此处的求和,但这里暂且不做细致区分。
也就是说,一个粒子对应的真实的量子态其实可以看作一个“无穷维”向量,它可以展开为一系列位置本征态
的线性组合,其中每个系数
可以看作坐标
的函数,这正是粒子的波函数
。于是,量子态可以重新表示为
(1.6)
从几何上来看,波函数
就可以看作量子态在相应的位置本征态
上的“投影”,这和前面给出的简单情形中叠加态的“投影”没有本质的区别。只不过简单情形中的态空间是二维的,而波函数所在的态空间是“无穷维”的。图1.8展示了从二维简单情形到“无穷维”情形的过渡。

图1.8 从二维简单情形到“无穷维”情形的过渡
至此,我们就完成了对量子态的初步认识。

需要注意的是,很多有限维空间中成立的结论并不能照搬到无限维空间中。本书尚不会深入介绍这些问题,如果有读者将来深入研究量子力学,就需要对相关数学基础有所了解。
本节首先借助线性代数中向量及其线性组合的概念,结合“薛定谔的猫”实验,描述了量子态的几何直观意义,并且讨论了量子态与物理世界的联系。
此后,我们以位置的状态为例,看到了如何将经典力学中具有确定位置的状态(位置本征态)组合成更一般的叠加态,并将其推广为量子力学中的波函数,同时将它类比为一个“无穷维”空间中的向量,同线性代数中的向量的概念联系在一起。

从这一过程中可以看到,相较于物理视角,采用几何视角来理解量子态显得更为直观易懂。这种几何图景以及相应的线性代数模型,预计将在未来相当长的一段时间内,持续帮助我们理解量子力学和量子计算中一些新的概念。
不过,对很多初学者而言,仍然有一个令人不解的问题:既然在量子世界中物体的状态是以波函数这一量子态的形式存在的,那么为何人们在实际中通常观察到的是物体的位置、动量等确定数值,而不是叠加态呢?1.2节将对此展开讨论。
现在我大概知道量子态和波函数是什么概念了,不过我还有一个疑问,为什么在日常生活中,我们总是能观测到物体的确定位置,而不是看到一个叠加态呢?
其实你已经提到了一个关键词——“观测”。将量子力学中的叠加态和经典力学中确定的测量值联系起来的,就是观测(或者测量)。对一个处于任意叠加态的粒子进行某种力学量(比如位置)的测量,会破坏原有的叠加态,并且随机得到一个确定的测量结果。
这个过程听起来有点意思。既然你提到了随机性,那是不是意味着每个结果都会有一个出现概率?
没错,其实在量子力学和量子计算中,这种概率非常重要。本节会讨论这种概率的计算方法,顺便聊一聊它的几何意义。
先回到前面提到的简单情形:假设粒子存在于一维空间中,并且只可能出现在两个位置,即
处或
处。
在经典力学中,粒子要么在
处,要么在
处,不会有其他可能。而在量子力学中,这两种情形仅仅是粒子所有可能状态的特殊情形,即粒子的两个位置本征态,分别记为
和
。粒子的一般状态可以是两个位置本征态的叠加,即
(1.7)
那么,为什么人们在实际中总是看到粒子处在某个确定位置,而不是一直处于不同位置本征态的叠加态呢?这是因为,当一个观测者测量粒子位置的时候,这个测量行为破坏了粒子的状态,使它随机变成了两个位置本征态(
和
)中的某一个(不再是二者的叠加态),此后粒子就获得了确定的位置信息,并且以测量结果的形式呈现出来。图1.9直观地展示了测量过程中量子态的变化及观测者看到的变化。

图1.9 测量过程的直观几何图景
这样一来,量子态就和实际可以观测到的经典物理结果联系在一起。

对测量过程的这种解释,最早由量子力学史上著名的哥本哈根学派提出,因此也被称为“哥本哈根诠释”。也许有读者会觉得这个诠释有些“简单粗暴”,例如对于“测量”行为,这个诠释就缺少严格的定义:到底是粒子与仪器系统的相互作用算测量,还是具有意识的观测者读取到仪器读数才算测量?
实际上,对于这些问题,现在已经有一些更细致也更自洽的假设被提出,例如多世界诠释、退相干理论等,有兴趣的读者可以进一步了解。鉴于篇幅限制,本书不深入探讨这些内容。哥本哈根诠释已足以让我们顺利地学习和理解量子计算的基础知识。
实际上,量子计算中同样要面临这样的过程:量子计算是在量子比特的叠加态上进行的,然而,当必须输出计算结果时,往往需要借助测量来得到一个确定的数值,该数值对应某一力学量的本征态。
除了可能的测量结果本身,量子力学和量子计算中还会关注每个测量结果出现的概率,下面就来看看如何计算这些概率。
在定量讨论这种概率之前,不妨做一个定性的猜测。
假设有两个粒子A和B,分别处于图1.10所示的两个量子态
和
,显然,它们都不具有确定的位置。假如观测者测量粒子A和粒子B的位置,并且关注测量结果
出现的概率,那么出现
这个测量结果的概率是不一样的。

图1.10 两个不同粒子的量子态
现在,请先凭直觉猜一猜,如果对两个粒子的位置分别进行测量,那么哪个粒子位于
的概率更高?
也许你猜到答案了,粒子A位于
的概率更高,因为它的量子态在“几何上”更“靠近”位置本征态
(如果考虑极端的例子,当
与
完全重合时,粒子A位于
的概率将达到1)。
虽然这不是定量计算,但它能提供一个非常好的直觉,而且对于后面理解量子计算的过程也非常有帮助。
现在来看看如何定量计算这种概率。实际上,几何上的“靠近程度”可以用另一个量来描述,就是某个量子态
在相应本征态上的投影长度,投影长度越长,则最终测量结果变成相应本征态的概率就越大。
假如叠加态
的两个系数
、
都是实数,那么它们就可以表示投影,而它们的平方就分别对应测量结果为
和
的概率,即
(1.8)
图1.11给出的例子直观展示了这种关系。

图1.11 量子态的投影系数与结果分布概率的关系的一个示例
不过,在量子力学中,叠加态中的系数其实往往是复数(后面会看到引入复数的必要性),对复数简单取平方,仍然会得到一个复数,这不能作为一个概率值存在。因此更一般的情况下,两种结果的概率是两个系数
、
的模平方,即
(1.9)
其中,
、
分别表示
、
的共轭复数。

有读者可能还会好奇为什么概率是
、
的平方,而不是直接等于
、
,稍后会讨论它的合理性。
这个结论可以推广到更一般的波函数。根据前面的讨论,某个量子态在各个位置本征态上的投影系数,就构成了关于位置的函数,也就是波函数
。于是,测量后粒子位于某个位置
的概率密度
(波函数是定义在连续的实数域上的,因此用概率密度代替概率),就是该位置对应的波函数
值的模平方,即
(1.10)
当测量完成后,粒子就具有了确定的位置,它的状态也就变成了某个位置本征态,就像图1.9所示的那样。
在不受外界环境干扰的情况下,粒子将一直保持这个位置本征态,此时如果再次重复测量它的位置,将总是得到同一个结果,而不再具有不确定性,从概率上说,这也就意味着测量后粒子位于相同位置的概率总是为1。
这一点也可以从投影的角度来理解:当粒子的状态处于某个位置本征态时,这个位置本征态与其他位置本征态相互正交,也就意味着它在其他位置本征态上的投影为0,那么此时测量结果中出现其他位置的概率也就是0了。
而如果比较测量前、后的概率分布图,如图1.12所示,则可以形象地看到,分散的概率分布在测量后集中在一个点上,对于这个过程,量子力学中有一个形象的说法,即叠加态的坍缩(分散的叠加态坍缩到一个点上)。

图1.12 波函数的坍缩

出于易于理解的考虑,图1.12所展示的是离散、有限的情形,真实的波函数坍缩后会变成一个在其他位置概率密度为0,在
处概率密度为无穷大,同时在
附近积分为1的函数(这才符合连续分布概率的定义),这其实对应量子力学中一个著名的特殊函数,称为δ函数(学过积分变换、控制理论、信号与系统等课程的读者应该对它有印象),有兴趣的读者可以自行了解它的更多信息。
当然,随着测量的结束,原有的叠加态以及概率分布信息也会被破坏并且不可还原,这也意味着测量前的量子态信息会在测量中丢失。在量子计算中,这是一个需要注意的性质,后面还会再讨论它。
不难想到的是,对于一次测量而言,所有可能出现的结果的总概率为1,即任意量子态在各个基底上的投影的模平方之和(概率之和)总是等于1,这样的条件称为归一化条件。
在前面给出的位置
只能是0或1的简单情形中,这就意味着:
(1.11)
从几何意义来看,就是任意一个量子态
的“长度”都是1,如果
都是实数,那么它的“箭头”将落在二维平面的单位圆上,如图1.13所示。

图1.13 归一化条件的直观图景

从几何角度来讲,勾股定理保证了投影的模平方和(
)总是等于一个常数(在归一化条件中这个常数就是1),而投影长度的模直接相加(
)却不能保证这一点,因此采用投影长度的模平方来表示概率是合理的。
而在真实情况中,位置有无穷多个本征态,于是波函数在态空间中就形成了“无穷维”的超球面。虽然这不能直观地用图像来表示,但是我们仍然可以给出它的数学形式,这只需要将求和变成积分,即
(1.12)
在量子计算中,我们也将看到,无论一个量子比特的状态怎么演化,这个归一化条件总是不变的(这也是符合物理直觉的,因为无论什么样的状态,测量后所有结果出现的概率总是1),后面还会讨论这条性质的重要性。
前面一直在讨论位置的测量。实际上,除了位置之外,观测者也可以测量一个物理对象的其他力学量,例如动量、能量等。而其他力学量可能的测量结果也对应其他本征态系列。这意味着,一个粒子或系统的量子态既可以展开成位置本征态的叠加,也可以展开成其他力学量的本征态的叠加。从线性代数的角度来说,不同的力学量的本征态就构成了不同的基底。
如果觉得上面这句话难以理解,不妨来考虑一个二维平面上的向量。从线性代数中可以知道,同一个向量可以在不同基底下进行分解,从而得到不同的分量(投影),也就是线性组合的系数,如图1.14所示。

图1.14 同一个向量在不同基底上的投影
量子态也是这样,同一个量子态在不同力学量的本征态上展开,往往会得到不同的系数,或者不同形式的波函数,量子力学中称其为表象(representation)。例如,当量子态展开成位置本征态的线性叠加时,得到的投影系数,也就是通常意义上的波函数,就称为它的位置表象(也称为坐标表象);而展开成其他力学量的本征态,例如动量本征态的线性叠加时,就会得到另外一组投影系数,它们构成了动量的函数,称为这个量子态的动量表象。
不难想到的是,不同的投影系数通常会对应不同的概率分布,这将带来一个量子力学中非常重要且有趣的结论:不确定性原理。1.3节将讨论这个话题。
本节以粒子的位置为例,讨论了量子态和经典力学中确定的力学量值如何通过测量产生联系,并且介绍了如何计算不同测量结果出现的概率。
本节的最后还提到,同一个量子态,除了可以在位置本征态上进行分解,展开成不同位置本征态的线性叠加之外,还可以在诸如动量、能量等其他力学量的本征态上进行分解,就像线性代数中同一个向量可以分解为不同正交基底的线性组合一样。这将有助于我们理解量子力学中的一个重要结论,即1.3节将要讨论的不确定性原理。
开讲前问个问题,你之前听说过不确定性原理吗?
我听说过,也叫“测不准原理”,对吧?比如你去测量一个粒子的位置,就把它的动量干扰了,所以如果它的位置测准了,动量就测不准。
嗯,说得大差不差,不过你知道这个“干扰”怎么理解吗?
是不是测量位置的时候对粒子进行了碰撞,把它的动量随机地“撞偏”了?
哈哈,你这果然还是典型的“经典力学思维”啊……
难道还有“量子力学思维”?
没错。其实这种干扰不是对动量值的干扰,而是对量子态的干扰。测量位置后,粒子的状态就坍缩成了某个位置本征态,而这个位置本征态是动量本征态的线性叠加,从概率的角度来讲,动量的概率就分布在多个动量本征态上……
停一停,这一大段话我都快听迷糊了,能不能再讲得直观点?
嗯,我说得的确急了一点……不过本节要做的事情,就是把我刚才说的那段话直观展示出来。
如果你能在身边找到一支激光笔和一把游标卡尺,那么你将有条件做光的单缝衍射实验。你可以将激光笔和游标卡尺分别固定,在游标卡尺的两个测量爪之间留一条狭缝(最好在零点几毫米的量级),让激光笔的光束通过狭缝,如图1.15所示,这样就可以观测到明显的单缝衍射了。

图1.15 单缝衍射实验示意
而如果变动衍射的狭缝宽度,同时观察中央明纹的宽度(见图1.16)的变化,你会发现,狭缝越窄,中央明纹的宽度就越大。如果记录下中央明纹的宽度以及游标卡尺的读数,还能进一步发现,两者之间近似满足反比例关系。

图1.16 中央明纹的宽度示意
如果将光看成波,那么这个结果似乎是理所当然的。但如果考虑到光同时也具有粒子属性,那么我们将可以从另一个角度来理解这个结果。
首先,约定光束方向为
方向,狭缝方向为
方向,垂直于光束和狭缝的方向为
方向,如图1.17所示。

图1.17 通过狭缝的光子的动量
那么狭缝越窄,就意味着通过狭缝的光子在
方向上的位置越精确,而中央明纹的宽度,可以笼统地等同于光子动量的
分量
的分布范围,因为
越分散(不确定度越大),光子沿着
方向到达更远距离的概率就越高,打在接收屏上的
方向上的狭缝宽度也就越大。
于是,从这个实验中就可以看到不确定性原理的其中一种体现:位置与动量的不确定性关系。它们的精度呈现出此消彼长的特点:位置越精确,动量就越分散;反之,动量越精确,位置就越分散。
那么,两个不同力学量的不确定性关系应该如何理解呢?
直觉上,我们知道,一定是其中一个力学量的测量行为干扰了另一个力学量的概率分布状态,例如在单缝衍射实验中,狭缝对应对位置的测量,测量结果越精确(狭缝越窄),就造成动量分布越广(狭缝越宽)。
但是,这种干扰并不是经典力学意义上的干扰:如果没学过量子力学,大家可能会认为是狭缝随机扰乱了每个光子的动量。但这种观点仍然认为通过狭缝的光子具有确定的动量,只是动量值被随机改变了而已,它并不能解释两者之间定量的不确定性关系。而正确的解释其实比这更简单,只需要借助一些几何图像就能理解。
本着从易到难的原则,不妨先虚构一个简单的例子来说明。
假设有两个不同的力学量
和
,它们分别只有两个可能的取值,记为
和
,一位名叫张三的观测者在对它们进行交替测量时发现了一些离奇的事情。
假设张三先对
进行了测量,他会得到一个确定的
值,不妨假设为
。此后在没有其他干扰的情况下,假如张三重复测量
,他会以100%的概率一直得到
,不会出现
。
如果此后张三再测量
,结果会变得随机,他会分别以50%的概率得到
或
。这倒没什么奇怪的,张三会觉得测量前
本来就是随机的。
但如果张三测量完
之后,又重新测量
,就会发现一件离奇的事情:之前对
的测量结果被“抹去”了。无论上一次测量
的结果是
还是
,只要中间经历过对
的测量,那么再次测量
时,结果将变得随机,得到
和
的概率均为50%。
张三又进行了一些其他尝试,总结出一组神秘的联系:如果力学量
具有确定值,那么此时测量力学量
,结果会变得随机,得到
和
的概率均为50%;反过来,如果力学量
具有确定值,那么此时测量力学量
,结果也会变得随机,得到
和
的概率也均为50%。
张三将其称作“
和
的不确定性关系”。
在学习量子力学之前,张三对这种不确定性关系的解释是这样的:当他对
进行测量时,测量行为可能会对
的值造成干扰,使之随机改变或不变,但无论
的值是否发生改变,对
的测量结束后,
的值也随之确定了,只是自己暂时不知道而已。反过来,测量
也会随机改变
的值。但无论如何,张三认为这种随机是“假随机”:结果已经确定了,只是观测者暂时不知道而已。
但张三发现,无论他以什么方式测量,也无论他如何尝试减少测量动作对测量对象的干扰,结果的随机性以及相应的概率分布都不会改变。这种随机性似乎是根深蒂固的:只要对
进行了测量,那么再次测量
的结果就会变得随机。无论怎样测量,两个结果出现的概率都是50%。
后来学了量子力学,张三终于意识到,这种随机性可能与
和
的本征态的几何关系有关。
当对系统测量
后,系统状态处于
的某个本征态(不妨假设是
对应的本征态
),此时继续测量
,测量结果既有可能是
,也有可能是
,这就意味着,
与
、
均既不“重合”也不“垂直”,在两者上的投影的模平方均介于0和1之间。
考虑到
和
的本征态都是某个态空间中的向量,张三尝试着画出这种几何关系。
由于
和
的取值都只有两个,因此相应的本征态也分别只有两个,两个基底张成一个二维平面,这种既不“重合”也不“垂直”的几何关系就可以在一个平面上画出来,如图1.18所示。

图1.18 两组本征态之间的几何关系
而如果进一步考虑定量关系:当
处于本征态
或
时,测量
得到两个结果的概率均为50%,则意味着
、
在
、
组成的基底上的投影的模相等;反过来,
、
在
、
组成的基底下的投影的模也相等。假设这些投影系数都是实数,那么张三就能给出两组本征态之间的一种可能的定量关系,如图1.19所示。

图1.19 两组本征态之间的投影
可以看到,在这组几何关系中,
、
在基底
上的投影都是
,相应的模平方就是
,正好符合测量得到
和
的概率均为50%的结果;反过来,也能解释力学量B具有确定值时,测量力学量A得到
和
的概率均为50%的结果。更直观地看,这也就意味着两组本征态所在直线的“夹角”正好就是45°。
这样,张三就通过量子态的几何图景,正确认识了这组离奇的不确定性关系。

上面的例子虽然没有明确给出具体的力学量,但它在物理世界中其实有着真实的对应。这个对应称为自旋,1.4节将对它做初步介绍。后面还会不断利用自旋的几何图景来理解量子比特和各类量子门的变换性质。
现在可以借助类似的几何图景,回头讨论位置和动量的不确定性关系。
从前面的虚构实验中可以看到,当力学量
具有确定值时,力学量
就处于两个本征态
、
的均匀叠加态,此时测量
,得到两种结果
、
的概率是相等的。
根据前面的几何解释,这是因为
的本征态正好均匀地投影在了
的本征态构成的基底中。
而在即将讨论的位置和动量之间,也有类似的投影关系。当一个粒子具有确定的位置,也就是处于任意一个位置本征态
时,将这个位置本征态展开成各个动量本征态的线性叠加,就能得到“均匀”的投影。这些投影可以表示成与动量有关的函数
,它其实是一个与
有关的复函数。
我们不用在这里给出函数
的具体形式,只需要知道,虽然
与动量有关,但不同动量值带来的差异只是复数辐角的差异,而不是复数模的差异。这样一来,不同动量本征值
对应的概率
,就是一个与动量无关的常数。也就是说,当粒子具有确定的位置时,它的动量将均匀分散在整个实数域上,此时测量它的动量,测得任何一个动量值的概率都是一样的。反过来也一样,当粒子具有确定的动量时,测量它的位置,也能等概率地随机测得任意位置。图1.20展示了两种情况下位置和动量概率分布的关系。


图1.20 处于位置本征态和动量本征态的粒子的位置与动量的概率分布关系

图1.20中再次出现了δ函数,虽然这里没有给出它的严格定义,但在本节讨论的情形中,不妨将其简单理解为概率分布集中于空间中某个点的函数。例如,位置本征态的位置概率分布函数
就意味着概率
在
处为1,在其他位置为0。动量本征态中的动量概率分布函数
同理。有兴趣的读者可自行搜索δ函数的严格定义,这在大多数量子力学、工程数学或数学物理方法的教材中都能找到。
当然,一个粒子也可能既不具有确定的位置,也不具有确定的动量,也就是说此时粒子的量子态同时是位置本征态和动量本征态的线性叠加。两者的不确定度可以用概率分布的标准差
、
来描述。
当其中一个力学量的标准差减小时(系统状态越接近该力学量的本征态),另一个力学量的标准差必然增大(系统状态在该力学量的本征态上的投影越分散),因此两者的乘积
总是大于0的。不过,当两者各自服从某组参数下的正态分布时(见图1.21),这个乘积将取到一个下限值
,即
(1.13)
其中,
称作约化普朗克常数,它等于普朗克常数
乘以
,写法上就是
上加一个横线,读作h-bar。

图1.21
最小时的位置和动量概率分布

在量子力学中,由于普朗克常数
常常和
一起出现,所以通常用约化普朗克常数
来代替原本的普朗克常数。两者只相差一个常系数
,因此并不会影响理解。本书范围内也将主要使用约化普朗克常数。
这就是量子力学中著名的海森堡不确定性关系,它可以通过位置本征态和动量本征态之间的基底变换关系(这个变换其实就是傅里叶变换),结合一些著名不等式得到。很多量子力学教材会给出证明过程,有兴趣的读者可以自行查阅相关图书。
本节从光的单缝衍射实验出发,定性认识了粒子的位置和动量的不确定性关系,然后通过一个虚构实验,从不同力学量本征态之间的几何角度理解了这种不确定性的来源,并且将其推广回位置和动量的不确定性关系上。
不过,迄今为止,我们讨论的量子态都是以波函数的形式呈现的。1.4节将讨论另外一种形式的量子态,它是从量子力学过渡到量子计算的重要桥梁。
从本节开始,我们就可以为量子计算做一些准备了。
太好了,我们从哪里开始?
回答这个问题之前,我得问你一个问题。你知道传统意义上的计算机,或者说经典计算机是怎么工作的吗?一句话概括就行。
简单概括的话,就是以二进制数为基础,通过逻辑运算来实现各种计算功能,这么理解没错吧?
没错。其实量子计算机也类似,也需要处理二进制的量子比特。而为了实现实际的运算,人们就需要一些物理载体来存储这些二进制量子比特的信息。
那量子计算的“物理载体”是什么样的呢?
这些物理载体其实有多种可选方案,比如某些二能级系统的两个能级、光的两个偏振方向、某些粒子的两个相反的自旋方向等。不过,这些载体里面,几何上最直观的就是粒子的自旋。本节就以电子为例,来对自旋做简单介绍。
简单地说,自旋(spin)有点类似于粒子“自转”,但它实际上并非一种真正的运动,而是一种“与生俱来”的固有属性(也称为内禀属性)。这有点类似于粒子的电荷等性质,具有固定的值,同时又能与外部环境相互作用产生能量和作用力。例如,电子的自旋会像旋转的带电小球一样,产生等效的环形电流,并且能与磁场产生相互作用,从而产生可观测的物理效应(一些磁性材料体现出来的整体磁性其实就是大量电子自旋磁矩累加的结果)。

这里之所以说“类似于自转”,而不是直接等同于经典意义上的自转,是因为电子等基本粒子没有内部结构,因此不存在宏观物体那样“物体内部不同部位绕着某个中心轴旋转”的概念。
作为对比,我们先来考虑经典力学中的自转。
假如要考察一个经典、宏观的小球的自转,那么人们会关注旋转的快慢和方向,这可以用角动量来描述:同一个小球(形状和质量分布都不变),旋转得越快,则角动量绝对值越大,反之角动量绝对值越小。此外,角动量是一个矢量,小球绕着某个轴(例如
轴)旋转时,角动量的方向就是转轴所在的方向,当小球逆时针旋转时,角动量为正,反之为负,如图1.22所示。

图1.22 角动量的正负
对于经典、宏观的小球的自转而言,角动量的大小和方向都可以是任意的,并且在不同方向上测量角动量会得到不同的分量。假设有观测者要对一个经典、宏观的小球测量某个方向(记为
方向)的自转角动量,并且假设测量前小球的自转角动量方向与
轴夹角为
,那么测量结果将是角动量在
轴上的投影,即
,并且测量后小球自转角动量大小和方向不变(假设测量所造成的干扰足够小),如图1.23所示。

图1.23 经典力学中测量
方向自转角动量的结果
但是,如果观测者测量一个微观粒子(例如电子)的自旋角动量,将得到一些反常的结果。
首先,观测者测量到的角动量与测量前的自旋方向无关,总是固定的大小,为
(别忘了
是约化普朗克常数)。

这种性质类似于电子的电荷、质量,总是有固定值,也就是前面所说的内禀属性。
其次,无论测量前电子的自旋方向如何,测量后电子的自旋方向将总是和测量的方向重合,假设测量的方向为
方向,那么测量后的角动量方向要么沿着
方向,要么沿着
方向,如图1.24所示。

图1.24 测量自旋角动量的可能结果
对比图1.23和图1.24,大家能感受到自旋和经典自转在测量性质上的差异吗?

对于量子计算而言,自旋的测量性质是一个非常好的性质,因为这两种大小固定、方向相反的测量结果正好可以分别用来表示量子比特的0和1。2.2节会介绍两者的联系。
如果你还没意识到这个性质的离奇之处以及它的“量子”特质,那么请接着往下思考。
前面提到,无论测量前电子处于什么状态,对电子自旋进行测量的结果只会与测量方向重合,但另一方面,测量方向可以是任意的,这就会带来一个新的问题:如果观测者先沿某个方向,假设为
方向,测量了一个电子的自旋角动量,得到了一个测量结果,假设为
(角动量为
);现在观测者换了一个方向,假设为
方向,重新测量电子的自旋角动量,如图1.25所示,会得到什么结果?

图1.25 对自旋方向为
方向的电子测量
方向的自旋角动量
如果被测对象是一个经典、宏观的小球,那么由于第二次测量前自转角动量位于
方向,此时测量
方向的自转角动量,会得到
方向的自转角动量在
方向上的分量,而由于
轴与
轴正交,因此这个分量为0,于是观测者会得到测量结果0。
但是对于电子自旋而言,情况就不一样了:因为根据自旋的性质,在
方向进行测量,观测者也会测得一个大小为
、方向与
方向重合的自旋角动量。那么问题来了:测量前电子的自旋方向是
方向,不偏不倚正好垂直于
轴,那么沿
方向测量后,自旋方向是
方向还是
方向呢?
大家是否还记得1.3节中讲解不确定性原理时提到的虚构实验:测量力学量
的状态,并得到一个确定结果后,再测量力学量
,会随机得到
和
中的某个结果,概率均为50%。
方向的自旋其实也一样,当测量前电子的自旋方向为
方向(或
方向)时,再测量
方向的自旋角动量,会随机得到
和
两个结果,概率均为50%,如图1.26所示。

图1.26 测量
方向的自旋角动量的可能结果
看到这里,是不是能嗅到一点“量子”的味道了?实际上,1.3.2节的虚构实验正是来自
方向自旋和
方向自旋之间的关系。这也为接下来给出各个自旋方向对应的量子态提供了参考思路。
先来看
方向的自旋。前面提到,
方向自旋有两个可能的测量结果,即
(角动量为
)和
(角动量为
),这两个测量结果就对应
方向的两个自旋本征态,分别记为
和
,它们是相互正交的,如图1.27所示。

图1.27
方向自旋与相应的自旋态的对应关系

图1.27中出现了两个空间,左边的是我们熟悉的三维欧氏空间(也就是经典物理中的运动所发生的那个空间),在这个空间中可以观测到自旋角动量的大小和方向;而右边的是自旋对应的量子态的态空间,这个空间描述的是不同自旋方向对应的量子态。
在后面的学习中,请注意区分它们,并注意两者之间微妙的几何关系(稍后会提到),后文也会随时用直观图像展示这种关系。
同理,
方向自旋的两个可能测量结果,在态空间中也对应
方向的两个自旋本征态,分别记为
和
,它们在态空间中也是相互正交的。
现在我们更关心的是,
和
之间的几何关系是怎样的?实际上,我们可以直接将1.3.2节的虚构实验中两个力学量的关系照搬过来:在态空间中,任意一个
方向自旋本征态在
方向自旋本征态上的投影的模都是
,如图1.28所示。

图1.28
方向自旋本征态和
方向自旋本征态的几何关系

也许有读者从图1.27和图1.28中注意到了一件很有意思的事情:三维欧氏空间中两个相反(也就是夹角为180°)的自旋方向(例如
和
),在态空间中却对应着两个相互垂直(夹角为90°)的自旋态(例如
和
);而三维欧氏空间中两个相互垂直(夹角为90°)的自旋方向(例如
和
),在态空间中却对应着两个夹角为45°的自旋态(例如
和
)。
也就是说,物理上可观测的三维欧氏空间中的某些自旋方向的夹角和态空间中相应自旋态的“夹角”,正好是两倍的关系。这个关系需要一些群论知识来解释,但本书限于篇幅不展开介绍,仅将其作为一个有意思的结论。在后文将要介绍的任意方向的自旋态的构造过程中,以及后面对一些量子门的几何直观表示中,这个几何关系都将起到很好的提示作用。
现在来写出这些自旋态的数学形式。
如果以
方向的两个自旋本征态
为基底(量子计算中的绝大部分场合都是这样约定的),那么
方向的两个自旋本征态
就分别是它们自身,即
(1.14)
而
方向的两个自旋本征态
就可以表示为
的线性组合:
(1.15)
至此,两个特殊方向:
方向和
方向的自旋态就写出来了。接下来,我们给出任意方向的自旋态(其中包括现在尚未提及的另一个坐标方向,即
方向的自旋态)。
先来看看三维欧氏空间中如何定量描述自旋方向。由于电子自旋角动量的大小是常数,因此可以将其作为“半径”,让不同方向的自旋角动量在三维欧氏空间中形成一个球面,这个球面称为布洛赫球面(Bloch sphere)或者简称布洛赫球。
在这个球面上,我们可以像表示地球表面一样,用球坐标中的纬度
和经度
来表示自旋方向,如图1.29所示(图中红色箭头方向即自旋方向)。

图1.29 自旋方向的球坐标表示

从图1.29中可以看出,在球坐标中,经纬度的定义和地球的经纬度定义略有不同。纬度
将从
方向(北极)开始计算,而经度
将从
方向开始,按逆时针方向计算。
当一个电子自旋方向为
时,相应的经典图像就是一个绕着
轴做“逆时针自转”的小球,并且具有大小为
的角动量,如图1.30所示。

图1.30 方向
的自旋
不过,现在讨论的只是三维欧氏空间中的情形,在态空间中,自旋方向
对应的自旋态应该如何描述呢?
从前面对
方向自旋态的介绍中可以看到,作为一个特殊方向,
方向的两个自旋本征态可以表示为
方向自旋本征态
的线性组合。如果将这个结论进一步推广,是不是可以认为自旋态所在的空间其实就是一个二维平面,任意方向
的自旋态都可以表示为
的线性组合?
事实的确是这样的,只不过这个二维平面和我们熟悉的欧氏平面有些不同。为了看到这一点,不妨先从一些特殊情形开始考虑。
先来考虑自旋方向位于
平面上的情形,这个情形的简单之处在于,
平面上所有的自旋方向经度都是0,因此只需要考虑纬度的影响。假设电子的自旋方向的纬度为
,即自旋方向为
,如图1.31所示。

图1.31
平面上的自旋方向
现在来猜测它在态空间中对应的自旋态如何表示为
的线性组合的形式。
首先,可以肯定的是,这个自旋态一定与纬度有关。这是一个很好的提示,如果回顾前面给出的特殊方向,例如
的自旋方向和自旋态,可以发现它的自旋方向的纬度为
,而如果将相应的自旋态
中各系数写成与纬度有关的函数形式,就是:
(1.16)
这正好呼应前面提到的一个比例关系:在态空间中,自旋态与
的“夹角”是相应的自旋方向在布洛赫球上与
方向的夹角(纬度)的一半。有了这个关系,就可以类比着写出
平面上纬度为
的自旋方向所对应的自旋态:
(1.17)
为了形成直观印象,可以将自旋方向和自旋态的对应关系放在同一个图里展示,如图1.32所示。

图1.32
平面上的自旋方向及其自旋态
现在来考虑更一般的情形:经度不为0的情形。
根据前面的猜测,所有的自旋方向对应的自旋态都落在一个平面上,且都可以表示为
的线性组合。但如果仔细思考就会发现:如果将纬度信息也考虑进来,那么这个自旋态就需要将三维欧氏空间中的信息“压缩”到二维平面上,这不会导致信息的损失吗?
为了解决这个矛盾,需要在
的系数中引入新的自由度来表示经度
,这可以通过将实数变成复数来实现。具体来说,对于方向为
的自旋,其自旋态
(1.18)
看见
在哪里了吗?它出现在基底
的系数中,以复指数
的形式出现。

考虑到有读者可能对复指数不熟悉,这里稍微解释一下。
复指数来源于著名的欧拉公式,即一个单位复数(模为1的复数)可以写成复指数的形式:
(1.19)
它在复数乘法的计算上非常方便。
对这个公式的来源感兴趣的读者,可以尝试将等式两边都展开成泰勒级数来证明。
也就是说,复数的使用为自旋态引入了新的自由度,它使得自旋态所在的空间变成了复系数二维空间,而这正好可以补充布洛赫球上的经度信息。
这里仍然用一张图来直观地展示三维欧氏空间中的自旋方向和态空间中的自旋态的对应关系,如图1.33所示。

图1.33 任意自旋方向与自旋态的关系

请注意区分自旋态所在的复系数二维空间和表示复数的复平面的区别。复系数二维空间中的向量是由两个复数分量构成的,而复平面中的元素对应的是一个(而不是两个)复数,它的两个分量(实部和虚部)都是实数,而不是复数。用集合论的语言来说,后者对应一个复数集
,而前者对应两个复数集的笛卡儿积
。
如果考虑
的特殊情形,还能得到
方向的自旋态(有兴趣的读者可自行写出
方向的自旋态
):
(1.20)
至此,任意方向的自旋态就被给出来了,而它也对应单个量子比特的任意状态。在后面我们将看到,量子计算机对单个量子比特的处理,其实从几何上来说,都是在改变布洛赫球上的纬度
和经度
。
此外,根据自旋态中的各系数可以算出,对于一个处于任意自旋态
的电子,如果测量
方向的自旋角动量,得到
和
的概率分别为
(1.21)
细心的读者也许发现了,在测量结果的概率分布中,经度
的信息似乎消失了,这是不是意味着
是一个无关紧要的参数呢?答案显然为“不是”,因为如果观测者测量其他方向的自旋角动量,
的信息就会体现出来。
例如对于两个特殊的自旋态
和
,它们在布洛赫球上的经度分别为
和
,如果在这两个自旋态上测量
方向的自旋角动量,两种状态的概率分布是一样的,但是如果测量
方向的自旋角动量,这种差别就会体现出来:对于处于自旋态
的电子,测量得到
的概率为1,而得到
的概率为0;对于处于自旋态
的电子,结果则正好相反。
所以,经度
在某些测量方向上总能被体现出来,而这个角度在量子比特中也称为相位(phase)。
后面会看到,一些重要量子算法的核心步骤正是对相位
的处理,其中包括用于破解密码的著名量子算法:肖尔算法。也就是说,相位
的引入不仅在物理上是必要的,而且在量子计算中有着至关重要的作用。
[2] 在本书中,标题序号上方带“*”表示该节为选读章节。
结束本节内容之前,我们来讨论一个和量子计算关系不大,但是可能有读者会关注的问题:前面介绍了作为量子态的一种呈现形式的波函数及其性质,并且将它看作一个“无穷维的向量”。而本节介绍的另一种量子态的形式,即自旋态所在的态空间是二维的,两者看起来似乎不在同一个态空间中。那么描述一个粒子的完整状态,是否需要将两者结合起来?
事实的确如此。假设一个电子的波函数为
,同时它的自旋态为
(1.22)
那么在非相对论情形下,它的完整状态就可以描述为
(1.23)
不过,在量子计算中,如果以自旋为量子比特的载体,那么波函数往往可以忽略,只需要关注粒子的自旋态,因此后文中仍然会以
这样的形式来描述一个粒子的状态,而不会将波函数写出来。
本节以电子为例,介绍了作为量子计算机中量子比特重要载体之一的自旋,其中包括三维欧氏空间中的自旋方向与态空间中的自旋态的几何关系及其数学表示方式,并且讨论了各个方向自旋的测量性质。
如果你对这个概念以及一些相应的公式感到一时难以理解,那么记住最关键的一条信息就够了:三维欧氏空间中任意方向
的自旋,在态空间中会对应一个自旋态
,而任意
都可以表示成
两个特殊方向的自旋态
的线性叠加,叠加系数中将包含自旋方向
的信息(请参考图1.33中的对应关系),这将有助于我们在后面理解量子比特状态及其变换过程的几何意义。
1.4节聊了量子比特的载体,那么量子计算机总得用这些量子比特进行运算吧,这个又是怎么实现的呢?
简单来说,就是让各个量子比特的量子态“动”起来。
哦?怎么个动法?
比如说自旋吧,量子计算机里,如果用自旋来承载量子比特的信息,那么运算过程中对量子比特的操作,其实就是让自旋方向发生改变,自旋态就“动”起来了。
嗯……听起来有点意思,那么这在物理上怎么实现呢?
我先问你一个问题,根据你对量子力学的了解,你感觉量子力学基础学到现在是不是还缺了一条很重要的内容?
让我想想……你是指薛定谔方程?
没错,量子态的变化就是靠薛定谔方程“推动”的,本节就来介绍它。
量子计算中需要通过一些物理手段来对量子比特的状态进行某些线性变换,并且通过这些线性变换的组合来实现各种量子算法。
那么,这些变换是如何发生的呢?
如果将量子态
随时间的变化记作
,那么它将满足下面的关系:
(1.24)
等号右边的
就是让量子态变化的某个“推动力”。
对于初学者而言,
看起来似乎很陌生。其实它并不是什么新的物理量,它表示的是粒子或系统的能量,在量子力学中也称为哈密顿量(Hamiltonian)。
而如果将
最常见的一种形式写出来,并且代入式(1.24),那么还能得到一个很多读者都认识的方程:
(1.25)
没错,这就是作为量子力学里的核心方程之一的薛定谔方程,而式(1.24)其实就是它的一般形式,等号右边括号里那两项对应的就是哈密顿量,也就是能量
。
当然,有读者会好奇,为什么能量要写成
这样的奇怪形式,而且里面居然还出现了偏微分符号?
实际上,在量子力学中,能量以及其他力学量往往不再是以具体的数量的形式出现,而是以算符(operator,也译作算子)的形式出现。这其实从前面的讨论中也能看出一些端倪:一个量子态的时间演化也是一种变换,而变换往往是和一个算符(算子)联系起来的。
在量子力学中,能量算符也常常被称作哈密顿算符(Hamiltonian operator),不同的系统具有不同的能量构成,因此哈密顿算符也会有所不同。式(1.25)中的项就是哈密顿算符的一种最常见形式,1.5.3节中将对它的物理意义做简单介绍。
基于上面的讨论,我们可以用一句话概括薛定谔方程的物理意义:系统的能量“推动”系统状态的演化。

这是量子力学和经典力学的另一个重要区别。经典力学中改变系统状态的是力,而量子力学中改变系统状态的是能量。不过,微观的量子世界和宏观的经典世界并不是割裂的,如果考虑大量粒子运动行为的宏观统计性质,薛定谔方程其实可以过渡到牛顿第二定律。证明过程在很多量子力学教材中都会介绍,有兴趣的读者可以查阅相关图书。
现在不妨来看一个在量子计算中常见的例子:能量如何推动系统自旋态的变化。
在量子计算中,对量子比特实施的变换大致分为两类:一类是通过环境与单个粒子的相互作用,实现对单个量子比特状态的操作与变换;另一类是通过多个粒子之间的耦合(相互作用能量),来实现多个量子比特之间的“联动”。本节先讨论第一类情形。
如果量子比特是用粒子的自旋来承载的,那么对量子比特的变换将对应对粒子自旋方向的改变。实际上,量子计算中对单个量子比特的一切变换都可以等效为一种旋转变换:让粒子的自旋方向绕着空间中某个轴
旋转某角度
,如图1.34所示。

图1.34 自旋方向的旋转变换
那么,物理上如何让自旋方向发生这样的旋转呢?
一种典型的方案就是在该方向上加上一个磁场。前面介绍自旋时提到,如果有外加磁场,那么一个粒子的自旋会与磁场相互作用产生能量。而根据薛定谔方程,这个能量将推动自旋态随时间演化。具体地说,就是自旋方向会绕着外界磁场的磁感应强度方向旋转,如图1.35所示。而态空间中相应的自旋态自然也会发生变化(4.5节将给出这个能量以及自旋态时间演化的具体数学形式,并且给出简单的推导过程)。

图1.35 自旋方向在与磁场的相互作用势能推动下发生旋转
如果将粒子的自旋想象成小球的自转,那么这样的旋转其实就相当于一个陀螺一边自转,一边绕着某个轴“公转”,如图1.36所示。这种运动在物理学中称为进动。而粒子自旋方向在磁场中的进动称为拉莫尔进动(Larmor precession)。

图1.36 陀螺的进动
理论上,利用拉莫尔进动,就可以通过外加磁场来实现粒子自旋方向的任意旋转,从而实现自旋态的演化。不过,在实际应用中,量子计算的物理实现方案会稍微复杂一些,4.5节将对此做简单介绍。
此外,在4.5节中我们还会看到,自旋态演化对应的薛定谔方程和式(1.25)给出的常见形式的薛定谔方程有所不同。具体来说,就是自旋并不包含坐标信息,因此自旋态的薛定谔方程中没有对坐标求二阶导的项。接下来将要讨论包含坐标信息的薛定谔方程的常见形式,并且对它的物理意义与解的结构做简单介绍。
前面提到,在式(1.25)给出的常见形式的薛定谔方程中,表示能量的哈密顿算符为
(1.26)
现在先来进一步介绍它的物理意义。
在经典力学中,一个运动物体的能量是由动能和势能构成的,可以写为
(1.27)
其中,
为物体的质量,
为物体的动量,
为物体与环境相互作用的势能。
而式(1.26)给出的哈密顿算符中,
和
就分别对应式(1.27)等号右边的动能项
和势能项
。将两者联系起来的关键就是前面提到的算符。
前面提到,量子态的具体分量形式和基底的选取有关,不同力学量的基底选择,会得到同一量子态的不同表象[3]。而力学量的算符也是如此,同一个力学量算符在不同表象下会呈现不同形式。这其实类似于线性代数中的相似矩阵,它们代表的也是同一个线性变换在不同基底下呈现出的矩阵形式。
[3] 见1.2.5节。
如果选取坐标表象,那么式(1.27)中的动量
的算符就会以
的形式呈现,而势能
的算符则直接表现为势能随位置变化的函数
,将其分别代入式(1.27),就能得到式(1.26)给出的哈密顿算符的形式。

限于篇幅,这里不讨论为什么动量算符在坐标表象下以
的形式呈现,有兴趣的读者可以在大多数量子力学教材中找到构造过程和相应的解释。
至此,常见形式的薛定谔方程的物理意义也明确了:动能和势能构成的总能量“推动”量子态演化。
现在来讨论薛定谔方程的解的结构。
在解的结构上,线性微分方程和线性代数方程组有些相似,它们的通解都可以表示为基础解系的线性组合。只不过后者以向量线性组合的形式出现,而前者往往以函数项级数和
的形式出现,级数和中的各项
就构成了基础解系。
对于薛定谔方程以及很多线性偏微分方程而言,各个基础解
往往可以分为时间部分和空间部分的乘积,即
(1.28)
这些解也被称作分离变量解(因为时间变量和空间变量分离成了两个独立的部分),其中时间部分
往往是时间的指数函数,而空间部分
的形式则取决于势能
的空间分布。
在量子力学中,人们往往更关注空间部分
的解,因为它们恰好构成了能量的本征态序列。而当哈密顿算符作用在其上时,会满足这样的本征值关系:
(1.29)
其中,
是本征态
对应的能量本征值。

为了更好地理解上面这个抽象的公式,不妨做一个不太严谨的类比:将等号左边的哈密顿算符对应为对能量的“测量”,那么公式的物理意义就可以理解为在能量本征态
上进行能量的测量,将得到确定的能量本征值
,而测量后系统仍然处于原来的能量本征态
。当然,这只是一种帮助理解的权宜之计,并非严格解释。这个公式更严谨的解释其实和测量结果的概率分布有关,有兴趣的读者可以在一些量子力学教材中看到相关论述。
这样的关系也适用于其他力学量,例如前面提到的动量算符在坐标表象下以
的形式呈现,而动量本征态在坐标表象下是一个关于位置的指数函数
,将动量算符作用在动量本征态上,就可以得到
(1.30)
这也是满足本征值关系的。
此外,上面的关系还可以对应到线性代数中矩阵作用在特征向量上的结果:相应的特征值乘以特征向量。其中包括哈密顿算符在内的各个力学量算符就扮演了矩阵的角色。这也是为什么力学量可能的取值被称作本征值(它和特征值是一个概念,对应的英文都是eigenvalue,只是数学上和物理上翻译习惯不同而已)。这是量子力学和线性代数的又一相通之处。
这些能量本征值
和本征态
的求解,无论是对理论研究还是实际应用而言,都是不可或缺的核心问题。例如,在实际应用中,如果能求得能量本征值的分布,就可以成功预测各种分子或材料诸多宏观物理化学性质,这也是量子力学诞生后化学理论的发展和新材料的发现突飞猛进的原因。
如果将哈密顿算符的具体形式代入式(1.29),可以得到一个只包含空间变量的常微分方程:
(1.31)
它被称作定态薛定谔方程。理论上,给出具体的势能分布
,总是能解出能量本征值
和本征态
。
不过,在实际应用中,势能分布
往往比较复杂,特别是对多粒子体系而言,势能中还包含各个粒子之间非线性的相互作用势能项,这种情况下往往无法求得方程的解析解,而需要借助数值计算。但另一方面,数值计算的复杂度又会随着分子规模呈指数级增长,对于经典计算机而言,这是一个很大的难题。不过,随着量子计算机的发展,这些数值计算过程将有望得到有效的加速,6.5节和6.6节将对此做简单介绍。
本节首先介绍了薛定谔方程的一般形式及其物理意义;然后以自旋态的演化为例,展示了“能量推动量子态变化”这一物理意义的具体体现,同时也提到了它与量子计算的联系;最后讨论了薛定谔方程常见形式的物理意义及其解的结构,这部分内容将有助于后面理解量子计算在求解量子化学问题中的应用。
至此,我们就为认识量子计算做好了必要的准备,可以开始畅游量子计算的世界了。