书名:图像处理的分数阶微积分方法
ISBN:978-7-115-64467-1
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
著 张彦山 李玲玲
责任编辑 贾鸿飞
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
分数阶微积分研究的是非整数阶的微分和积分,可实现的阶数灵活且自由度大,所以在图像处理领域的应用得到越来越多的关注。
本书通过特定的分数阶微积分定义与图像处理领域的重要工具——傅里叶变换和分数阶傅里叶变换,建立分数阶微积分与图像处理的关系。全书共7章,分别是绪论、图像处理及分数阶微积分基础、分数阶微积分与信号处理的关系、基于分数变阶微分的图像去噪方法、图像复原的分数阶偏微分方法、图像分割的分数阶微积分方法和图像增强的分数阶微积分方法。
本书论述清晰,适合计算机图像处理领域的研究人员、对分数阶微积分应用感兴趣的读者阅读,也适合作为高等院校相关专业学生的参考书。
分数阶微积分的相关理论起源于 17 世纪末莱布尼茨写给洛必达的信中,距今已经超过 300 年。然而,分数阶微积分理论在各领域的应用,在近些年才逐渐兴起——人们逐渐发现分数阶微积分能够刻画自然科学与工程应用领域的一些非经典现象——在图像处理领域,分数阶微积分就扮演着重要的角色,具有独特的作用和广阔的应用前景。
例如,在图像去噪中,分数阶微分算子能够加强信号中的高频成分,同时非线性地保留低频成分,从而可以有效去除噪声并保留图像的边缘特征和纹理细节信息。此外,在图像增强、重构、分割、复原及特征提取等任务中,使用分数阶微积分改变图像的亮度分布和对比度,可以有效增强图像的清晰度。随着计算能力的进步,分数阶微积分在处理非线性问题时甚至可以突破传统整数阶微积分的限制,将阶次推广至无理数,为复杂图像的处理提供更多可能。
随着现代科技的不断进步,各式各样的图像处理新方法不断地被发掘出来。与此同时,数学理论研究的深入、计算机性能的稳步提升,为图像处理领域带来了更多的可能性。本书以分数阶微积分及其在图像处理中的应用为主题,从数学角度出发,对相关的理论和方法进行归纳总结,旨在推动数学与图像处理领域的交叉与融合。通过特定的分数阶微积分定义与图像处理领域的重要工具——傅里叶变换和分数阶傅里叶变换,建立分数阶微积分与图像变换的关系。书中首次提出分数变阶微分的概念,进而设计基于分数变阶微分的图像去噪模型、图像复原模型和图像分割模型,实现分数阶微积分在图像处理领域的交叉应用。本书的主要特色如下。
(1)跨学科整合。本书将数学理论与图像处理技术相结合,为读者提供了一个跨学科的视角。分数阶微积分作为一个强大的数学工具,通常在纯数学领域中被深入研究,而本书展示了如何将这些复杂的数学概念应用于实际的图像处理问题。这有助于读者理解数学理论如何影响实际应用,以及工程与计算机技术背后的数学原理,从而促进两个领域之间的对话和合作。
(2)强调实用性。书中提出的基于分数变阶微分的图像去噪、复原和分割模型,在实际应用中能够有效地解决图像中的噪声问题和恢复图像的细节信息,这对于许多涉及图像质量改善的领域(如医学成像、遥感探测、数字摄影等)都是极其重要的。
(3)注重创新性。本书首次提出了分数变阶微分的概念,这一新概念的提出,无疑为图像处理领域带来了新的思路和方法。同时,基于这一新概念,本书还设计了新的图像去噪模型、图像复原模型和图像分割模型,这些模型的出现,对于推动图像处理领域的发展具有重要意义。
郑州航空工业管理学院分数阶微积分图像处理课题组的研究生王璐瑶、吴澄俊、段康、高俊铭参与了本书的撰写,做了大量有意义的研究工作。同时,本书的出版获得了郑州航空工业管理学院科研团队支持计划专项(No.23ZHTD01005)、河南省科技攻关项目(No.242102210150、No.232102210151)、河南省重点研发专项(No.231111212000)、河南省高等学校青年骨干教师培养计划项目(2020GGJS172)、河南省高校科技创新人才支持计划项目(22HASTIT020)、河南省杰出外籍科学家工作室(No.GZS2022011)等项目的支持,并得到航空航天电子信息技术河南省协同创新中心、航空航天智能工程河南省特需急需特色骨干学科群、河南省通用航空技术重点实验室的资助。
由于作者学识水平有限,书中难免存在疏漏与不妥之处,敬请广大读者批评指正。编辑电子邮箱为jiahongfei@ptpress.com.cn。
编者
2024年10月
采集数字图像时,采集的图像往往受噪声和失真的影响而存在信息丢失或扭曲的情况,从而影响对场景判断的准确性,我们因此引入了分数阶微积分。作为整数阶微积分的一种推广,分数阶微积分在信号的奇异性检测和提取方面具有特殊的优势。分数阶微分能够非线性地保留信号的低频成分,同时提高信号的高频成分;分数阶积分则具有非线性地保留信号高频成分并提高信号低频成分的特点。由于分数阶微积分的阶次灵活且自由度大,现代信号分析与处理领域的研究人员开始关注并深入研究其应用。
图像的本质是二维信号,对其进行分析和处理具有重要的作用和意义。傅里叶变换(Fourier transform,FT)是经典信号分析和处理理论体系的基础和核心,其本质是将信号分解到一组正交完备的正弦信号基上,从频率域对信号加以分析和处理。自从1965年Cooely-Tukey提出离散傅里叶变换(discrete Fourier transform,DFT)的快速计算方法快速傅里叶变换(fast Fourier transform,FFT)之后,FT在几乎所有的工程领域中取得了应用的巨大成功,这种成功的前提是信号必须在傅里叶域带宽有限。然而自然环境中的信号普遍都是非平稳信号,对于分析和处理一些傅里叶变换域非带宽有限的非平稳信号,应用FT有一定的局限性。这种局限性主要体现在:应用传统的傅里叶分析方法很难反映信号频率随时间变化的特性,无法完整描述信号细节特征,因而需要新理论和新技术对现有信号处理手段进行必要的补充和完善。为此,一些学者提出了一系列的非平稳信号分析和处理工具,如短时傅里叶变换、时频分析、加伯变换、小波变换、分数阶傅里叶变换和分数阶微积分等。
1980年Namias从特征值和特征函数的角度提出了分数阶傅里叶变换的概念,并用于微分方程的求解。其后,McBride等从积分形式的角度给出了分数阶傅里叶变换的定义。1993年Mendlovic和Ozaktas从光学角度提出了分数阶傅里叶变换,并给出了分数阶傅里叶变换的光学实现,将其用于光学领域信息处理。自从1994年Almeida指出分数阶傅里叶变换可以理解为时频平面的旋转后,分数阶傅里叶变换得到越来越多信号处理领域学者的关注。一些分数阶傅里叶变换的基本性质,如卷积和乘积的定理、相关运算等相继被提出。
Zhang等人研究了分数阶傅里叶变换与短时傅里叶变换的关系,建立了二者的旋转关系。Ozaktas通过将二次相位函数表示为小波函数,并将角度的正切函数看作尺度参数,建立了分数阶傅里叶变换与小波分析的关系。Ozaktas还建立了时频平面上分数阶傅里叶域的概念。Almeida引入了分数阶傅里叶变换与Wigner分布的关系,得到了信号分数阶傅里叶变换的Wigner分布等于原信号Wigner分布的旋转,建立了分数阶傅里叶变换的时频平面旋转的物理意义。Wigner分布是二次时频表示中非常有用的一种,满足很多数学性质。然而,由于它的二次特性使得它会引起信号间的交叉干扰,针对此问题,王开志等人提出了利用分数阶傅里叶变换检测和消除交叉项,并尽可能减少自项的失真。
在分数阶傅里叶变换用于信号处理方面,分数阶傅里叶变换因对线性调频信号的处理优势而用于分数阶傅里叶域最优滤波和雷达信号处理中。在信号滤波方面,可以将传统的傅里叶域滤波器推广到分数阶傅里叶域中。Almeida提出扫频滤波器就是分数阶傅里叶域滤波器的时域表现形式,在分数阶傅里叶域对信号滤波可以滤除在频域不容易滤除的信号。Ozaktas 等人给出了最小均方误差下分数阶傅里叶域最优滤波算法,具有很好的普适性。在雷达信号处理方面,陶等人提出了一种基于分数阶傅里叶变换的多分量线性调频信号波达方向估计算法,该算法利用线性调频信号在分数阶傅里叶域的能量聚集性,在分数阶傅里叶域上对多分量线性调频信号进行分离和参数估计。合成孔径雷达(synthetic aperture radar,SAR)综合运用合成孔径技术和脉冲压缩技术,采用较短的天线实现距离向和方位向的高分辨率。由于SAR回波信号在距离和方位两个方向均为线性调频信号,因而理论上可以利用分数阶傅里叶变换对线性调频信号的检测和参数估计性能,用于SAR的成像算法。Amein等人利用分数阶傅里叶变换替代Chirp Scaling算法(CSA)中的FFT,形成新的SAR成像算法。由于分数阶傅里叶变换具有旋转角度参数,所以FrCSA需要引入一个最优变换模块,使得角度参数和线性调频信号的调频率匹配时得到最大的输出响应。由于地面运动目标的回波也近似为线性调频信号,Sun等人研究了利用分数阶傅里叶变换实现机载SAR的运动目标成像。
以二维信号形式呈现的图像携带非常丰富的信息,能够非常直观地反映信息采集时刻的场景。然而,由于图像采集设备种类繁多(有雷达、红外、多光谱等)、采集环境复杂多变,噪声因素使得所采集到的图像的精细特征丢失或产生扭曲,从而产生失真,严重时甚至影响判断与决策。同时,数字图像中邻域内像素点的灰度值具有高度的自相似性,并以复杂的边缘和纹理等细节信息表示。信号处理的传统工具已难以处理这种情况,我们需要寻找新的工具和方法。分数阶微积分作为整数阶微积分的推广,它在信号的奇异性检测和提取方面具有特殊的作用。分数阶微分能够增强信号的高频成分且非线性地保留信号的低频成分,分数阶积分能够增强信号的低频成分且非线性地保留信号的高频成分,分数阶微积分实现的阶次灵活且自由度大,因此开始被现代信号分析与处理的研究人员关注并研究。近年来,分数阶微积分理论在图像底层信息处理中的应用已经取得了一些研究成果,这些图像底层信息主要包括图像压缩、图像复原、图像去噪、图像边缘提取、图像分割和图像奇异性检测等。
蒲亦非等人认为,在增强图像过程中选择阶次适当的分数阶微分算子可以在大幅度提升边缘和纹理细节的同时,非线性地保留图像平滑区域的纹理信息,由此数字图像分数阶微分掩模及其数值运算规则被提出,实验仿真结果表明,针对纹理细节信息丰富的图像,与整数阶微分运算相比,分数阶微分在灰度变化不大的平滑区域提取纹理细节信息的效果更好。杨柱中等人基于分数阶微分算子具有弱导数性质的特点,利用分数阶梯度算子对含弱噪声的图像进行边缘检测,该方法能够有效地避免整数阶梯度算子对噪声敏感的问题,因此可以准确地定位噪声图像的边缘。Mathieu等人提出了分数阶微分的边缘检测算子,说明分数阶微分阶次在时,分数阶微分边缘检测算子能够有选择地检测出边缘,而在分数阶微分阶次在
时,该检测算子能够在边缘提取的过程中克服噪声的影响;在此基础上,李远禄等人提出了基于分数阶差分的滤波器并将其应用于边缘检测,该滤波器可以解决传统算子边缘检测出现边缘漂移的问题,并且可以抑制部分噪声。汪凯宇和刘红毅等人利用分数阶微积分的记忆特性,分别将分数阶样条小波应用到图像纹理的奇异性检查和图像融合中,较使用整数阶微积分取得了更好的仿真效果。Liu等人提出了基于分数阶奇异值分解的人脸识别方法,该方法可以有效处理面部的变化,并且在脸部出现剧烈变化时,比传统的分类方法性能更好,为图像高层处理打下坚实基础。左凯等人将卡尔曼滤波和分数阶微积分理论相结合,提出了二维分数阶卡尔曼滤波器并成功应用于图像处理。汪成亮等人通过研究分数阶微积分的基本定义和相应分数阶微分算子的实现方法,提出了将图像的梯度特征和人类视觉特征等理论引入已有的分数阶微分算子,由此构建了基于分数阶微分阶次自适应变化的图像增强模型。高朝邦等人将四元数理论和分数阶微积分理论有机结合,提出了四元数分数阶方向微分的概念,解释其物理意义和几何意义,并根据分数阶微分的特殊性质将其应用于图像增强,得到很好的效果。Bai等人以ROF去噪模型为基础,将分数阶微积分理论和偏微分方程相结合,提出了基于分数阶偏微分方程的图像去噪模型,该方法可以解决传统低阶次整数阶偏微分方程去噪模型容易产生阶梯效应的问题,以及高阶次整数阶偏微分方程去噪模型去噪效果不佳的问题。此后,张军等人将负指数Sobolev空间的多尺度图像建模与基于分数阶微积分的图像建模有效结合,提出了统一的基于分数阶多尺度变分图像去噪模型,并初步设计了该模型参数的自适应选择方法。
本书中主要探讨分数阶微积分和图像处理领域的联系,通过研究学科的交叉,可以利用不同学科的优势工具来构建新的模型,发掘解决应用问题的新方法。利用分数阶微积分和图像处理中的重要工具傅里叶变换、分数阶傅里叶变换的关系,不仅可以为图像处理提供更多的新方法,而且还可以为分数阶微积分的物理意义的解释提供新的思路。另外本书还提出了分数变阶微分的概念,它突破了传统微积分的思想,使得微积分概念变得更加细腻,并成功应用于图像处理,构建了分数域变阶微分图像去噪和复原模型,在视觉和量化效果上取得了很好的结果。
分数阶微分或积分,不是指一个分数或一个分式函数的微分或积分运算,而是指微分的阶次或积分的阶次不一定必须是整数,可以是任意实数,甚至可以是复数。分数阶微积分的历史几乎和整数阶微积分的历史一样久。1695 年,德国数学家莱布尼茨(Leibniz)和法国数学家洛必达(L'Hôpital)就曾以书信的方式探讨过把整数阶导数扩展到非整数的情况。比如,令f (x) = x,n = 1/2,则
等于多少。对于这个问题,莱布尼茨也是一头雾水,没有给出一个合理的答案。1819年,拉克鲁瓦(Lacroix)首次给出了这一问题的正确解答:
。由于分数阶微积分理论与通常的整数阶微积分理论相左,又没有实际应用背景,在此后的一百多年里一直发展缓慢,直到1973年曼德尔布罗特(Mandelbort)首次指出自然界及许多科学技术领域中存在大量分数维的事实,而且整体与局部存在自相似现象以后,作为分形几何和分数维的动力学基础,分数阶微积分才获得了新的发展而成为当前国际上的一个热点研究课题,并在许多领域得到了应用。1974年,第一届分数阶微积分及其应用国际学术会议在美国纽黑文大学召开,并以数学讲义丛书(Lecture Notes in Mathematics)的形式发表了第一部关于分数阶微积分理论和应用的会议文集。同年,奥尔德姆(Oldham)和斯帕尼尔(Spanier)出版了第一部分数阶微积分专著。此后,该领域的研究蓬勃兴起,许多关于分数阶微积分的图书相继出版。在美国数学分类号2010版(Mathematics Subject Classification 2010,MSC2010)中也增加了分数阶微积分的条目。另外,至少有两种关于分数阶微积分的杂志Journal of Fractional Calculus和Fractional Calculus and Applied Analysis公开发行。
在经典的微积分中,定义求导运算和求积分运算
如下:
(1.1)
它们满足关系式
(1.2)
这说明求导运算是求积分运算
的左逆运算,且这两种运算一般来说不具有交换性。进一步,对任何自然数
有
即求导运算是求积分运算
的左逆运算。对连续函数
,反复应用分部积分法可得
(1.3)
其中是Gamma函数,且
。因此,对非整数的正数
,我们可以定义分数阶积分
(1.4)
进一步,对实数,记
为不超过
的最大整数。取
,利用导数和积分的运算公式
,非整数
阶黎曼-刘维尔(Riemann-Liouville)导数定义为
(1.5)
如果利用,非整数
阶卡普托(Caputo)导数定义为
(1.6)
这里应该说明的是,数学家们从不同的角度出发,给出了分数阶导数的多种定义,这与整数阶导数定义只有一种是截然不同的,其中应用比较广泛的两种就是黎曼-刘维尔导数和卡普托导数。
下面说一下这两类导数的区别。对于非整数阶黎曼-刘维尔导数而言,要先求
次积分(相当于
阶导数),再求
阶导数,可大致理解为先积分再微分,少积分多微分。而对非整数
阶Caputo导数而言,是先求
阶导数,再求
次积分(相当于
阶导数),可理解为先微分再积分,多微分少积分。引入黎曼-刘维尔导数定义,可以简化分数阶导数的计算;引入卡普托导数定义,让其拉普拉斯变换式更简洁,有利于分数阶微分方程的讨论。
接下来介绍这两类导数与整数阶导数的联系和区别。当时,这两类分数阶导数与通常的整数阶导数一致。同样,这两类分数阶导数和整数阶导数一样也有线性性质。另外,对函数
先求
次积分再求
阶导数,它的值仍然是
。但是它们之间有很大的区别。整数阶导数反映的是函数在某个取值点的局部性质,而分数阶导数从定义上看实际上是一种积分,它与函数过去的状态有关,反映的是函数的非局部性质。分数阶导数这种性质使得它非常适合构造具有记忆、遗传等效应的数学模型。我们也可以从卷积的角度来说明分数阶导数与整数阶导数的区别。为简单起见,不妨设
。令核函数
(1.7)
则(1.5)式可等价地改为,“
”为拉普拉斯卷积。显然,对于任意非平凡核,
具有记忆性,是非马尔科夫的,只有当
时,马尔科夫过程才恢复,分数阶导数退化成整数阶导数,这里
(1.8)
从运算方面看,分数阶导数公式都很复杂,对乘积、商与复合运算没有整数阶导数那样简单的求导公式,计算复杂度大大增加。下面举一个简单的例子说明两者之间的差别。我们知道,常数的正整数阶导数为零,但分数阶导数不一定为零。比如,设,对
,有
(1.9)
不过,。
在过去的20年里,分数阶微积分的应用范围逐渐扩大,应用领域涵盖流体力学、流变学、黏弹性力学、分数控制系统与分数控制器、电分析化学、生物系统的电传导、神经的分数模型以及分数回归模型等。但是分数阶微积分在图像处理中的应用还处在初期,如何建立分数阶微积分和图像处理领域的联系,是研究分数阶微积分的重要课题。
从20世纪末开始,计算机科学技术的迅猛发展及计算机的逐渐普及,为数字图像处理与计算机视觉(即通过计算机实现图像分析和处理的科学领域)的崛起奠定了物质基础,进而给相关应用带来了深入的研究和大力的发展,使得数字图像和计算机视觉成为信息技术中最重要的学科分支之一。
图像处理具有多学科交叉的特性,它与相邻学科(如模式识别、自动控制、计算机视觉等)之间不存在明确的分界。图像处理的科学体系如图1.1所示,这种三个层次的表述方式是当前被人们比较普遍接受的,其中低层次处理是对输入的原始图像按照某种特定的方法进行变换,从而得到另一幅图像
。低层次处理技术主要包括图像滤波、图像增强、图像复原、图像修复、图像编码压缩等。而介于低层次处理和中层次处理——图像分析之间的图像处理过程是图像分割,它的输入是原始图像或经过某种预处理的图像。进行图像分割的目的是希望把图像中我们“感兴趣”的对象分离出来。基于边缘的分割、基于区域的分割和基于纹理的分割等是常用的图像分割方法。
图1.1
图像分析的目的是提取图像对象的特征。所谓特征,一般来说,是指利用较少的数据――特征矢量来刻画对象,以便对图像进行鉴别或分类。可见这一层次的处理结果是特征描述。手写文字识别、指纹识别、基于人脸的身份认证等都是图像分析研究的典型应用。
图像理解则是指在图像分析所提供的特征描述的基础上,研究图像中各个对象的属性及相互关系。例如,对于人的面部图像,可将其表情解释为“喜悦”“愤怒”“悲伤”等。再例如,在汽车安全系统中,可利用图像处理技术识别驾驶员的疲劳程度。图像理解的输出是已定义的“语义”字符串,这项研究内容通常被划分为计算机视觉或人工智能的范畴。
由上述可知,图像处理的三个层次中,处于较低层次的处理结果可以直接输出投入应用,也可以作为其上一层处理的输入。不过,在实践过程中,也常需要利用高层次处理的结果来改进和完善中低层次处理。这就是图1.1中向下的箭头所表示的“反馈”过程。
一般地,我们把底层图像处理表述为图像变换。图像变换操作主要采用的是数学工具,我们可以根据数学工具的不同把图像变换分为以下几种情况。
一类最简单却非常有用的图像处理方法是灰度变换,一般表示为
(1.10)
式中被称作灰度变换函数。从(1.10)式我们不难看出,输入图像中任何一点
的灰度值可决定该点输出图像的灰度值,因此归为点操作。我们要求灰度变换函数
必须要严格单调递增,这样经过灰度变换后,输出图像与输入图像在形态上可以保持一致。图1.2所示为常用的几种
函数图像类型。在图像处理中,改善图像的对比度是灰度变换的主要应用点。
图1.2
对两幅图像逐点进行代数运算(加、减、乘、除等),把运算结果当作输出图像在该点的灰度值,这样的操作称为图像的代数运算。在实践中我们应用较多的是加法和减法运算,图像在经过如下加法运算后,加性噪声能明显减少。另外,“二次曝光”的摄影艺术效果也能通过此运算产生。
(1.11)
如果想突出两幅图像之间的差异,我们可以用减法运算
(1.12)
例如,我们把视频中相邻的两帧作为输入图像,经过减法运算后,在输出的差分图像中能很容易地检测出运动物体的边界。
有一种灰度值只有0或1两种类型的特殊图像,我们称其为二值图像或黑白图像。对于这类图像的处理,我们有一套非常重要的方法叫数学形态学方法。塞拉(J. Serra)的著作Image Analysis and Mathematical Morphology是这个领域的经典之作。
在数学形态学方法中,首先将待处理图像中的“白”区定义为集合X,
(1.13)
当然“黑”区也可以是处理对象,这时黑白区互换便可进行相同的操作;其次需要定义一个结构元素,例如,3×3的正方形就是常用的结构元素。这样,我们就可以定义三种基本的形态学算子——膨胀、腐蚀和中值集。
提到强有力的信号分析工具,我们首先想到的是傅里叶变换,它将信号从时域的表达转换到频域的表达,并提供了坚实的数学基础。它的连续形式为
(1.14)
式中称为角频率,j为虚数单位(j2 = -1),在不产生混淆的情况下也可简称为频率。傅里叶变换的逆变换表达式为
(1.15)
傅里叶变换的离散形式为
(1.16)
离散形式的逆变换为
(1.17)
随着离散形式的快速算法的提出,傅里叶变换不仅仅为信号在频域和时域处理的算法设计上提供了理论基础,更重要的是,通过快速算法,傅里叶变换的数值实现可以方便地得到,这大大提高了傅里叶变换在应用方面的可行性。
把傅里叶变换推广到二维层面,便可将其应用于图像处理中,于是有
(1.18)
其中,基函数具有分离变量的性质如下:
因此,二维傅里叶变换的结果可容易地由两个一维傅里叶变换来实现。
二维频域也可用极坐标表示,即引入
(1.19)
这时有
(1.20)
函数图像见图1.3。
图1.3
图像的傅里叶变换为
,也称为
的频谱,由于
一般来说是复数,因而可以用它的模值
和相角
来表示。它们都是
的二维实函数,分别称为图像
的振幅谱和相位谱。有时也用到
,称为功率谱。
在图像处理中,图像平滑、去噪、锐化、复原,以及CT图像重构等都是傅里叶变换的重要应用场所。图像编码中常用的离散余弦变换(DCT),实际上可以看成是傅里叶变换离散形式的一种变异,故也可纳入到傅里叶变换的应用范畴。
傅里叶变换在图像处理中的应用也有不足的地方,那就是缺乏定域性。图1.4、图 1.5 和图 1.6 所示分别为一幅自然图像(人像)及其傅里叶变换的振幅谱和相位谱。
图1.4
图1.5
图1.6
从这三幅图中可以看出,在原点附近(即频域的低频区域),集中分布着图像的大部分“功率”,而这里高频成分的分布相对比较少,原因是在图1.4所示的图像中,大部分区域的灰度值基本不变或变化缓慢(具有这种特征的区域称为平坦区),这里提供了图像大量的低频成分,而提供图像高频成分的部分主要来自于图像的边缘和细节(该部分的灰度值变化通常较为急剧),由于图中边缘和细节只占了整幅图像的很小一部分,所以便出现了图 1.5 中的近似呈现特性的振幅谱,以及图 1.6 中呈现高斯随机场特性的相位谱。正是由于具有这种非定域性,所以对图像局部特征的处理是傅里叶变换的短板。
傅里叶变换所使用的正交基函数具有广延性,这是其具有非定域性的根本原因。为了解决这一问题,我们需要构造一个理想的正交基函数,也就是既具有足够的光滑性,又在时域和空域都具有好的定域性的正交基函数,但构造这样一个理想的正交基函数不是件容易的事,很长一段时间人们都没有构造成功,这种状况直到法国数学家伊夫·梅耶尔(Yves Meyer)在20世纪80年代首次构造出一个具有时频双重定域性的正交基函数,并将其发展成一个新的数学分支——小波分析。我们来看一下一维小波变换(wavelet transform,WT)的定义式
(1.21)
式中称为基小波,
称为尺度因子,
称为平移量。
如果和它的对偶基
的尺度因子
取二进(dyadic)离散化,则有
(1.22)
取连续实数时,我们将
、
称为二进小波,此时它具有完全重构性,而其对应的积分变换和逆变换被称为二进小波变换。若尺度因子按照(1.22)式取离散值,同时平移量按下式
(1.23)
也取离散值,在这种情况下仍然可通过小波基和对偶基
实现分解和完全重构,那么我们称其为双正交小波;进一步若此时对偶基是其自身,即
,那么我们称其为正交小波。在这种情况下,积分小波变换变成离散小波变换(DWT),二进制小波变换和离散小波变换都存在快速算法。目前小波变换在图像的去噪、增强、编码压缩等方面的应用均取得了优异的成果。
系统地把偏微分方程(partial differential equations,PDE)方法应用于图像处理和计算机视觉中是近二十多年形成并发展起来的领域。到目前为止,这个领域已经积累了丰富的研究成果,这主要得益于两方面因素。第一,偏微分方程是基础数学的一个重要分支,它已经形成了成熟的理论体系和数值方法;第二,传统的图像处理技术已经积累了丰富的经验。
图像处理中用偏微分方程处理方法的基本思想:在图像的连续数学模型上,让初始图像遵循某个指定的偏微分方程进行演化,而最终演化所得到的偏微分方程的解,就是我们希望得到的处理结果。因此,基于偏微分方程的图像处理方法首先要建立一个合乎处理要求的偏微分方程,即建立数学模型。常用的建模方法主要有:(1)建立“能量”泛函,通过变分法,得到欧拉-拉格朗日(Euler-Lagrange)方程,该方程便是所需要的偏微分方程;(2)将期望实现的图像变化与某种物理过程进行类比(例如,将图像的平滑处理与杂质的扩散类比),建立对应的偏微分方程。
当数学模型建立之后,寻找求解所得偏微分方程的方法就成为最重要的问题。图像函数固有的不连续性,数学模型所得到的PDE的非线性,以及图像数据量的庞大等都给数值求解带来困难,因此我们可以说,在图像处理的偏微分方程方法中,数值实现与建立数学模型相似,也是具有挑战性的课题。在数值实现中主要考虑的问题有稳定性、效率和精度。
图像处理中采用偏微分方程方法的主要优点表现在以下两方面。
第一,它具有更强的局域自适应性。从前面的知识我们了解到,傅里叶变换方法是完全没有局域性的,所以原则上它只适用于平稳信号处理,而图像一般来说都是非平稳的。傅里叶变换虽然具有较好的时频双重定域性,但是由于它的尺度因子二进离散化和构成二维小波时所采用的分离变量方法,使它的自适应能力受到极大的限制。虽然目前已提出一些弥补这些不足的方法,如脊小波、曲小波、轮廓小波等,但傅里叶变换在图像处理中仍然存在自适应能力的不足,这是公认的问题。偏微分方程本身是建立在连续图像模型之上的,它使得图像某像素的值在当前时间的变化仅仅依赖于该像素点的一个“无穷小”的邻域。在这一意义上,可以说图像处理的偏微分方程方法具有“无穷”的局域自适应能力。
第二,它具有高度的灵活性。如果成功地建立一个基本模型,对它进行某些修改或扩充,就可以得到性能更完善或应用面更广泛的处理方法。而这种修改或扩充往往是直截了当和简单易行的。