1.1 数字图像处理概述
本节介绍数字图像处理方面的一些概念,从认识图像与数字图像开始,读者将了解到数字图像处理所研究和考虑的问题,以及数字图像处理技术的应用等内容。
1.1.1 图像与数字图像
所谓图像可以解释为绘制、摄制或印制的形象。而图像在计算机中是以数字的方式存储与工作的,换句话说数字图像其实是用数字信号来表示的图像。数字图像相当于一个m×n的矩阵,也可以形象化地将数字图像比喻成一个m×n的网格,而一幅图像的每个网格则用一定的颜色元素去填充,就形成了我们所看到的完整图像。其中m×n 称为图像的分辨率,显然分辨率越高,图像就越逼真。每个网格中的颜色只能是所有可表达的颜色中的一种,这个过程称为图像颜色的离散化。颜色数越多,用以表示颜色的位数越长,图像颜色就越逼真。作为以数字形式进行存储和处理的图像,数字图像的优点在于,通过计算机就能实现对图像进行各种处理和加工,还可以将它在网上传输,甚至可以多次复制而不失真。相比之下,模拟图像则以一个连续的形式存储数据。
还可以用另外一种形式来定义图像和数字图像。通常可以把一幅图像定义为平面上的位置点与其对应的某种属性的关系。用数学的方法可以通过函数func(x,y)来表示,其中x和y是平面上的位置点坐标,而func(x,y)表示这一点的图像的灰度或强度。以这种数学描述为基础来定义数字图像的概念是非常容易的,即当平面上的位置点与其对应的灰度或强度的关系满足函数func(x,y),且x,y与func(x,y)同时为有限的、离散的数值时,该图像就称为数字图像。
在实际生活中,数字信号和模拟信号的区别也会被经常提到,即数字信号总是离散的,而模拟信号则是连续变化的。模拟信号与数字信号的例子十分常见。当声音录制在磁带中时,声音就是以模拟信号的形式被记录下来的;而当声音被转换成MP3格式后存储在音乐播放器中时,它就以数字信号的形式存在。同样,当影像被胶片记录下来的时候,它是以模拟信号的形式存在的;而数码相机拍摄的图像则是以数字信号的形式存在的。
数字图像处理(Digital Image Processing)是指通过计算机对图像进行去除杂点、增强、复原、分割、提取特征等处理的方法和技术。而数字图像是由有限的元素组成的,每一个元素都有一个特定的位置和色彩属性,通常把这些元素称为图像元素,简称像素。像素是广泛用于表示数字图像元素的词汇。
数字图像处理的历史可以追溯到近百年以前,大约在1920年的时候,图像首次通过海底电缆从英国伦敦传送到美国纽约。图像处理的首次应用是为了改善伦敦和纽约之间海底电缆发送的图片质量,那时就应用了图像编码,被编码后的图像通过海底电缆传送至目的地,再通过特殊设备进行输出。这是一次历史性的进步,传送一幅图片的时间从原来的一个多星期减少到了3小时。
1946年2月,世界上第一台电子计算机ENIAC在美国的宾夕法尼亚大学诞生,该项目的负责人是莫契利(John W.Mauchly)和埃克特(J.Presper Eckert)。1950年,美国的麻省理工学院造出了第一台配有图形显示器的电子计算机——旋风I号(Whirlwind I),如图1-1所示。旋风I号的显示器使用一个类似于示波器的阴极射线管(Cathode Ray Tube,CRT)来显示一些简单的图形。1958年美国Calcomp公司研制出了滚筒式绘图仪,GerBer公司把数控机床发展成为平板式绘图仪。在这一时期,电子计算机都主要应用于科学计算,而为这些计算机配置的图形设备也仅仅是作为一种简单的输出设备。
图1-1 旋风I号计算机
数学家冯·诺依曼提出的“程序存储、顺序执行”思想为现代计算机的发展奠定了理论基础,此后计算机技术突飞猛进、日新月异,并经历了电子管、晶体管、集成电路、大规模集成电路和超大规模集成电路等阶段。时至今日,计算机已经走进千家万户,并融入到人们生活的方方面面。
随着计算机技术的进步,数字图像处理技术也得了很大的发展。1964年美国加利福尼亚的喷气推进实验室用计算机对“旅行者七号”太空船发回的大批月球照片进行处理,以校正航天器上摄影机中各种类型的图像畸变,收到了明显的效果。在后来的宇航空间技术中,数字图像处理技术都发挥了巨大的作用。
到了20世纪60年代末期,数字图像处理已经形成了比较完善的学科体系,这套理论在20世纪70年代发展得十分迅速,并开始应用于医学影像和天文学等领域。1972年Godfrey Housfield和Allan Cormack发明了轴向断层术,并将其用于头颅诊断。世界第一台X射线计算机轴向断层摄影装置由EMI公司研制成功,这也就是人们通常所说的CT(Computer Tomograph),如图1-2所示为一台现代化CT机。轴向断层术的原理可描述为一个检测器环绕着一个物体,并且一个与检测器同心的X射线也绕着物体旋转,X射线穿过物体并由位于对面环中的相应检测器收集起来,重复这一过程,断层技术即可通过一些算法用感知到的数据去重建通过物体的“切片”图像。这些图像组成了物体内部的再现图像,也就是根据人的头部截面的投影,经计算机处理来进行图像重建。后来,EMI公司又成功研制出全身用的CT装置。鉴于CT对于医学诊断技术的发展所起到的巨大推动作用,Godfrey Housfield和Allan Cormack于1979年获得了诺贝尔医学奖。
图1-2 现代化CT机
早期图像处理的目的主要是为了改善图像的质量,以使得图像更易于人类观察。它是以人为出发点,以改善视觉效果为目的的。在图像处理中,常用的图像增强、复原、编码和压缩等手段对输入的图像进行加工,并输出改善后的图像。但从20世纪70年代中期开始,随着人工智能和思维科学等理论研究的迅速发展,数字图像处理开始用于机器感知,研究人员将这个方向称为计算机视觉。当然,人工智能理论并不是十分完善的,同样许多支持计算机视觉的理论也都处在探索阶段,因此计算机视觉仍然有待研究。
我们从上面的论述中已经可以得知数字图像处理的研究源自两个主要的应用领域,即辅助分析和机器感知。
在近百年的发展历程中,数字图像处理技术突飞猛进,这主要得益于计算机科学的发展和相关数学理论的进步与完善。此外,诸如医学、军事、地质学和天文学等学科的需要也是刺激数字图像处理技术发展的一大因素。
1.1.2 数字图像处理研究的内容
数字图像处理在今天是非常热门的技术之一,生活中无处不存在着它的影子,可以说它是一种每时每刻都在改变着人类生活的技术。但长久以来,很多人对数字图像处理存在着较大的曲解,人们总是不自觉地将图像处理和Photoshop联系在一起。
Photoshop软件是由美国Adobe公司开发的一款集图像扫描、编辑修改、图像制作、图像合成与输入/输出于一体的专业图像处理软件。与Photoshop类似的软件还有Corel公司生产的CorelDRAW等软件。如图1-3所示为Photoshop和CorelDRAW软件。
图1-3 Photoshop和CorelDRAW
尽管Photoshop是一款非常优秀的图像处理软件,但它的存在并不代表数字图像处理的全部理论与方法。它所具有的功能仅仅是数字图像处理中的一部分。总的来说,数字图像处理研究的内容如下。
1)图像获取和输出
数字图像的获取与输出依然是目前数字图像处理中重要的研究方向。它的目的主要是把模拟图像信号转化为计算机所能接收的数字形式,并把数字图像用所需要的形式显示出来。数码相机、扫描仪等都是常见的图像获取设备,而打印机、显示器和投影仪则是常见的图像输出设备。
2)图像编码和压缩
正如前面所说过的,早在1920年图像的编码就已经应用于实际了。图像编码压缩技术的目的在于减少描述图像的数据量,以节省图像传输、处理时间和减少所占用的存储器容量。尤其是在计算机网络出现之后,为了提高图像的传输速度,图像的编码变得尤为重要。图像的压缩本身属于一种有损压缩,为了保证压缩后的图像不失真,且能获得较高的压缩比率是这一领域的核心问题。在后面的章节中,将详细论述这一部分的相关内容。
3)图像增强和复原
图像增强和复原的目的是为了提高图像的质量,常用的平滑、模糊及锐化等处理就属于这部分内容研究的范围。图像的复原是当造成图像退化或降质的原因已知时,通过复原技术来进行图像的校正。一般来说,复原技术是基于一定的“降质模型”和数据的图像恢复,它会在此基础之上采用某种滤波方法,恢复或重建原来的图像,其目的是消除退化的影响,从而产生一个等价于理想成像系统所获得的图像。与图像的复原不同,图像增强是指当无法得知与图像退化有关的定量信息时,强化图像中的某些分量。图像增强技术较为主观地改善了图像的质量并将突出图像中人们所感兴趣的部分。
4)图像变换
图像变换的主要目的是将空间域的处理转换为变换域处理,从而减少计算量并获得更有效的处理。通常采用的方法包括傅里叶变换、沃尔什变换和离散余弦变换等。
5)图像分割
图像分割的目的是对图像中有意义的特征部分进行提取,所谓有意义的特征包括图像中的边缘和区域等,这是进一步进行图像识别、分析和理解的基础。这方面主要包括像边缘检测和轮廓跟踪等内容。目前,对于图像分割的研究还在不断深入之中。
6)图像的描述
作为图像识别和理解的必要前提,图像的描述一般采用二维形状描述,它分为边界描述和区域描述两类方法。对于特殊的纹理图像可采用二维纹理特征描述。目前,已经提出了体积描述、表面描述和广义圆柱体描述等方法来对三维物体进行描述。
7)图像的识别与检测
图像的识别与检测主要是经过某些预处理后,对图像进行分割和特征提取,以有利于计算机对图像进行识别、理解或解释,进而解决图像中是否含有目标,以及目标的所在位置等问题。
1.1.3 数字图像处理的应用
数字图像处理技术广泛应用于医学、天文学、生物学和国防科学等领域,目前几乎不存在与数字图像处理无关的技术领域。限于篇幅,这里只是从几个方面来简要介绍数字图像处理技术在现代科技中的应用。
1)数字图像处理在地质学、矿藏勘探和森林、水利、农业等资源的调查和自然灾害预测预报方面的应用。
研究发现,恰当地运用数字图像处理技术可以在地质构造模拟实验中有效地为分析地质构造的动态演化过程提供精确的数据基础。地质构造物理模拟实验是一种帮助地质学家认识地质构造变形过程、研究构造形成机制的重要方法。其实质是利用相似性原理,根据变形几何的法则,控制构造变形的因素,研究地质构造的成因和演化过程。构造物理模拟实验装置就是为达到这一目的而研制的设备。目前,人们普遍认为对于延展性地层成因的研究,砂箱模拟实验是一种有效的研究方法。砂箱是地质构造模拟实验装置的一个重要部件,砂箱一般具备在正面和上部观察的条件。当以砂箱正面获取的图像为研究对象时,研究结果将会展示地质剖面的演化过程。通过技术手段,利用成像系统从砂箱正面自动拍照,记录实验体变形信息,然后进行图像分析与处理,即可进一步分析研究地质构造的动态演化过程。
此外,数字图像处理技术在地震勘探中也十分有用。通常在地震勘探中,地震信号的初至时间常用于获取表层的速度、厚度及进行静校正,而初至时间检测的精度和速度极大地制约着解决这些问题的精度和效率。研究表明,初至波具有比噪声振幅更强的特点,位于有效信号和纯环境噪声信号的分界处,类似于图形的边界特征。因此,可以从数字图像处理的角度出发,将原始记录数据转换成二值图,再通过检测二值图像素跳变的位置来确定初至波位置。这种方法在实际应用中得到了很好的应用效果。实验表明此方法简单、计算量小、抗噪声能力强,大大提高了检测效率。对于连续的强干扰和坏死的记录道,通过多次阈值的二值图检测,也可获得较好的结果。
2)工业生产中可以应用数字图像处理技术来进行产品质量检测、生产过程的自动控制和计算机辅助设计与制造等。
在工业生产中,一些大型设备上常安装多个大型长圆轴类工件,而各个轴之间都有很高的平行度要求。在实际生产过程中,对大型设备轴类工件平行度进行检测是比较困难的,但也是必需的。基于数字图像处理技术的多轴平行度测量方法只需通过一台CCD数码相机获得所要检测轴的数字图像,然后基于数字图像处理技术,消除了图像畸变对检测精度的影响,即可获得轴之间平行度的信息。该方法使用简单、成本低,不需昂贵或者复杂的检测设备,并且能获得很高的测量精度,稳定可靠,非常适用于大型轴类工件平行度的检测。
另举一例,大型电站锅炉的在线燃烧诊断对于指导运行人员及时调整燃烧工况有着重要的意义。实验人员使用一套基于CCD的数字图像处理系统对鄂州电厂1、2号300 MW W型火焰锅炉的内燃烧状况进行了分析诊断。利用重建后的炉内温度场分布及计算得到的辐射率分析了炉膛温度、火焰中心和炉内燃尽率等数据。结果发现1号炉在相同情况下炉温要低于2号炉且两台锅炉都不同程度地存在火焰中心偏移。研究人员而后据此对鄂州电厂提出了整改建议,有效地降低了能耗,提高了经济效益。
3)数字图像处理广泛应用于生物学和医学影像学领域中。X射线、超声波、显微图像分析及前面曾经提过的CT等都是典型代表。
4)数字图像处理在通信领域同样应用广泛。数字图像处理在通信领域中的典型应用包括图像的传输、电视电话和电视会议等。
5)场所采集的照片,例如,指纹、手迹、印章等都需要做进一步处理方能辨识;历史文字和图片档案的修复和管理同样需要用到相应的数字图像处理技术。
6)数字图像处理与太空科技同样密不可分。数字图像处理在宇宙探测中同样随处可见,大量的星体照片都需要用数字图像处理技术进行处理。
1996年,美国发射了“探索者”宇宙飞船。“探索者”于1997年7月份抵达火星并发回了上千张照片。图1-4是“探索者”从火星上发回来的土壤图片,这些照片是由美国国家航空航天局(NASA)公布的,图片显示了火星上颜色深浅不一的土壤的不同种类。
图1-4 “探索者”宇宙飞船发回的火星表面土壤照片
2004年1月3日,NASA“勇气”号火星车成功着陆火星。后来“勇气”号成功地脱离了着陆器,并在火星表面上开始漫游。图1-5是“勇气”号发回的火星日落照片。
图1-5 “勇气”号发回的火星日落照片
综上易见,数字图像处理技术的确在人们生活中的方方面面都得以应用,因此学习和掌握数字图像处理技术也是从事许多研究工作所需要的。恰当地运用这项技术能够有力推动许多研究工作的发展,为人类造福。