第六章 数字图像处理
第一节 概 论
一、数字图像处理的主要内容
数字图像处理从系统工程角度讲,研究的内容有数字图像的获取、存储和传输,以及数字图像的输出和显示。其中,数字图像的处理具体包括代数和几何运算、图像变换、图像增强、图像复原、图像编码、模式识别和图像配合等内容。
代数运算是指对两幅图像进行点对点的加、减、乘、除运算。加法运算可用于降低图像中加性随机噪声的污染;减法运算则可以检测图像中物体的运动变化;乘法运算可用于标记图像中的感兴趣区域;除法运算则常用于多光谱图像的分析处理,以扩大不同的影像的灰度差。
几何运算用于改变图像中物体的空间位置关系,主要包括图像的平移、缩放、旋转和坐标变换,以及多幅图像的空间配准及镶嵌。
图像变换是将图像从空间域变换为频率域,在变换域对图像处理和分析。图像变换作为图像增强和图像复原的基本工具,或者作为图像特征为图像分析提供基本依据。其主要内容包括离散傅里叶变换、离散余法变换、沃尔什—哈达玛变换、主成分变换和小波变换。
图像增强主要是突出图像中某些“有用”信息,扩大图像中不同物体特征之间的差别,改善图像的视觉效果,增强某些特定的信息。图像增强的主要算法包括直方图增强、空域滤波增强、频域滤波增强和彩色增强。
数字图像的数据量是非常大的,然而数字图像实际上具有很大的压缩潜力。这是因为数字图像中像素与像素之间存在很大的相关性,而且人类的视觉特性对彩色的敏感程度存在着局限性,对图像中颜色的细微变化是观察不到的,图像编码的研究就是利用像素间的相关性及人的视觉特性对图像进行高效编码,即研究数据压缩技术。图像编码主要算法包括哈夫曼编码、行程长度编码、变换编码和MPEG视频压缩中的帧间编码。
图像复原就是根据事先建立起来的系统退化模型,将降质了的图像以最大的保真恢复成真实的图像。图像复原的主要内容包括系统退化模型、线性代数复原法和滤波复原法。
模式识别作为一门学科有其系统的理论基础和技术方法。在数字图像处理中,模式识别是指在图像增强等预处理的基础上,提取图像的有关特征,进而对图像中的物体进行分类,或者找出图像中有哪些物体。模式识别主要算法包括统计模式识别法、模糊模式识别法、人工神经网络模式识别法和句法结构模式识别法。
图像融合是通过一定的算法将两个以上的图像结合在一起生成一个新的图像。新图像与原始图像相比,应有更好的质量和可靠性。数据融合按融合所在的阶段不同,可分为像元级、特征级和决策级三个层次。图像融合所采用的算法与图像间的代数运算有着本质的差别。
二、数字图像处理的基本概念
学习一门课程的关键是掌握相关的基本概念,数字图像处理的基本概念包括图像、数字图像、数字图像处理、扫描、采样、量化以及数字图像的基本组成单元——像素。
图像是与之对应物体或目标的一个表示,这个表示可以通过某种技术手段得到。根据图像的产生方法可将图像分为三类:第一类是可见图像,即可以由人眼看见的图像,通常由照相或手工绘制等方法得到;第二类是物理图像,它反映的是物体的电磁波射能,包括可见光和不可见光,一般通过某种光电技术获得;第三类为数字图像,是由连续函数或离散函数生成的抽象图像,如图6-1。
图6-1 图像的分类
数字图像可定为与之对应的物体的一个数字表示。常用二维矩阵来表示一幅数字图像,也就是说数字图像就是一个二维矩阵。
数字图像是对一个物体的数字表示,即对一个二维矩阵施加一系列的操作,从而得到所期望的结果。数字图像处理的实质是对二维矩阵的处理,是将一幅图像变为另一幅经过修改的图像,是将一个二维矩阵变为另一个二维矩阵的过程。
数字图像的获取可通过下列三种途径,一是将传统的可见光图像经数字化处理转换为数字图像,如将一幅照片通过扫描仪输入到计算机中,扫描的过程实质上就是一个数字化过程;二是应用各种光电转换设备直接得到数字图像,如IDR中,X线经碘化铯变为可见光,可见光经光电二极管变为电信号;三是直接由二维离散数字函数生成数字图像,如DDR中,X线照射到非晶硒探测器上,产生电子—空穴对形成电信号。
用二维矩阵表示一幅数字图像,图像被与其大小完全相等的网络分割成大小相同的小方格(grid),每个方格称为像素(pixel)。像素是构成图像的最小基本单位,每个像素至少具有两个属性,即像素的位置和灰度值。位置由像素所在的行列坐标决定,通常用坐标对(X、Y)表示。像素的灰度值可理解为图像上对应点的亮度值,如图6-2。
图6-2 数字图像的矩阵表示
将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括三个步骤:扫描、采样、量化。扫描是按照一定的先后顺序对图像进行遍历的过程,像素是遍历过程中最小寻址单元;采样是指遍历过程中,在图像的每个最小寻址单元即像素位置上测量的灰度值,采样的结果是得到每一像素的灰度值,采样通常由光电传感器件完成;量化则是将采样得到的灰度值通过模数转换器件转化为离散的整数值。
综上所述,对一幅图像依照矩阵扫描网络(raster)进行扫描,结果是生成一个与图像相对应的二维整数矩阵,矩阵中每一个像素的位置由扫描的顺序决定,每一个像素的灰度值由采样生成,经过量化得到每一像素灰度值的整数。因此,对一幅图像数字化所得到的最终结果是一个二维整数矩阵,即数字图像。
三、数字图像处理的基本类型
在计算机处理中,按照颜色和灰度的多少可以将图像分为二值图像、灰度图像、索引图像和真彩色RGB图像四种基本类型。目前,大多数图像处理软件都支持这四种类型的图像。
1.二值图像
二值图像是一幅黑白图像,其二维矩阵仅由0、1两个值构成,“0”代表黑色,“1”代表白色。由于每一像素取值仅有0、1两种可能,所以计算机中二值图像的数据类型通常为1个二进制。二值图像通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。
2.灰度图像
灰度图像的矩阵元素取值范围通常为[0,255]。因此,它的数据类型一般为8位无符号整数(uint8),这就是人们经常提到的256级灰度图像。“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。在某些软件中,灰度图像也可用双精度数据类型(double)表示,像素的值域为[0、1],“0”代表黑色,“1”代表白色,0~1之间的小数表示灰度等级。二值图像可以看成是灰度图像的一个特例。
3.索引图像
索引图像的文件结构比较复杂,除了存放图像数据的二维矩阵外,还包括颜色索引矩阵(COLORMAP)的二维数级。COLORMAP的大小由存放图像的矩阵元素的值域决定,如矩阵元素值域为[0,255],则COLORMAP矩阵的大小为256×3Byte,用COLORMAP=[RGB]表示。COLORMAP中每一行的3个元素分别指定表示该行颜色的RGB组合的红、绿、蓝单色值。COLORMAP中每一行对应图像矩阵中的一个灰度值。如某一像素的灰度值为2,则该像素在屏幕上的实际颜色由第2行的RGB组合决定。由于[255 0 255]组合为紫色,所以凡是灰度值为2的像素均显示为紫色。
换言之,图像在屏幕上显示时,每一像素的颜色由存放在矩阵中该像素的灰度值作为索引通过检索颜色索引矩阵COLORMAP得到。索引图像的图像矩阵数据类型一般为8位无符号整型(Uint8),相应索引矩阵COLORMAP的大小为256×3Byte,因此一般索引图像只能同时显示256种颜色,但通过改变索引矩阵颜色的类型可以调整。索引图像一般用于存放色彩比较简单的图像,若图像色彩比较复杂就要用RGB真彩色图像。
4.RGB彩色图像
RGB图像与索引图像一样都可以用来表示彩色图像,与索引图像一样,它分别用红(R)、绿(G)、蓝(B)三原色的组合来表示每个像素的颜色。但与索引图像不同的是,RGB图像每一个像素的颜色值直接存放在图像矩阵中。由于每一像素的颜色需由R、G、B三个分量来表示,因此RGB图像矩阵与其他类型不同,是一个三维矩阵,可用M×N×3表示。M、N分别表示图像的行列数,3个M×N的二维矩阵分别表示各个像素的R、G、B三个颜色分量。RGB图像的数据类型一般为8位无符号整型,通常用于表示和存放真彩色图像,当然也可存放灰度图像。存放灰度图像时,3个二维矩阵同一位置处的元素的取值完全相同。RGB图像将每一像素的颜色(R、G、B三个分量)直接存放在一个三维的图像矩阵中,它表示的颜色理论上可多达224种颜色,所以RGB图像的显示速度很快。
四、数字图像处理的内容
数字图像处理可以研究数字图像的获取、存储和传输,以及数字图像的显示。具体包括代数和几何运算、图像变换、图像增强、图像复原、图像编码、模式识别和图像融合等内容。
1.图像变换
由于图像阵列很大,直接在空间域中进行处理涉及计算量很大。因此,往往采用各种图像变换的方法,如傅里叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅里叶变换可在频域中进行数字滤波处理)。目前研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。
2.图像编码压缩
图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
3.图像增强和复原
图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立“降质模型”,再采用某种滤波方法,恢复或重建原来的图像。
4.图像分割
图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,有意义的特征有图像中的边缘、区域等,这是进一步对图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。
5.图像描述
图像描述是图像识别和理解的必要前提。作为最简单的二值图像可采用其几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两类方法,对于特殊的纹理图像可采用二维纹理特征描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
6.图像分类(识别)
图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。
五、数字图像处理的基本特点
1.数字图像处理的信息大多是二维信息,处理信息量很大。如一幅256×256低分辨率黑白图像,要求约64kbit的数据量;对高分辨率彩色512×512图像,则要求768kbit数据量;如果要处理30帧/秒的电视图像序列,则每秒要求500kbit~22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。
2.数字图像处理占用的频带较宽,与语言信息相比,占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。
3.数字图像中各个像素是不独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般来说还要大些。因此,图像处理中信息压缩的潜力很大。
4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。
5.数字图像处理后的图像一般是给人观察和评价,因此受人的因素影响较大。由于人的视觉系统很复杂,受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大,作为图像质量的评价还有待进一步深入的研究。另一方面,计算机视觉是模仿人的视觉,人的感知机制必然影响着计算机视觉的研究。例如,什么是感知的初始基元,基元是如何组成的,局部与全局感知的关系,优先敏感的结构、属性和时间特征等,这些都是心理学和神经心理学正在着力研究的课题。
六、数字图像处理的优点
1.再现性好
数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像的质量退化。只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现。
2.处理精度高
按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。对计算机而言,不论数组大小,也不论每个像素的位数多少,其处理程序几乎是一样的。换言之,从原理上讲不论图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了。为了把处理精度提高一个数量级,大幅度地改进处理装置,这是经济的。
3.适用面宽
图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像(彩色图像也是由灰度图像组合成的,例如RGB图像由红、绿、蓝三个灰度图像)组合而成,因而均可用计算机来处理。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。
4.灵活性高
图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。由于图像的光学处理从原理上讲只能进行线性运算,这极大地限制了光学图像处理能实现的目标。而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。
七、数字图像处理的应用
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及人类生活和工作的方面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。
1.航天和航空技术方面的应用
数字图像处理技术在航天和航空技术方面的应用,除了上面介绍的JPL对月球、火星照片的处理之外,另一方面的应用是在飞机遥感和卫星遥感技术中。许多国家每天派出很多侦察飞机对地球上有兴趣的地区进行大量的空中摄影,对由此得来的照片进行处理分析,以前需要雇用几千人,而现在改用配备有高级计算机的图像处理系统来判读分析,既节省人力,又加快了速度,还可以从照片中提取人工所不能发现的大量有用信息。
从60年代末以来,美国及一些国际组织发射了资源遥感卫星(如LANDSAT系列)和天空实验室(如SKYLAB),由于成像条件受飞行器位置、姿态、环境条件等影响,图像质量总不是很高。因此,以如此昂贵的代价进行简单直观的判读来获取图像是不合算的,而必须采用数字图像处理技术。如LANDSAT系列陆地卫星,采用多波段扫描器(MSS),在900km高空对地球每一个地区以18天为一周期进行扫描成像,其图像分辨率大致相当于地面上十几米或100米左右(如1983年发射的LANDSAT-4,分辨率为30m)。这些图像在空中先处理(数字化,编码)成数字信号存入磁带中,在卫星经过地面站上空时,再高速传送下来,然后由处理中心分析判读。这些图像无论是在成像、存储、传输过程中,还是在判读分析中,都必须采用很多数字图像处理方法。
现在世界各国都在利用陆地卫星所获取的图像进行资源调查(如森林调查、海洋泥沙和渔业调查、水资源调查等),灾害检测(如病虫害检测、水火检测、环境污染检测等),资源勘察(如石油勘察、矿产量探测、大型工程地理位置勘探分析等),农业规划(如土壤营养、水分和农作物生长、产量的估算等),城市规划(如地质结构、水源及环境分析等)。我国也陆续开展了以上诸方面的一些实际应用,并获得了良好的效果。在气象预报和对太空其他星球研究方面,数字图像处理技术也发挥了相当大的作用。
2.生物医学工程方面的应用
数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了上面介绍的CT技术之外,还有一类是对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等。此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。
3.通信工程方面的应用
当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。具体地讲是将电话、电视和计算机以三网合一的方式在数字通信网上传输。其中以图像通信最为复杂和困难,因图像的数据量十分巨大,如传送彩色电视信号的速率达100Mbit/s以上。要将这样高速率的数据实时传送出去,必须采用编码技术来压缩信息的比特量。在一定意义上讲,编码压缩是这些技术成败的关键。除了已应用较广泛的熵编码、DPCM编码、变换编码外,目前国内外正在大力开发研究新的编码方法,如分行编码、自适应网络编码、小波变换图像压缩编码等。
4.工业和工程方面的应用
在工业和工程领域中图像处理技术有着广泛的应用,如自动装配线中检测零件的质量,并对零件进行分类,印刷电路板疵病检查,弹性力学照片的应力分析,流体力学图片的阻力和升力分析,邮政信件的自动分拣,在一些有毒或放射性环境内识别工件及物体的形状和排列状态,先进的设计和制造技术中采用工业视觉等等。其中值得一提的是研制具备视觉、听觉和触觉功能的智能机器人,将会给工农业生产带来新的激励,目前已在工业生产中的喷漆、焊接、装配中得到有效的利用。
5.军事公安方面的应用
在军事方面图像处理和识别主要用于导弹的精确制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸鉴别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。
6.文化艺术方面的应用
目前这类应用有电视画面的数字编辑,动画的制作,电子图像游戏,纺织工艺品设计,服装设计与制作,发型设计,文物资料照片的复制和修复,运动员动作分析和评分等等,现在已逐渐形成一门新的艺术-计算机美术。