1.2 数字图像处理的基本概念
人出生以后,一睁开眼睛就开始接收各种各样的图像信息,因此有人说,图像与生俱来是人类生活中最直观、最丰富和最生动的信息表示形式。但对于数字图像处理学科而言,图像的定义并非是不言自明的,为研究和讨论的需要,应建立一个科学、统一的概念。
1.2.1 图像及其类型
数字图像处理(digital image processing)又称为计算机图像处理,它是指通过计算机对图像进行去除噪声、增强、变换、复原、分割、特征提取、识别等运算与处理。
图像包括各种各样的形式:可见图像和非可视图像;抽象图像和实际图像;适于和不适于计算机处理的图像。因此,不同种类的图像大量存在于人类生活之中。然而尽管大家天天接触图像,也知道什么是图像,但对图像却没有严格的定义。
在韦氏(Webster)英文词典中,图像(image)一词的英文定义是“an imitation or representation of a person or thing,drawn,painted,photographed…”,即图像是人或事物的一个逼真模仿或描述……著名图像专家Castleman博士将图像定义为“在一般意义下,一幅图像是一个物体或对象(objects)的另一种表示”。例如,美国总统布什的照片是他某时刻出现在镜头前的一种描述或表示。因此,图像是其所表示物体或对象信息的一个直接描述和浓缩表示。简而言之,即图像是物体在平面坐标上的直观再现。因此,一幅图像包含了所表示物体的描述信息和特征信息,或者说图像是与之对应的物体或对象的一个真实表示,这个表示可以通过某些技术手段实现。
日常生活中可能会遇到各种各样的图像,如非光学数字图像、高维图像(维数等于或大于3)、多光谱图像、非均匀采样图像、非均匀量化图像等。图像的分类方法也多种多样,通常情况下,图像可根据其形式或产生方法进行分类。目前被一致接受的分类方法是Castleman博士所采用的基于集合论的分类方法,如图1-1所示。如果考虑所有物体的集合,图像便形成了其中的一个子集,在图像子集中的每幅图像都和它所表示的物体存在对应关系。根据图像的产生方法,图像可以分为如下三类。
图1-1 图像的基本类型
1. 可见图像
可见图像(visible images)是指视觉系统可以直接看见的图像,这也是大多数人在日常生活中所见到的和所理解的图像,这一类图像一般通过照像、手工绘制等传统方法获得,通常计算机不能直接处理,但经过数字化处理后可变为数字图像。在该集合中又包含几种不同方法产生的图像子集,其中一个子集为图片(picture),包括照片(photograph)、图(drawing)和画(painting);另一个子集为光学图像(optical image),即用透镜、光栅和全息术产生的图像。
2. 物理图像
物理图像(physical image)所反映的是物体的电磁波辐射能,包括可见光和不可见光图像。例如,光学图像是光强度的空间分布,它们能被肉眼所看到,因此也是可见的图像。不可见物理图像的例子包括温度、压力、高度以及人口密度等的分布图。物理图像一般可以通过某一种光电技术获得,第一类图像中的照片也可以归入此类。物理图像的一个重要子集是多光谱图像,包含物体的近红外、中红外、热红外等波谱信息。绝大部分的物理图像也是数字图像。多光谱图像的每一个点所包含的不只是一个局部特性,如红、绿、蓝三光谱图像,它的技术原理普遍用于彩色照相技术和彩色电视等实际应用当中。黑白图像在每个点只有一个亮度值,而彩色图像则在每个点具有红、绿、蓝三个亮度值,这三个值表示在不同波段上的强度,就是人眼看到的不同颜色。
3. 数学图像
数学图像(maths image)指由连续函数或离散函数生成的抽象图像。其中离散函数所生成的图像就是计算机可以处理的数字图像。
1.2.2 图像与数字图像
图像是其所表示物体的信息的直接描述和概括表示。一般而言,由于图像传感器的性能和成像角度原因,一幅图像所包含的信息应比原物体所包含的信息要少,因此一幅图像并非是该物体的一个完全、精确的表示,但却是一个直观和恰当的表示。
以数学方法描述图像时,图像可以认为是空间各个坐标点上光照强度的集合。也就是说,从物理、光学和数学的层面看,一幅图像可以被看作物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即
对于静止图像,式(1-1)与时间t无关;对于单色图像,式(1-1)与波长λ无关;对于二维平面图像,式(1-1)与空间的第三维坐标变量z无关。
因此,一幅二维平面图像可以用二维光辐射强度的分布函数(也称为亮度函数)表示,即
如果说图像是与之对应的物体的一个表示,那么数字图像可以定义为一个物体的数字表示,或者说是对一个二维矩阵施加一系列的操作,以得到所期望的结果。其中,数字指采用数字方法对离散像素单元进行的有关处理和计算,像素即离散的单元,处理是指让某个事物经过某一过程的作用,过程即指为实现期望目标而进行的一系列操作。
因此,数字图像处理可以定义为对一个物体的数字表示施加一系列的操作,以得到所期望的结果。其过程表现为由一幅图像变为另一幅经过修改或改进的图像,是一个由图像到图像的过程。而数字图像分析则是指将一幅图像转化为一种非图像的表示。在图片的例子中,处理的过程就是改变图片使其达到某一预定目标,或使其更满意或更具吸引力。通常情况下,若无特别声明,数字图像是指一个被采样和量化后的二维强度函数,采用等间距矩形网格采样,对幅度进行等间隔量化。也可以说,一幅数字图像是一个被均匀采样和均匀量化(即离散处理)的二维数值矩阵。
1.2.3 其他相关概念
计算机图形学(computer graphic)是指利用计算机技术将概念或数学描述所表示的物体(非实物)图像进行处理和显示的过程。其侧重点在于根据给定物体的数学描述模型生成一幅图像。从一定意义上说,如将计算机图像学和图像分析相比较,那么两者处理的对象和输出结果正好相反,计算机图形学是将非图形式的数据描述生成图像。
计算机视觉(computer vision)是指利用计算机、传感器及相关设备模拟生物的视觉功能,主要目的是通过对传感器采集到的图像或视频信息进行处理,理解自然场景的二维或三维信息。在机器人领域中,计算机视觉为机器人提供类似人类视觉的功能。
图像的运算(operation)可分为三类。第一类是全局运算,此类运算是对整幅图像进行相同的处理。第二类是点运算,其输出图像每个像素的灰度值只依赖输入图像对应点的灰度值。点运算有时称为对比度运算或对比度拉伸。第三类是局部运算,它的输出图像上每个像素的灰度值是根据输入图像中以对应像素为中心的邻域中多个像素的灰度值计算出来的。
噪声(noise)一般是指加性的或乘性的非图像本源信息,即图像的污染信息。
像素(pixel)是指在由一个数字序列表示的图像中的一个最小单位,称为像素。
对比度(contrast)是指一幅图像中灰度反差的大小。
采样密度(sampling density)是指在图像上单位长度所包含的采样点数。采样密度的倒数即像素间距(pixel spacing)。
放大率(magnification)指图像中物体与其所对应的实际景物中物体的大小比例关系。该定义只能用于线性几何关系,即在图像和景物中可以定义相同的测量单位,而且这个比例在全图中是一致的。
数字化(digitizing)是将一幅图像从其原来的形式转换为数字形式的处理过程。“转换”是非破坏性的。从计算机信息处理的角度看,所谓数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括扫描、采样和量化三个步骤。
扫描(scanning)是按照一定的先后顺序对一幅图像进行遍历的过程,如按照行优先的顺序进行遍历扫描,像素(即图像元素)是扫描(遍历)过程中最小的寻址单元。对摄影图像的数字化就是对胶片上一个个微小网格的顺序扫描。上述网格又称为矩形扫描网格或光栅(raster)。
采样(sampling)是指遍历过程中,在图像的每个像素位置上测量其灰度值,即亮度值。采样通常是由光电传感器件完成,它将每个像素点的亮度转换成与其成正比的电压值,采样的结果是得到每一像元的灰度值。
量化(quantization)则是将采样得到的灰度值通过模/数转换等器件转换为离散的整数值。由于数字计算机只能处理数字量,因此必须将连续的测量值转换为离散的整数。
1.2.4 数字图像获取方法
数字图像一般可以通过以下几种途径获取:
(1)图像传感器。图像传感器的作用是将真实场景的空间信息转换为图像信号,以数据文件的形式保存在存储介质上,并传输至计算机,它是图像处理不可或缺的通用设备。例如,专用图像采集卡通常还具有视频编辑功能,可对数字化的视频信号进行后期编辑处理,如剪切画面、添加滤镜、字幕和音效以及加入各种视频特效等。
(2)数字化扫描仪。扫描仪的作用是将传统的可见光图像经过数字化处理转换为数字图像。例如,将一幅照片通过扫描仪输入到计算机中,扫描仪所进行的过程实质上就是一个数字化过程。
(3)应用各种光电转换设备直接得到数字图像。例如,卫星上搭载的推帚式扫描仪和光机扫描仪可以直接获取地表甚至地下物体的图像并实时存入存储器中。此外,侧视雷达也可以直接获取数字图像。
(4)合成图像。直接由二维离散数学函数生成数字图像。
无论采取哪种获取方式,最终得到的数字图像在数学上都是一个二维矩阵。因此,数字图像处理的实质是对二维矩阵进行各种运算和处理。也就是说,将原始图像变为目标图像的过程,实质上是由一个矩阵变换为另一个矩阵的数学过程。无论是图像的点运算、几何运算、图像的统计特征,还是傅里叶等正交变换,本质上都是基于图像矩阵的数学运算。
因此,数字图像处理是指对一个物体的数字表示,即对一个二维矩阵施加一系列的操作,以得到所期望的结果。
1.2.5 数字图像的矩阵表示
数字图像在计算机中通常采用二维矩阵表示和存储,如图1-2所示,形象地描述了由一幅数字图像到该图像所对应的二维矩阵的简易过程和原理。图1-2(a)所示是一幅大小为128×128像素的二维数字图像,为了表述方便,以图1-2(a)中取出的一个小矩形方块为例,将该小方块放大至像素水平,即图1-2(b),可以看出这是原始图像1-2(a)中的一个8×8像素的子图像,放大后的子图像[图1-2(b)]的每一像素点都具有一个确定的灰度值,将这些灰度值按像素的顺序排列,就是一个二维矩阵。矩阵各元素的值如图1-2(c)所示。
图1-2 数字图像的矩阵表示
上述由图1-2(a)到图1-2(b)的过程中,原始图像在水平方向和垂直方向被等间隔地分割成大小相同的小方格(grid),其中的每一个小方格称为像素点,简称为像素或像元(pixel)。像素是构成图像的最小基本单位,图像的每一像素都具有独立的属性,其中最基本的属性包括像元位置和灰度值两个属性。位置由像元所在的行和列的坐标值决定,通常以像素的位置坐标(x,y)表示,像元的灰度值即该像素对应的光学亮度值。
因此,对一幅图像按照二维矩形扫描网格进行扫描的结果是生成一个与原图像相对应的二维矩阵,且矩阵中的每一个元素都为整数,矩阵元素(像素)的位置则由扫描的顺序决定,每一个像素的灰度值通过采样获取,然后经过量化得到每一像素亮度(灰度)值的整数表示。因此,一幅图像经数字化后所得到的数字图像,实际上就是图1-2(c)所表示的一个二维整数矩阵,矩阵的大小由图像像素的多少决定。