1.2 视觉成像基本原理
传统的视觉成像模型是中心透视投影模型,这种模型在数学上是三维空间到二维平面的中心投影,由一个3×4的投影矩阵M来描述,它是一种退化的射影变换。针孔成像模型假设物体表面的反射光或者发射光都经过一个“针孔”而投影在像平面上。该“针孔”称为光心C,或投影中心。物点P、光心C和对应像点p均在一条直线上,即满足光的直线传播条件。图1.4所示为针孔成像模型原理,也就是中心透视投影模型成像原理。针孔成像模型主要由光心、像平面和光轴组成。其中,光心到像平面的像距v称为焦距f,物距u等于光心到物体的距离。
图1.4 针孔成像模型原理
根据中心透视投影模型的成像过程,物点P到光轴的距离X与对应像点p到光轴的距离x之间满足几何光学中相似三角形的线性关系,即
在机器视觉应用中,空间物体表面某点的三维几何坐标与其在图像中对应点的坐标存在一定的关系,通过建立相机成像的几何模型便可确定这一关系,这些几何模型参数就是相机参数[4]。为此,先要建立图1.5所示的相机常用坐标系,该坐标系包括了相机坐标系、图像坐标系、像素坐标系和世界坐标系(图中未画出)。
图1.5 相机常用坐标系及成像
相机坐标系Ocxcyczc的原点即为相机光心,zc轴与相机光轴重合,且取摄像方向为正向,xc轴、yc轴与图像坐标系的x轴,y轴平行。为了描述像素点在图像中的坐标位置,以成像平面的左上角顶点Oi为原点建立像素坐标系,u轴和v轴分别平行于图像坐标系的x轴和y轴。每幅图像的存储形式是m×n的数组序列,m行n列的图像中的每一个元素即像素,像素的坐标(u,v)表示该像点在像平面的行数和列数。像素坐标系就是以像素为单位的图像坐标系。世界坐标系又称为全局坐标系,是任意定义的三维空间坐标系,通常是将被测物体和相机作为一个整体来考虑的坐标系。空间点P的位置通常用其在世界坐标系中的坐标(X,Y,Z)来描述。
1. 相机坐标系与世界坐标系的相对位置姿态关系
两个坐标系之间的相对关系可以分解成一次绕坐标原点的旋转和一次平移。旋转可以有多种表达方式,如欧拉角、旋转向量、四元数等。下面采用欧拉角来表示坐标系的旋转。设物点P(X,Y,Z)在相机坐标系中的坐标为(Xc,Yc,Zc),则可以用旋转矩阵和平移向量描述(Xc,Yc,Zc)与(X,Y,Z)之间的关系:
式(1.2)可改写为:
式中,R称为旋转矩阵,它是一个3×3的单位正交阵,其中的元素r0~r8是旋转角(αx,αy,αz)的三角函数组合,旋转角(αx,αy,αz)定义为将世界坐标系变换到与相机坐标系姿态一致而分别绕三个坐标轴转过的欧拉角。T=(Tx,Ty,Tz)称为平移向量,是世界坐标系原点Ow在相机坐标系中的坐标,也就是将世界坐标系原点Ow移至相机坐标系原点的平移量。经过旋转和平移,使得世界坐标系与相机坐标系重合,如图1.6所示。
图1.6 用旋转和平移描述世界坐标系与相机坐标系的关系
设世界坐标系绕xw轴旋转αx得到的旋转矩阵为Rx,绕yw轴旋转αy得到的旋转矩阵为Ry,绕zw轴旋转αz得到的旋转矩阵为Rz。根据坐标变换关系,Rx、Ry、Rz分别为:
对于相对关系确定的两个坐标系,它们之间旋转矩阵R和平移向量T各元素的数值也是确定的。但如果规定世界坐标系按不同的旋转顺序依次绕各坐标轴旋转,会得到不同的旋转角数值和旋转矩阵表达形式。例如,在摄影测量中常用的让世界坐标系先绕yw轴转αy,再绕当前的xw轴转αx,最后绕当前的zw轴转αz,则旋转矩阵R为:
容易验证,旋转矩阵R是一个单位正交矩阵。交换式(1.5)中的Rx、Ry、Rz的顺序,可以得到不同旋转顺序下旋转矩阵R的表达式。
2. 相机坐标系与图像坐标系的关系
如图1.7所示,相机坐标系与图像坐标系的关系可根据中心透视投影模型的基本关系式(1.1)推导可得,像点p的图像坐标(x,y)与物点P的相机坐标系坐标(Xc,Yc,Zc)的关系为:
图1.7 相机坐标系与图像坐标系的关系
式中,f为焦距,式(1.6)写成齐次坐标形式为:
3. 像素坐标系与图像坐标系的关系
假设图像中心的像素坐标为(u0,v0),相机中的感光器件每个像素在x与y方向上的物理尺寸是dx、dy,那么,图像坐标系的坐标(x,y)与像素坐标系的坐标(u,v)之间的关系可以表示为:
写成矩阵形式为:
改写成齐次坐标形式为:
上述介绍的是图像坐标系和像素坐标系均为直角坐标系的情况,但是大多数情况下,像素坐标系两坐标轴的夹角为θ,那么
改写成齐次坐标形式为:
4. 像素坐标系与世界坐标系的关系
通过前面几个步骤,得到各个坐标系之间的转换关系,就可以进一步得出像素坐标系与世界坐标系的变换关系为:
定义一个3×4阶矩阵M:
fx=f/dx,fy=f/dy分别称为x轴和y轴上的归一化焦距。(u0,v0)和归一化焦距(fx,fy)是相机的内参数,描述的是相机本身的特性;而平移向量T和旋转角、旋转矩阵R是相机的外参数,描述的是相机坐标系与世界坐标系的相对位置、姿态关系。构成M矩阵的第一个矩阵由相机内参数组成,称为内参数矩阵,第二个矩阵由相机外参数组成,称为外参数矩阵。则中心透视投影成像关系可用矩阵M来描述:
矩阵M描述了空间点到像素点的中心透视投影关系,称为投影矩阵。将矩阵M展开,就可以得到投影矩阵各元素为:
由于Zc是物点P到图像中心C的距离在光轴方向上的投影,因而Zc≠0。将式(1.15)展开,得到用投影矩阵各元素描述的共线方程为:
中心透视投影模型中的共线方程和投影矩阵是摄像测量学中最基本、最重要的关系。几乎所有摄像测量的理论方法都是从这点出发,并以此为基础。
值得一提的是,中心透视投影模型是线性成像关系。但实际上,由于镜头设计非常复杂,并且加工水平有限,故实际的成像系统不可能严格地满足上述的线性关系,会存在图像畸变。造成的图像畸变可以分为两类:径向畸变和切向畸变。只有对图像进行校正求得畸变参数后才能进行下一步的解算。