基于深度学习的目标检测原理与应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1.3 卷积

最开始,卷积(Convolution)是一个物理概念,出现在信号与线性系统中,对系统的单位响应与输入信号求卷积,以求得系统的输出信号。后来,卷积被运用在数字图像处理中,与最初的原理相通,只是进一步将一维函数变成二维卷积核(卷积模板),在图像上滑动。每次滑动计算相当于矩阵的点积,直到把整幅图像遍历,如图2-1-2所示。

图2-1-2 卷积原理示例[1]

高斯卷积(高斯模糊,Gaussian Blur)是常用的卷积应用之一。为了使图像没有突出的特征点,引入了模糊的概念。简易的模糊方法是选取每个像素周边像素的平均值。高斯模糊不是简单选取平均值,而是用高斯分布与图像做卷积,换句话说,就是加权,即将某点的像素用周围点的加权来表示,距离该点距离越近的点权重越大,越远的点权重越小,从而减少“被平均”的偏误,如图2-1-3所示。二维高斯函数表达式为

注:彩插页有对应彩色图片。

图2-1-3 高斯函数立体图

不同卷积会造成不同的效果。双边滤波(Bilateral Filter)更接近磨皮的效果,比原始图像更光滑;高斯滤波会模糊原始图像。加入噪声后检测,双边滤波和高斯滤波基本可去除噪声。运用不同滤波的对比如图2-1-4所示。

资料来源:莱娜·瑟德贝里肖像图。

图2-1-4 运用不同滤波的对比

卷积神经网络(Convolutional Neural Networks,CNN)与高斯卷积不同之处在于,其每层都运用多个卷积核。如图2-1-5所示,一只狗的图像,经过一个卷积层,会输出多幅图像。一般来说,运用3×3的卷积核即可生成多幅不同特征的图像。其好处是可以使用不同的卷积核学习不同的特征。

资料来源:Andrew Ng Coursera卷积神经网络课程。

图2-1-5 卷积神经网络