1.5 深度学习在图像领域中的应用
深度学习在图像领域中的应用十分广泛,尤其在工业图像、医学图像、遥感图像、监控图像的目标检测、语义分割等应用中,深度学习发挥了其智能学习与预测的能力。
1.工业生产缺陷检测
随着我国工业化程度的不断提高,焊接技术已广泛应用到承压容器、冶金工业、石油化工等各个领域,工业设备焊接质量的好坏直接影响焊接结构的使用性能和寿命。由于生产工艺和焊接环境等因素的影响,工业设备的焊缝位置在制造和使用过程中容易产生各类焊接缺陷,依照焊缝位置的不同可分为内部缺陷(裂纹、圆形缺陷、未熔合、未焊透等)和表面缺陷(咬边、烧穿等)。
对于表面缺陷,可以通过视觉检测方法直接识别焊缝缺陷类型和损伤程度;而焊缝内部缺陷则需要借助其他无损检测技术进行缺陷识别和研判,如脉冲超声检测技术(UT)、X射线检测技术(RT)和涡流检测技术(ET)等。其中,RT由于可以准确识别缺陷的位置和长度而在焊缝缺陷检测中应用最为广泛。目前,RT的缺陷定性、定量主要还是依赖人工评定法,包括人工评片和机器视觉等。人工评片受评片人员的专业水平和身体状况等主观因素的影响,容易造成缺陷漏检或误判等;机器视觉广泛应用于焊缝图像的缺陷分割,主要针对人工选取的特征进行提取和分析,这不仅依赖于人工选定,还对某些缺陷难以选出优质的特征,当提取的特征质量不佳时,就得不到较高的识别准确率。为了降低依赖人工评定法的主观性、差异性,研究焊缝缺陷自动检测系统成为重要的研究方向。近年来,将深度学习的图像特征自动学习应用于工业生产缺陷检测成为主流研究方向。一方面,该方法避免了传统算法中人工提取特征的局限性和复杂性;另一方面,深度学习在自然语言处理、图像分类和物体检测等领域获得了广泛应用,为深度学习在工业生产缺陷检测中的应用奠定了基础[11]。如何对工业图像进行处理,以满足工业生产缺陷检测深度学习模型训练的需求是该领域重点关注的问题之一。
2.医学影像检测
随着医学成像技术和成像设备的快速发展与普及,全球每天会产生大量的医学影像数据,借助计算机进行医学影像分析在临床诊断、手术方案制定中的重要性日益凸显。其中,医学影像分割能够有效地提取目标区域的形状和空间信息,是进行医学影像定量分析的关键步骤之一,目的是以机器视觉方式自动从医学影像中逐像素地识别出目标区域(器官、组织或病灶)。早期的医学影像分割系统主要基于传统的图像分割算法搭建,如基于边缘检测的分割算法、基于阈值的分割算法和基于区域的分割算法。但医学影像通常具有对比度低、组织纹理复杂、边界区域模糊等特点,极大地限制了此类图像分割算法的效果和应用场景。随后,针对特定任务设计手工特征的分割算法在很长一段时间内成为医学影像分割的研究主流,然而,手工特征的设计极大地依赖医生的专业先验知识,而且往往泛化能力差,无法迁移到新的任务场景中。因此,在实际应用中,基于传统图像分割技术的医学影像分割系统仍然不够成熟,无法获得令人满意的分割效果。
近年来,随着计算机技术和人工智能的快速发展,卷积神经网络(Convolutional Neural Networks,CNN)强大的建模能力被广泛研究。相比于传统的算法,基于卷积神经网络的深度学习算法给图像处理各领域带来了突破性的进展,如图像分类、语义分割等,基于深度学习的图像分割算法也被引入医学影像分割中。深度学习算法的自动提取特征能力有效地克服了传统医学影像分割算法过多依赖医生的专业先验认知这一弊端,且深度学习算法的可移植性高,借助迁移学习能够快速地拓展到不同的任务场景中[12]。如何对医学影像学习样本进行处理、提高医学影像的分辨率、降低图像噪声干扰、提高深度学习模型的识别能力和精度是医学领域的重点研究方向。
3.图像小目标检测
随着深度学习的发展,基于深度学习的目标检测技术取得了巨大的进展,但小目标由于像素少,难以提取有效信息,造成小目标检测面临着巨大的困难和挑战。为了提高小目标检测性能,研究人员从网络结构、训练策略、数据处理等方面展开了大量的研究,并取得了一定的进展。然而,与大、中目标检测相比,目前小目标检测性能依然存在着较大的差距。
目标尺度是影响目标检测性能的重要因素之一。目前,无论在公开数据集还是现实世界采集的图像中,小目标检测精度远远低于大目标和中目标,并经常出现漏检和误检的情况。但小目标检测在许多实际场景中具有重要的应用,甚至是很多智能设备能否有效安全运行的关键。例如,在无人驾驶系统中,当交通信号灯或行人等目标比较小时,仍然要求无人车能准确识别这些目标并做出相应的动作;在卫星图像的分析中,需要检测汽车、船舶之类的目标,但这些目标往往由于尺度过小而造成检测困难。因此,研究小目标检测的有效方法、提高小目标检测性能是当前目标检测领域非常重要和迫切的研究课题[13]。如何提高原始图像中的小目标物体的分辨率、提高深度学习模型的小目标检测性能是业界需要突破的关键问题之一。
4.遥感图像目标检测与分类
遥感图像检测与分类方法可分为监督分类与非监督分类。监督分类是指对所要分类的地区利用先验的类别知识选择出所有要区分的各类地物的训练区,建立判别函数,对待分类区域进行分类,如最大似然法、最小距离法等。非监督分类是一种聚类统计分析方法,是以不同地物在影像中的类别特征差别为依据的无先验知识分类,如K-means均值算法、ISODATA(Iterative Selforganizing Data Analysis Techniques Algorithm)算法等。2006年,Hinton提出了无监督预训练加有监督训练微调的方法,解决了深层网络训练中梯度消失的问题,此后逐渐受到学者的关注,深度学习步入快速发展阶段。研究人员开始用深度学习处理遥感图像,实验证明,与传统遥感图像识别方法相比,其精度更高。近几年,高分辨率遥感图像的普及、测绘科学技术的发展使其成为热点研究领域[14]。基于深度学习方法,人们可以从遥感图像中提取地块、建筑物、道路、湖泊、车辆、飞机等目标,也可以对遥感图像进行分类提取。在遥感图像深度学习过程中,样本受限于遥感图像的质量,使得深度学习模型的精度有高有低,如何对样本图像进行处理,以保障深度学习模型的精度是业界需要解决的重要问题之一。