深度学习计算机视觉实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.4 进阶必备:计算机视觉方向知多少

计算机视觉是深度学习中非常火热的一个领域,在现实生活中的应用非常广泛,图2.32所示为计算机视觉的主要应用方向。

图2.32

目前图像分类已经趋于算法的极限,很难有较大的提升,不过用户可以将图像分类作为计算机视觉学习的入门方向。虽然图像分类比较基础,但仍存在一些问题需要解决,如样本类别不均衡的问题,可以考虑使用图像增强等方法扩充数据集。在工程应用中,使用图像分类的场景较少,如可以对用户输入的图片进行分类,根据分类类别推送服务或广告。

目标检测包含两个子任务:一是定位目标位置,二是给出目标类别(图像分类任务)。Two-stage算法在准确率上有优势,但是运行速度较慢。One-stage算法运行速度较快,但是存在漏检和小目标检测难的问题,因而精度较Two-stage算法低。在目标检测中除了需要注意小目标检测的问题,还要注意遮挡等问题。

图像分割是目前计算机视觉领域中最富有挑战的任务之一,工程应用较广,如文本的分割、医学图像的分割。在很多的应用中,需要分割出特定的物体,以进行进一步的处理。图像分割常用FCN进行特征提取,然后使用CRF或MRF(马尔科夫随机场)优化特征输出分割图,这是图像分割常用的方式,需要用户重点关注。

图2.32中的图像分类、目标检测和图像分割是计算机视觉领域常见的任务,难度递增,初学者可以递进式学习;图像检索、三维重建和目标跟踪是计算机视觉中非常专业的领域,对于初学者来说,难度较大,也较难接触到,本书不做介绍,有兴趣的用户可以深入了解。