玩转3D视界:3D机器视觉及其应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 本书的主要内容

1.3.1 章节内容

本书的每一章都对应一个主题,从底层的数据结构到信号处理,再到上层应用,不断加深,循序渐进。同时,在应用部分,每章最后都配有对应的实践例程,供读者参考和学习。

本书后续分为两个部分,共六章。

第一部分是基础知识篇,包括对常用的3D相机、3D数据表示和3D数据处理的介绍。

● 第2章介绍了常用的3D相机,对双目相机、结构光相机、ToF相机的测距原理和标定补偿等内容分别进行了详细讲解。重点介绍了ToF 3D相机,包括P-ToF与CW-ToF的特性、重要的参数、误差与校正等,并对三种相机的特性进行了对比,介绍了三种相机各自适用的应用场景。在第2章的最后,介绍了适用于各种3D相机的通用开发平台——DMAPP。

● 第3章介绍了3D视觉常用的数据表示方法,包括深度图、点云、体素、三角剖分和3D数据存储格式。对每种数据格式的结构、生成方法、特性进行了详细介绍,利用每节讲解的知识,最终生成3D打印的模型。

● 第4章介绍了3D数据的处理和压缩。数据处理包括针对深度图和点云的噪声滤波处理,深度图滤波包括高斯滤波、中值滤波、双边滤波及两种简单的时域滤波;点云滤波部分介绍了滤除飞散点的直通滤波器、统计滤波器、半径滤波器及在下采样时使用的体素滤波器。数据压缩部分介绍了适用于单帧深度图和深度视频序列两类不同场景的压缩方法。

第二部分是3D应用篇,包括3D几何测量与建模、3D物体分割与识别、3D活体检测与动作识别。

● 第5章介绍了基于ToF相机的测量应用的主要步骤及其中涉及的主要算法,包括预处理、边缘检测、轮廓检测、形状检测、3D测量等,还介绍了基于RGB-D的3D重建的主要步骤及涉及的主要算法。

● 第6章介绍了3D物体的分割与识别。应用背景主要是基于智能服务机器人执行任务的小型场景,通过平面检测方法实现目标物体的分割。物体分割是目标识别的基础,对于分割后的目标物体,通过提取物体的几何形状属性特征、结构属性特征进行匹配、学习,从而完成物体几何形状的识别与分类。此外,针对复杂场景中的多物体分割与识别,为了应对前景物体与背景高度融合及点云数据噪声性、稀疏性和无序性的挑战,通过融合RGB-D数据来设计神经网络,学习不同物体的3D特征,最终实现物体的语义识别。

● 第7章主要介绍了3D技术在活体检测与动作识别中的应用,从人脸识别、人体骨架识别、跌倒检测和手势识别四个方面进行介绍,包括相关概念、原理、算法设计与代码实现。学习完本章之后,读者能够自己实现一些简单的应用。

1.3.2 应用介绍

在3D视觉应用部分,本书围绕如下四种应用展开介绍。

应用一:3D测量

3D测量,顾名思义,就是指利用计算机视觉对待测物体进行几何测量,得到物体的3D尺寸、面积、体积等。3D测量在我们日常生活中的应用非常广泛。例如,在物流行业中,通过测量包裹的几何尺寸,优化运输过程中的空间利用率,降低人力成本;在工业生产中,需要对元器件进行长度测量和体积测量等。与传统的接触式测量相比,基于3D视觉的测量更加智能且高效。用户只需使用3D相机拍摄几张图片,就可以计算出目标的3D尺寸。而且,3D相机还具有体积小、功耗低的特点,适合移动便携式测量设备和嵌入式设备的开发。

应用二:3D重建

3D重建是计算机视觉中一个非常重要的领域。基于计算机视觉的3D重建分为基于2D相机的重建和基于3D相机的重建两类。早期,在3D相机尚未普及的时候,3D重建技术通常以多幅2D图像为输入,需要进行相机标定等额外操作。而基于3D图像的重建因为输入简单、使用便捷,近几年逐渐成为新的研究热点。尤其是随着深度学习的发展,基于单幅深度图的3D重建也取得了显著成果,但该方法往往需要一些先验知识或者约束条件来辅助重建。

应用三:智能服务机器人

前面两个应用更侧重于智能化的工业生产,未来,智能化还会走进家家户户,如智能家居、智能服务机器人等。其中,智能服务机器人近年来得到了越来越多的关注,人们期望借助其搭载的3D相机来帮助用户完成家庭场景中的日常活动,如摆放物品、避障移动等,这就要求机器人具有感知环境和识别目标物体的能力。高鲁棒性、高精度的物体识别是智能服务机器人系统的关键,虽然基于2D图像的物体识别在特定场景中取得了不错的效果,但视角、尺度和光照等因素的变化仍会导致物体识别失败,这也说明了2D图像特征对3D真实世界的物体和场景的描述依然不够。此应用聚焦智能服务机器人执行任务的场景,实现基于3D图像的物体识别与分割。

应用四:3D人体动作识别

智能服务机器人进入市场还需要一定时间,但智能家居已经出现在我们的生活当中。例如,已经出现可以用手势控制的抽油烟机,只需要挥一挥手就可以开关抽油烟机,实现无接触式交互。智能家居的实现依赖本书介绍的3D人体行为识别。人体行为识别是一个很广泛的研究领域,本书选择其中四个课题进行介绍,分别是人脸识别、人体骨架识别、跌倒检测和手势识别。人脸识别涉及人工智能和生物特征识别等多个领域,其目的是实现人的身份识别与鉴定。人体骨架识别的目标是自动定位场景中人体的主要关节点位置,这也是许多高层次图像理解任务的关键步骤。基于骨架检测可以识别许多人体动作,如后续的跌倒检测等。手本身也是由多个关节构成的,是一个具有高自由度的物体,手势识别是指识别用户的手部动作,通过手势识别的结果,向计算机发送不同的指令,让计算机理解人类的行为,实现便捷智能的人机交互。