1.1.1 光学人脸识别研究历程
人脸识别是计算机视觉和模式识别领域的关键技术之一,这些成果和算法很容易被推广到其他领域,如目标识别和文本识别等。其他相关领域的前沿技术也会有效地促进人脸识别技术的研究。近年来,随着深度学习算法的提升和计算机性能的不断提高,人脸识别技术已经被成功应用于现实生活中的多种场景。下面将对其研究历程展开介绍。
第1阶段(1964—1990年):该阶段内,人脸识别相关算法的研究主要采用了一般模式识别的方法,人脸识别并没有被当作一个专门的领域进行研究。最早的研究方法由Kanade等人[6]提出,该方法提取人的眼睛、嘴巴和鼻子等关键部位的几何位置,计算其之间的距离关系作为人脸的特征。在这一阶段,人脸识别算法并没有得到实际应用。
第 2 阶段(1991—1997 年):这一阶段,该领域的技术得到了快速发展,很多人脸识别算法都取得了相当好的结果。其中,具有代表性的是Eigenfac特征脸算法,该算法被公认为是该领域的经典算法之一,该算法主要利用了主成分分析方法(Principal Component Analysis,PCA)进行研究。与此同时,Belhumeur等人提出的Fisherface算法,是人脸识别算法的一个里程碑[7]。此后,Wiskott[8]等人使用弹性图的方法同样也取得了较好的结果,基于表观的主动形状模型(Active Shape Model,ASM)[9]和主动表观模型(Active Appearance Model,AAM)[10]在面部特征点的建模方面有较大贡献,并且后续也出现了很多基于该方法的改进算法。
第3阶段(1998—2010年):这一阶段的主流技术对不同强度光照、各种表情姿态等因素的鲁棒性较差,因此该阶段的研究主要集中在减少光学人脸照片采集过程中的光照和表情等因素对人脸识别的影响。Georghiades团队在这个时期提出了一个重要的研究方法,即基于光照锥模型的方法[11],该方法可以有效减少上述光照条件的影响。随着研究的不断深入,统计概率学等理论也被应用到人脸识别领域,以支持向量机[12](Support Vector Machine,SVM)为代表。为了将该方法应用在人脸识别,研究者们提出了一对一、一对多、类内距和类间距等改进方法,在人脸识别领域取得了较好的结果。Blanz 和 Vetter 等人为了减少不同光线、不同姿势等因素对人脸识别的影响,提出了基于3维形变模型(3D Morphable Model)[13]的算法,该算法的主要贡献是其对光学人脸照片采集过程的光线强度模型和透视与投影模型进行参数建模,以减小光照和采集设备配置等因素对人脸纹理属性的影响,通过实验,最后证明了该方法的有效性。
第4阶段(2010年至今):在这一阶段,基于深度学习的人脸识别技术取得了突破性的进展。其中,DeepFace[14]、DeepID[15-16]、FaceNet[17]和VGGFace[18]等人脸识别技术,不断地提高了人脸识别的准确率。深度学习具有很强的非线性建模能力,可以学习数据内在的特征分布。网络的前几层可以学习到人脸图像的浅层特征,后几层可以学习到人脸图像的抽象特征,整个网络可以有效表达人脸的面部信息。