上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3.1 人像着色的国内外研究现状
传统的图像着色方法主要有基于局部颜色扩展的方法[70-71]和基于颜色传递的方法[72-73]。基于局部颜色扩展的方法需要指定灰度图像某一区域的彩色像素,将颜色扩散至整幅待着色图像。这一类方法需要大量人为的工作,如颜色标注等,且图像着色的质量过度依赖人工着色技巧。基于颜色传递的方法消除了人为因素在图像着色中的影响,通过一幅或者多幅颜色、场景相近的参考图像,使颜色转移至待着色图像。传统方法可以应用在人像着色中,但这类方法需要设定参考图像,且着色的计算复杂度高。
为了减小着色过程中人为因素的影响,传统的着色方法已逐渐被基于深度学习的方法所取代。其中,Iizuka等人[74]使用双通道网络,联合图像中的局部特征信息和全局先验信息,可以将任意尺寸的灰度图像自动着色。Larsson[75]等人利用VGG神经网络[76]提取图像的特征,来预测每个像素的颜色分布。Zhang[77-78]等人先后提出针对像素点进行分类和基于用户引导的灰度图像着色方法。这类方法利用神经网络提取特征,但在训练过程中容易丢失局部信息,使特征表达不完整,限制了着色的效果。近年来,生成对抗网络(Generative Adversarial Network,GAN)[79]在图像生成领域取得了巨大的成功,相比传统的神经网络[80],GAN 生成的图像质量更高。但 GAN 的训练不稳定,容易出现模式崩溃。Zhu等人[81]在Isola等人[82]的研究基础上提出了循环生成对抗网络(Cycle Generative Adversarial Network,Cycle-GAN),通过循环生成对抗的方式提高训练网络的稳定性。