生成对抗网络:原理及图像处理应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

前言

能够生成一幅“逼真”的“假图像”——生成对抗网络(GAN)的这一“神奇的功能”深深吸引了我们。说“逼真”是因为,如果单独观察GAN生成的高清图像,会以为是在某处拍摄的一张照片;说“假图像”是因为,在现实的物理世界中,找不到这幅图像对应的场景。我们能说这样的功能不神奇吗?能说这样的功能没有用吗?这和我们常年从事的图像处理研究工作大不相同。出于兴趣,从GAN问世开始,我们就不断地关注、学习、理解、比较和实验,逐步理解了GAN的“前世”和“今生”,逐步理解了GAN的“外在”和“内涵”。在这个过程中,我们有很多困惑,也遇到了很多困难。可以想象,大概会有不少读者朋友在“初识”GAN时,重蹈我们的覆辙,我们想要编写一本介绍GAN的书,使大家在学习GAN时能够少走一些弯路。这就是我们编写本书的初衷。

我们希望读者通过阅读本书,可以了解GAN技术在人工智能、计算机视觉领域中的应用,基本理解GAN技术的主要理论基础和基本工作原理,了解GAN技术在图像处理领域中的应用和近年来的主要改进,可以基于Python集成环境和TensorFlow框架编写简单的GAN演示程序,把握GAN今后的机遇。

为此,我们设定了三个方面的具体目标。首先,讲清楚GAN的“来龙去脉”,注重分析基本GAN的网络结构和工作原理,给出GAN技术面临的挑战和今后的发展趋势;其次,给出一定的基础知识铺垫,主要涉及神经网络、优化算法和图像处理等,从而减少读者学习GAN的“障碍”;最后,介绍GAN的改进及其在图像领域中的应用情况,给出2个简单的GAN编程实例。

本书内容大致可分为三个部分,第一部分为基础知识:从第1章到第5章,给出了GAN技术的概括介绍,以及理解GAN系统必需的知识支撑,包括数字图像处理基础内容、人工神经网络基础内容和常用的ANN及与GAN有关的算法;第二部分为GAN的核心内容:从第6章到第10章,介绍GAN的基础、目标函数、训练、改进和图像处理应用;第三部分为GAN的实践:第11章和第12章,分别介绍GAN的Python编程和GAN图像处理实例。

这里虽写的是“前言”,实际上写的是“后语”,是在初稿完成以后才写的。我们发现,GAN中还有不少内容尚不够清楚,理论上还有说不清的疑点,还没有到可以系统总结的最佳时期。但是,给GAN一个阶段性的小结、一个初始的梳理和一个比较全面的介绍,对促进GAN技术的发展、协助读者理解GAN原理、引发大家对GAN的兴趣还是有好处的。因此,我们编写了本书。尽管我们在数字图像处理领域工作和研究的时间较长,随着时代的进步,也逐渐涉及神经网络、人工智能、计算机视觉等领域,做过一些相关的研究工作,但在开始写作以后,仍感到力不从心。我们在知识的连贯性、系统性和深入性方面还有欠缺,仿佛在处理一副断了线、缺了珠的珍珠项链。

希望本书能够对初次接触GAN的读者有一个引导作用。

由于GAN技术尚处于“青苗”阶段,理论和实践方面仍存在问题,加之我们的水平有限,本书内容不可避免地会存在一些问题。敬请各位读者细察,不吝指教,将问题和建议反馈给我们,在此深表感谢。

编著者

2021年12月于南京