计算机图形图像处理基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 绪论

1.1 概述

随着科学技术的不断发展,人们对客观世界的认识无论是在深度和广度都得到了加深和拓宽,而计算机在这个过程中起到了无可替代的重要作用,已经成为我们进行科学研究不可或缺的工具。国外学者曾经做过统计,人类认识外部世界的信息有70%以上是来自眼睛获取的视觉信息,可视信息成为了人类认识世界的重要知识来源。因此,利用计算机处理可视信息、模拟客观世界、并进一步研究它的规律,已经成为人们深入理解客观世界的一个重要手段。

人类所感受的视觉信息的范围是非常广泛的,各类图片(picture)、绘图、绘画、光学影像都是其中的一部分,同时,借助科学技术的新成就,人类的视觉还可以得到延伸,原本对人类不可见的许多信息都可以呈现在眼前。显微镜可以使人们进入微观世界,天文望远镜可以让人们到达宇宙深处,借助新的传感器可以“看”到物体的红外图像,在计算机的辅助下可以观察电磁场的分布、原子核的运动、风场的走向。面对纷繁复杂的客观世界,如何利用计算机获取、描述、处理各类信息,并最终以一种人眼可见的形式逼真地显示给用户,已经成为广大科研工作者的一个重要研究课题,而这正是图形图像处理所要关注的领域。

图形图像处理融合了两门重要学科的内容:计算机图形学(computer graphics)和数字图像处理(digital image processing),是一门重要的信号与信息处理学科,是一维信号与信息处理的延伸和扩展,主要在二维平面内分析可视信息的相关处理手段和算法。图形图像处理所依托的学科发展非常迅速,新技术、新方法层出不穷,并且不断有其他学科的思想和理论渗透进来,是一门开放的学科。

本章主要介绍图形图像处理的基本概念以及学科的历史、现状与发展,阐述本学科的主要研究内容、相关学科及其相互关系,重点介绍计算机图形系统和数字图像处理系统的组成和主要的外部设备,并分析图形图像处理的典型应用领域。

1.2 图形图像处理的基本概念

顾名思义,图形图像处理的研究对象就是图形和图像,但是这两类对象具有不同的性质,习惯上侧重于研究图形的学科称为计算机图形学,而侧重于图像的学科称为数字图像处理。图形图像处理实质上是两者的有机融合,本书的内容也是按照这两大学科来组织的。

1.2.1 图形与图像

在日常生活中,人们常常混淆图形和图像这两个概念,有时甚至用其他词汇,如“图片”、“图案”等来取而代之。从学术角度上看,“图”是指物体反射和透射光的分布,“形”是指针对事物形状、边界、轮廓以及内部信息的描述,“像”是指人的视觉系统对图的接收,在人脑中形成的印象认识。由此可见,“图”实质上是一个物理的概念,“形”是对物理概念的模型化描述,“像”则是人脑对物理概念的认知。

在此基础上,图形就是客观实体和抽象概念的形象化表示,计算机产生图形的过程就是将表示对象的数据转化为图形的过程;而图像是指能为人类视觉系统所感知的信息形式或人们心目中的有形想象,它是事物呈现在人们心目中的影像。

由此可以看出,图形和图像实际上是既有联系又有区别的两个概念。图形和图像都是对客观世界的刻画,图形所描述的模型与图像所表示的数据实质上都是反映同一个客观世界,从数据源角度上看,图形和图像是一脉相承的。另外,图形和图像最终都要在计算机系统的输出设备上展现,这种输出设备尤其特指计算机显示器,不管图形和图像的处理手段有多么不同,最终在显示器屏幕上都是由单个像素构成的若干区域,从呈现方式上看,图形和图像是殊途同归。

然而,在表现手段上,图形和图像又有着显著的区别,并由此形成两个不同方向的学科。从数据表现目的看,图形所记录的数据表现的是对客观世界的描述,而图像所记录的数据则是真实世界的写照,借用美术领域的术语做类比,图像偏重于写实,而图形偏重于写意。另外,从数据构成的角度看,构成图形的基本数据是“图元(primitive)”,构成图像的基本数据是“像素(pixel)”。图元是构成计算机图形的基本元素,通常包括线段、矩形、多边形、圆弧等,它不仅有尺度大小的区别,还有方向的不同,因此图元是一个矢量(vec-tor)的概念。像素通常就是指组成图像的单个像点,常常与计算机显示器屏幕上的发光点对应,单个的像素只有位置和数值上的区别,但是许多像素组合起来并且将像素的数值转换成为颜色值,这就形成了人眼敏感的图像。图像是由许多不同位置不同数值的像素按一定规律排列而成,它反映了一种位图(bitmap)的思想。

1.2.2 计算机图形学与数字图像处理

了解了图形和图像的基本概念,就可以比较准确地理解计算机图形学和数字图像处理两门学科的内涵和外延。

广义的计算机图形学所研究的问题包含两个方面:其一,怎样通过计算机产生图形;其二,如何将图形转换为数据。第二个方面所研究的问题实际上涉及了图像处理的领域,我们在习惯上还是把计算机图形学和数字图像处理看成两门学科,尽管它们之间有着密切的联系,但是各自都有着自己的研究重点。

美国James D.Foley教授给出了计算机图形学的定义,“通过计算机产生、存储及处理对象的模型以及它们的图形的科学”。在这个定义中,处理可以理解为图形的变换(平移、旋转、缩放等)、修改、识别、图形间的运算(组合、拼接、裁减)、真实感图形的生成,等等,这些内容也是本书阐述的重点之一。国际标准化组织(ISO)给计算机图形学做出了以下的定义:“计算机图形学是研究通过计算机将数据转换为图形并在专用显示设备上显示的原理、方法和技术的学科。”

数字图像处理就是按特定的目标,用一系列特定的操作来改造图像,以满足人的视觉和应用要求。我们之所以强调数字化的图像处理,不仅指所处理的图像是数字图像,还包括所采用的处理手段也是数字化的手段以区别于传统的光学模拟手段。数字图像处理的研究源于两种现实的需求:一是为了改善视觉效果便于人们分析;二是为了便于计算机进行自动识别和理解。

通常认为,图像处理涉及的范畴分为低级、中级和高级三个层次。在低级层次,处理的输入和输出都是图像,采用的是一些初级手段,如去除噪声、增强对比度等,在这个层次上进行的研究工作常常被狭义地称为“图像处理”。在中级层次,其输入为图像而输出为从图像中提取的特征,主要的手段有图像分割、图像描述等,目的是为了适合计算机处理和实现对图像的分类、识别,这些研究工作常称为“图像分析”。在高级层次,分析的对象是中级层次中提取出的特征和分割出的对象,往往综合许多人工智能的手段,旨在用计算机来模拟人类视觉,分析图像对象与周围环境之间的联系,从而感知外部的三维世界,这些研究工作就是“计算机视觉”,也有学者称之为“图像理解”。

计算机图形学的基本含义是使用计算机通过算法和程序在显示设备上构造出图形来。也就是说,图形是人们通过计算机设计和构造出来的,而不是通过摄像机或扫描仪等输入的图像。所设计和构造的图形可以是现实世界中已经存在的物体的图形,也可以是完全虚构的物体。因此,计算机图形学是真实物体或虚构物体的图形综合技术。

与此相反,图像处理是景物或图像的分析技术,相对而言它所研究的是计算机图形学的逆过程,即如何从已有的图像数据中获得新的二维或三维物体模型化信息,所用的手段包括图像增强、模式识别、景物分析、计算机视觉等。

1.2.3 图形图像处理的历史、现状与发展

计算机图形学的发展历史可以追溯到20世纪50年代。1950年世界上生产出第一台CRT(阴极射线管式)显示器,这使得当时的计算机摆脱了纯数字计算工具这种单一用途,使之同时还能显示各种简单图形。到了50年代中期,美国开发的SAGE空中防御系统首次使用命令控制的CRT显示控制台,在其上操作员使用光笔识别目标。1963年,麻省理工学院林肯实验室的Ivan E·Sutherland发表了“画板(Sketchpad):一个人机图形通信系统”的博士论文,这是计算机图形学发展过程中的一个里程碑,标志着计算机图形学作为一个全新研究领域的起步。到了60年代中期,雷诺汽车公司、麻省理工学院、通用汽车公司、洛克希德飞机制造公司和贝尔实验室等都大规模地开展了计算机图形显示的研究工作。与此同时,各种绘图仪和图形显示器也相继问世,这为计算机图形学的发展提供了必要的硬件基础。进入70年代以后,人们相继提出了各种图形标准(如GKS二维图形标准与PHIGS、OpenGL三维图形标准等),这使得各种图形应用软件的开发更加方便,同时使其应用软件具备了良好的可移植性。应该说图形显示软件的标准化是计算机图形学发展趋于成熟的一个重要标志,是对计算机图形学技术成果的总结与概括。

我国开展计算机图形学的研究开始于20世纪60年代中后期。随着我国社会经济的高速发展,计算机图形学无论在理论研究,还是在实际应用的深度和广度方面,都取得了令人可喜的成果。在国家攻关项目、863高技术和国家自然科学基金项目中有不少关于计算机图形软件研究开发的课题,其中,二维交互绘图系统已进入商品化阶段,并可以与国内市场上和美国Autodesk公司的AutoCAD软件相媲美。与计算机图形学有关的学术活动在我国也很活跃。在计算机学会、工程图学学会、自动化学会、电子学会等国家一级学会下面都设有与计算机图形学有关的二级分会,并定期(一般是两年一次)举办全国性的学术会议,其中,计算机学会和工程图学学会每两年分别举办一次与计算机图形学有关的国际会议。在我国也有好几种与计算机图形学有关的学术刊物,如《计算机辅助设计与图形学学报》、《工程图学学报》和《计算机辅助工程》等。

数字图像处理的最早应用是在报纸业,早在20世纪20年代,人们将图片进行编码,然后利用跨大西洋的海底电缆将数据从伦敦传往纽约,在接收端利用特殊的打印机重现图像。数字图像处理的历史和数字计算机的发展密切相关,在基于冯·诺依曼体系的计算机发展起来以后,数字图像处理的系统研究也在20世纪50年代随之起步。1964年美国喷气推进实验室(JPL)使用数字计算机对“旅行者7号”卫星传送的月球照片进行处理,校正各种类型的图像畸变,得到了清晰逼真的图像,这是图像处理发展的重要里程碑。此后,数字图像处理技术在空间研究一直得到了广泛的应用,除此以外,在医学图像、地球遥感监测、天文学等领域这门技术也得到了运用,并取得了显著成果。到20世纪70年代初,由于大量的研究和应用,数字图像处理虽然其本质是一种二维信号处理,但是它已经具有自己的技术特色并形成了较完善的学科体系,从而成为一门独立的新学科。近20年来,数字图像处理技术发展更为深入、广泛和迅速,这主要是各个领域对图像处理提出越来越高的要求以及相关学科的发展所致。图像处理技术在深度和广度两个方面都不断深化和拓展,许多新理论、新技术、新应用都不断地加入到数字图像处理的领域。现在,人们已经充分认识到数字图像处理是认识世界、改造世界的重要手段。

1.3 图形图像处理的研究内容

1.3.1 图形图像处理的主要研究内容

图形图像处理的研究内容主要在于和人类视觉密切相关的各个方面,其理论与技术涉及众多的学科,如数学、物理学、信号处理、控制论、模式识别、人工智能、生物学、神经心理学、计算机科学与技术等,它是一门兼具交叉性和开放性的学科。图形图像处理所涉及的知识门类多样,具体的方法种类繁多,应用也极为广泛,但从主要研究内容上可以分为以下几个方面。

1. 图形输入技术

图形输入技术主要研究如何让用户自然流畅地将表示对象的图形输入到计算机中,实现用户对物体及其图像的内容、结构及其呈现形式的控制。这个技术的核心是人机接口(Human Computer Interface,HCI),尤其是图形用户界面(Graphic User Interface,GUI)技术,以WIMP(window、icon、menu和point)为特征及触觉输入(haptic input,如触摸屏)式的图形用户界面是目前最普遍的用户图形输入方式,手绘草图/笔迹输入(sketch-based/calligraphic interface)、多模式用户界面(multimodal user interface)和基于图像的绘制(image-based rendering)正成为图形输入的新方式。

2. 图形建模技术

图形建模技术主要研究在计算机内如何表示和存储图形,即对象建模技术。线架模型(wire frame modeling)、面片模型(surface modeling)、实体模型(solid modeling)和特征模型(feature modeling)等是目前计算机图形系统中最常用的。但这些模型主要用于可用欧氏几何方法来描述的形状,对于诸如山、水、草、树、云、烟、水等不规则对象,其造型需要非流形模型(non-manifold modeling)、分形模型(fractal modeling)、纹理映射(tex-ture mapping)、粒子系统和基于物理造型等技术。

3. 图形处理和输出技术

图形处理和输出技术主要研究在显示设备上如何“逼真”地显示图形。这种技术一般包括生成处理(如图元扫描和填充)、操作处理(如图形变换、投影和裁剪)以及效果处理(如线面消隐、光照等,尤其是真实感图形显示技术)。同时,在图形处理中也融入了一些图像处理的技术,其目的就是为了改善图形显示质量,例如,反锯齿(anti-aliasing)便是最典型的图像处理技术。

4. 图形应用技术

图形应用技术的范围十分广泛,既包括计算机图形软件包的设计开发技术及图形标准的建立等;还包括计算机动画、计算机辅助设计与制造、计算机辅助工程、可视化和体视化技术、虚拟现实技术等大量在多个领域的应用技术。

5. 图像数字化

图像数字化是将模拟形式的图像通过数字化设备变为数字计算机可用的离散的图像数据。它主要包括取样技术和量化技术。

6. 图像变换

为了便于后续的工作,需要进行图像变换以改变图像的表示域和表示数据。它主要包括傅里叶变换、余弦变换、沃尔什-哈达玛变换、奇异值分解、KL变换等。

7. 图像增强

图像增强是一种以改善人们的视觉效果,或便于人或计算机分析、理解图像内容为主要目的的改善图像质量的方法。它主要包括对比度增强、直方图修正、平滑、锐化、同态滤波、几何校正、伪彩色假彩色、图像间的算术运算等。

8. 图像恢复

图像恢复是指对失真的图像进行处理,使处理后的图像尽量接近原始未失真的图像。它主要包括对降质模型的分析、对降质系统参数的确定、频域恢复方法、空域恢复方法、约束或无约束的最小二乘估计、线性或非线性的均方估计,最大熵恢复、代数方法恢复、运动模糊恢复、盲恢复等内容和手段。

9. 图像分割

图像分割是指根据选定的特征将图像划分成若干个有意义的部分,从而使原图像在内容表达上更为简单明了,为后续图像分析和理解打下基础。它主要包括基于区域的分割法、基于边界的分割法、匹配检测分割、基于模式识别的分割法、基于视觉特性检测法等多种方法。

10. 图像分析与描述

这一层次的工作是对已分割的或正在分割的图像中各部分的属性及各部分之间关系的表述。主要研究的技术包括图像的统计特征描述、曲线描述、区域描述、纹理特征表示、图像关系描述等。

11. 图像数据压缩

图像数据压缩主要是为了消除图像在空间上、时间上或内容上的冗余性,以利于传输和存储,其表现就是减少图像数据量,将一个大的数据文件转换成较小的同性质的文件。它的研究内容主要包括轮廓编码压缩、行程编码压缩、预测误差编码压缩、正交变换编码压缩等相关技术。

12. 图像重建

图像重建是由一种由目标某一剖面的一维投影曲线重构该剖面二维图像的技术,包括以下主要研究内容:离散图像的傅氏变换重建法、卷积逆投影法、扇形投影的滤波逆投影法、代数重建法。

1.3.2 图形图像处理与相关学科的联系与区别

图形图像处理实质上包含了计算机图形学和数字图像处理两个学科的内容,从它们研究的对象上看,主要是关于图像和数据模型这两种不同的对象。而与图像处理和计算机图形学相关的一些其他学科,也同样是研究这两类对象,它们之间的联系如图1.1所示。计算机图形学主要研究从模型中生成图形图像的技术,而数字图像处理所讨论的问题中输入和输出两者均为图像。

图1.1 图形图像处理与相关学科的关系

1. 图形图像处理与计算机视觉和模式识别

计算机视觉和模式识别讨论对输入图像进行描述或者对图像进行归类的方法。它从图像开始,分析和识别输入图像并从中提取二维或三维的数据模型或特征,再将其变换到抽象的描述:一组数、一串符号或一个图(graph),这个描述通常比图形学数学模型更抽象,更富语义。例如,手写汉字的识别、机器人视觉系统、医疗自动诊断、遥感检测与分析等(如中央电视台天气预报的云图分析)。

计算机图形学是从给定几何基元如线、圆等的几何描述来生成图像;计算机视觉则是从图像中估计几何基元和其他特征。简单看来,计算机图形学与计算机视觉是互逆过程。这两个领域早期发展没有什么联系,但近年来发展越来越相近:计算机图形技术在视觉系统的人机交互和建模(曲线曲面表示)等过程中起很大的作用,某些图形可认为是图像分析结果的可视化;计算机真实感景物生成可看做是图像分析的逆过程,需使用计算机视觉技术,以便在计算机中建立逼真的图像模型。而基于图像的测绘、可视化和虚拟现实将两个领域紧密地结合在一起。

尤其需要注意的是,计算机视觉中存在许多不确定性,而图形图像处理面对的多是确定性问题,是通过数学途径可解决的问题,许多情况下需要在速度和精度(实时性和逼真度)之间取得某种妥协。

2. 图形图像处理与计算几何

计算几何着重讨论几何形体在计算机内的表示、分析和综合。它研究如何方便灵活地建立几何形体的数学模型,如何更好地存储和管理这些模型。它的主要研究内容包括:曲线曲面的表示、生成、拼接和造型,三维实体造型,散乱数据插值,计算复杂性研究等。因此,计算几何是对计算机图形学中的图形表示和建模的专业化研究和处理,可以这么认为,计算几何是计算机图形学中许多技术和方法的理论基础。

3. 图形图像处理与多媒体技术

多媒体技术也是信息技术领域的一个热点,尽管目前对多媒体技术的定义十分模糊,但是有一点是公认的:多媒体技术是作为文本、图形、图像、音频和视频等多种媒体的综合集成技术。显然,多媒体技术依赖于其构成的各种单一媒体的处理技术,因此,图形图像处理至少是多媒体技术中视觉信息处理的基础。实际上,从前面对研究内容的讨论可以看出:图形图像处理中同样包括对文本、视频、音频和图像处理及集成的研究。例如,合成图形(synthetic graphics)就可以将图形模型与外部视频及音频结合而生成新的图形,典型的应用是人脸动画(facial animation)、声音驱动的动画(voice-driven animation)等,而基于图像的绘制则是将图形建模和图像处理和识别紧密结合的最典型例子。随着网络技术的发展,大量信息的内容构成不可能缺少图形图像技术的支持,作为多媒体典型应用的基于内容的图像与视频检索技术(Content-Based Image and Video Retrieval,CBIVR),其难点在于感觉鸿沟(sensory gap)和语义鸿沟(semantic gap)。感觉鸿沟是指现实世界中的真实场景与计算机中的场景描述模型之间的差异;语义鸿沟是指用户对计算机描述的视觉模型的理解与用户直接对视觉场景的理解存在不一致性。实际上,这也正是计算机图形学和数字图像处理要解决的对象建模和真实感图形显示的核心问题。同时,图形信息与文本、图像、音频及视频结合的多媒体集成和多模式交互(multimodal user interac-tion)正是图形图像处理发展的一个重要方向。

总之,随着科学技术的发展和应用的不断深入,学科界限越来越模糊,各学科互相联系,覆盖面有所渗透和融合。例如,计算机图形学离不开曲线、曲面及实体造型技术;而几何造型系统又必须用到图形生成处理技术和图像处理技术;计算机视觉中的许多概念和方法来自于图像处理和图形学。在许多场合下,它们在概念上或实用中没有截然的界限,它们只是专业和应用背景不同的人使用不同的术语,各有侧重,但常常是互为补充。

尤其要注意的是,以图形图像信息的获取、传输、存储、变换、显示、理解与综合利用为核心的图形图像技术被认为是对人类思维活动最直接、最基本的模拟,图形图像技术的发展已从最初的纯数学变换形式向人类视觉认知规律的方向发展。实质上,图形图像技术与形象思维是相辅相成的,图形图像的处理、真实感图形显示、计算机动画生成、基于内容的图像和视频检索、图像理解和计算机视觉、虚拟现实、基于图像的绘制、三维模型重建等图形图像技术都包含着形象思维模拟的研究。图形图像技术在更高水平上的突破,尤其是与人工智能和视觉认知处理等结合的新理论、新技术和新算法将为形象思维模拟的研究提供更坚实的技术支撑。另外,形象思维研究的进展将为图形图像技术的深入研究提供新的起点。

1.4 图形图像处理系统的组成及其应用

1.4.1 图形图像处理系统的组成

图形图像处理系统是执行处理、分析、理解图形图像信息任务的计算机系统。尽管图形图像信息处理技术应用广泛,处理系统种类繁多,但它们的基本组成是相近的,主要包括五大部分:输入设备、输出设备、处理机、存储设备、交互设备。一个完善的人机交互图形图像处理系统的结构原理框图如图1.2所示。

图1.2 图形图像处理的系统结构原理框图

与系统的5个部分相对应,图形图像处理系统包括处理、存储、交互、输入和输出5个基本功能。

(1)处理功能:用来实现基本的图形图像处理应用,主要功能包括点、线(直线和曲线)、面(平面和曲面)的生成,图形的求交、分类,基本几何变换,光照模型、颜色模型的建立、干涉检测、图像变换、图像增强、图像恢复、图像分割等。

(2)存储功能:对图形图像数据进行存储,这些数据包括图像的物理数据、图形的几何数据、拓扑关系及属性信息,可以存放在内存中,也可以存于外存中。

(3)交互功能:人机交互设备实质上也是一种输入设备,只是其输入的是针对图形图像的控制信息,而非数据信息。用户可以在现场通过人机交互操作图形图像(增加、删除、修改、编辑等)以得到满意的设计效果。

(4)输入功能:在这里特指将图形图像的原始数据输入到计算机中,使得后续工作能够进行,这也是整个系统的数据获取端,通常需要经过由模拟到数字的转换。

(5)输出功能:将图形图像的设计结果或已经处理完毕的图形图像在输出设备上展示出来,供用户审视或修改。根据应用目的和输出设备的不同,常常采取不同的输出方式和输出算法。

1.4.2 典型图形图像处理应用软件

1. Illustrator

Adobe Illustrator是一个矢量图形设计软件,采用了基于Adobe公司专利的PostScript技术,主要用在专业的印刷出版领域。由于该产品与Adobe公司的其他产品如Photoshop、PageMaker、Acrobat等之间具有无可比拟的兼容性,所以成为创建矢量图形的首选工具。它可以创建复杂的艺术作品、技术图解、用于打印的图形和页面设计图样、多媒体以及网页等。

专业印刷级的Illustrator有较强的抗锯齿作用,任意缩放图形图像时也不会造成明显的边缘锯齿。其突出的优点还包括可以直接通过复制—粘贴方式,获得由文本编辑软件如Word等制作的文字和图形,并自动矢量化。例如,Illustrator可以帮助设计师用符号和创新的切割选项制作精美的网页图形,还可以用即时变形工具探索独特的创意,并能够高效地在网上、印刷品或在任何地方发布艺术作品。可以这么说,Illustrator规划了矢量图形的未来。

2. Freehand

Freehand是美国Macromedia公司推出的矢量绘图软件,利用它的绘图工具,能够画出纯线条的美术作品和光滑的设计图。它的原理是通过矢量所定义的直线和曲线来组成图形,并根据图形的几何特性对其进行描述。矢量图形的基本组成元素是点和路径。这样的图形,无论将其移动、缩放、旋转、镜像,还是更改颜色,图形的边缘都是光滑的。Freehand除了能设计平面图形外,还可以制作Flash动画。Freehand作为矢量绘图工具,广泛应用于网页制作。

Freehand的突出优势是程序体积小,运行速度快,并且随着近年来Macromedia公司的战略转移,PC版的Freehand与Flash、Dreamweaver、Fireworks等紧密协作,极大地扩展了Freehand的应用领域。目前,Freehand已经成为Macromedia Studio MX的重要组成部分。

3. Flash

Flash是Macromedia公司发布的网络动画创作工具。用它可以将音乐、声效、动画以及富有新意的界面融合在一起,以制作出高品质的网页动态效果。Flash动画的制作以帧为基本单位,考虑到网络传输速度的问题,该软件平台仅支持256色的图形图像显示。另外,Flash也支持交互性操作和编程,并在打包后可脱离开发平台运行,因此可用来制作一般的电子出版物。

Flash是交互式矢量图和Web动画的标准,可以制作Web导航、互动图片,被众多浏览器支持。网页设计者使用Flash创作出既漂亮又可改变尺寸的导航界面以及其他奇特的效果。它不但易学、易用,并且声色结合,是一种很有前途的网页制作工具。与其他工具相比,Flash具有矢量绘图、播放流畅、数据量小、色彩鲜明等特点,并可通过脚本交互,兼容性强、体积小、对系统要求也不高,所以一经推出,就立刻在网上风靡。在网上出版、多媒体制作和图形处理等方面做出了卓越的贡献。

Flash动画是当今世界火热的2D矢量动画工具,具有在现有Web页面上整合多媒体元素的功能,而在新版本中,Flash的功能进一步得到扩展,可以用它创建完整的动态站点,从内容显示到数据库连接以及视频调试,其整合多媒体编辑的能力,都满足网站标准。

4. Photoshop

Photoshop是一种非常优秀的彩色图形图像处理软件,也是目前最流行的平面设计软件之一。其软件设计优美、精炼,功能强大,广泛应用于印刷、广告设计、封面制作、网页图像制作和照片编辑等领域。

Photoshop自问世以来,在彩色出版领域引起了深刻的变革。运用Photoshop处理图像,灵活直观,所见即所得。由于在原稿编辑、修饰方面的重要作用更是使其成为计算机美工的必备工具。利用Photoshop大致可以完成三大类工作:图像编辑、创意设计和绘图。例如在效果图中,对渲染出的图像进行后期处理,即对色彩、尺寸等方面进行调整或制作阴影、人物、配景等。其软件的许多特点,如彼此独立而又可以交互影响的层、颜色通道与Alpha通道的灵活运用、丰富多彩的滤镜,都是其他图像处理软件所无法比拟的。

5. CorelDRAW

加拿大Corel公司在平面设计领域的地位是有目共睹的,该公司的旗舰产品Core-l DRAW是一种广泛应用于微机领域的图形设计软件包,是平面图形图像专业设计人员的常用软件。Corel公司的CorelDRAW与Illustrator和Freehand相比最大的优势在于CorelDRAW在同一个软件包中提供了全面的图形图像解决方案。在CorelDRAW的图形软件套装中,包含了三个主要的应用程序,分别是矢量绘图软件CorelDRAW、足以抗衡Photoshop的图像处理软件CorelPHOTOPAINT以及类似Flash的矢量动画制作软件CorelRAVE,因此组成了一个相当完备的数字平面设计工作室。不仅如此,Corel-DRAW还拥有非常人性化的用户界面,并具有良好的可操作性和易学易用的特点。

6. 3D Studio MAX

3D Studio MAX(3DS MAX)是美国AutoDesk公司著名的三维动画制作软件,具有先进的建模手段、完善的材质编辑模块、丰富的动画制作控制参数以及流行的光线跟踪算法渲染器。

3D Studio MAX功能强大、开放性好,对硬件的要求也不高,集建模、变形、组合、材质编辑、摄影灯光、场景设计、动作设计、影片剪辑和组合对象等功能于一体。内置工具丰富,而且修改方便,操作互动性好,质感与图形工作站几乎无异。它的捕捉功能使模型定位准确无误,强大的编辑修改功能使其能够处理更加复杂的模型,改进的灯光效果处理使输出的图像更加逼真。其动画文件的基本输出格式为AVI,所以必要时生成的三维动画还可输入到视频编辑软件中作进一步的加工修饰。缺点是技巧性要求高,有些功能如灯光效果不容易控制,想得到理想的效果会耗时较长。

3D Studio MAX应用范围极为广阔,是电子游戏开发商和影视动画制作商的必备软件,还广泛应用于城市规划、建筑设计、室内设计、机械设计、服装设计、工业设计、产品展示、广告宣传、造型设计、军事和医学等众多领域,是当今微机三维动画的常用软件。

3D Studio MAX支持多种平台,具有多线程运算能力,支持多处理器的并行运算、建模和动画能力,提供了材质编辑系统。

7. AutoCAD

AutoCAD是AutoDesk公司的著名产品,在工程领域应用广泛,主要用于二维平面制图,除了二维绘图,AutoCAD也可用于三维建模。作为通用图形软件,它可以直接用于绘图;作为支撑软件,可以在其上开发应用软件。Auto CAD主要的二次开发手段有AutoLISP、ADS及Object ARX。

AutoCAD类似于绘图所使用的铅笔、直尺、圆规、曲线板和橡皮擦,使人们能按自己的设想绘图,只是这一切都是在计算机上进行的。完成之后,通过绘图仪输出到图纸上或描图纸上。一般来说,用手工进行的绘图工作,均可用AutoCAD来进行。在我国的建筑领域,使用AutoCAD最多,也最为成功,其次是机械、电子、航空、航天、船舶以及汽车和其他工程领域,如城市规划设计等。

在建筑工程设计中,AutoCAD可以用来绘制各种专业工程图,从简单的建筑表现图到复杂的工程施工图纸,从一般的二维图形到表达空间关系的三维图形。AutoCAD具有完善的绘图功能、良好的操作特性、可定制的工作界面及菜单,深受广大设计人员欢迎。在工程设计初期,在建筑方案构思阶段,为了形象展现建筑全貌,可用AutoCAD绘制单体及群体建筑的三维图形,以便从不同方向、不同角度观看建筑,研究各部位之间的相互协调关系,分析其对环境和景观的影响等。在工程方案确定以后,这个阶段的图形文件还可以直接转换为平面设计图形,为后续各个阶段设计工作奠定基础和提供条件。

AutoCAD建模的优点在于尺寸具有极高的精确度,但过程比较复杂,修改起来也不如3D Studio MAX方便。所以进行实际效果图建模时,常采用在AutoCAD中建立二维平面图形,然后导入3D Studio MAX进行修改生成三维模型。这个软件具有简单易用、绘图精确等优点。新的版本中,绘图功能变得更加强大,操作更加灵活,共同作业功能也变得越来越方便;而且还提供了更多的行业模板,增强了在三维绘图方面的功能。

1.4.3 学科应用领域及其发展动向

图形图像处理作为一个新发展起来的学科,已经在科学计算和工程等领域得到了广泛的应用。特别是近十年间,随着硬件技术的飞速发展和软件技术的巨大进步,图形图像处理的应用领域得以大范围拓宽,它的应用已经发展到整个社会的每一个领域,直至家庭生活中。图形图像处理以它的形象逼真和直观具体且易为人们理解和接受,成为表达信息的最有效的手段之一。

Donald Hearn在其著作《Computer Graphics with OpenGL》中归纳了计算机图形学的应用领域,综合起来看,图形图像处理的应用领域主要包括以下各个方面。

1. 计算机辅助设计

计算机辅助设计(CAD)是以计算机图形学作为主要技术基础的支持设计应用的技术。CAD方法已经普遍地应用在建筑物、汽车、飞机、船舶与海洋工程、航天器、计算机、纺织品和服装等许多产品的设计过程中,如图1.3所示。

图1.3 计算机辅助设计示意图

CAD系统包括其硬件支撑环境和软件系统。其中,它的应用软件包可以支持不同的应用对象,CAD的应用不仅使得工程技术人员免去了终日伏在图板上画图的辛苦,使得设计工作变得轻松,而且图纸的生成质量和速度也有了很大的提高,底图保存在计算机中或刻录在光盘上,再也不必设立一个庞大的仓库来保存图纸了。

CAD的应用中还经常使用动画技术。在显示屏幕上出现的设计对象的动画,不但直观、形象,还可以让观察者能看清楚产品内部的结构、构件间的相对位置关系、甚至运动时的内部构件行为,可以有效地预测和解决空间干涉等设计过程中的棘手问题。在虚拟现实的环境中使用动画技术就“再现”了所设计对象的“真面目”,实现了产品设计过程中的仿真。所有这些技术的采用不仅使设计人员在制造出该产品的实物之前就已经看到了它,而且还能够为产品生产自动化提供支持。例如,产品的外形信息可为机床加工制造时规划加工路径使用,使设计过程与工艺规划过程连通,实现了CAD与CAM的信息集成。

CAD应用于建筑设计,除了完成它的二维工程图之外,它具有真实感的显示可使建筑师和用户直接看到该建筑物的外貌,一个逼真的模拟效果图。采用虚拟现实技术,还可让人们一个房间接一个房间地参观,以考察其设计的效果,甚至可以模拟三维的室内布局、装潢和照明效果等。

在轻纺工业领域,对纺织品的织纹设计、织物的图案设计、地毯图案设计和服装设计等也都开始采用CAD技术。CAD技术的采用减轻了设计人员的劳动强度,加快了设计速度,提高了设计质量,缩短了产品上市时间,从而提高了产品竞争力。

2. 图示图形学

图示图形学(presentation graphics)是图形图像处理的另一个主要应用领域,它主要是用来生成报告的插图或透明胶片和幻灯片,使各类报告、公告等的各种归纳、总结、统计和分析信息实现图示化。例如,将统计分析结果用条形图、饼图或折线图等形式表示出来,如图1.4所示。特别是三维显示图形的采用,不仅使图示效果更加形象生动,而且还可以表示更复杂的数据关系。

图1.4 统计数据的三维图形显示效果

3. 计算机艺术

图形图像处理在计算机艺术(computer art)中也开始发挥作用,它主要应用于美术创作和实用艺术之中。美术工作者利用计算机提供的功能在屏幕上创作他们的美术作品,已经有美术字生成软件、中国画绘制工具软件及西洋画绘制工具等许多美术创作软件问世。美术工作者利用这些软件,特别是结合一些数学函数软件包、三维建模软件包和分形几何软件包的应用,可以创造出许多人们意想不到的美术作品,产生出人意料的效果,如图1.5所示。

图1.5 利用分形技术产生的艺术图形

商用美术采用动画、虚拟现实等技术来制作产品的模拟照片,绘制产品的图片,制作商标和广告等,不仅对产品的描绘栩栩如生,而且能产生如同电影一样的三维动画效果,在计算机上拍动画广告要比在实景现场拍广告便捷得多,况且有些广告中的场景是现实中并不存在的“虚幻世界”,只有计算机才能够“制作”出来。

4. 娱乐

图形图像处理技术也越来越多地走进娱乐圈,常用于制作动画片、电视片、音乐录像片,甚至故事片、电影等。

利用计算机动画技术生产电影,使角色造型、色彩搭配和角色运动路径规划等环节的设计变得更容易。计算机动画技术还运用于故事片的制作过程,将图形场景与演员及实际场景混合显示,制造出“半真半假”的场面来,特别是对电影特技的处理,更有其优势,如图1.6所示,图形图像处理技术为电影制作开辟了一条新路。

图1.6 电影“最终幻想”中计算机生成的画面

音乐录像片的制作以各种不同的方式使用图形图像技术。图形对象可以与图像实景混合,产生一种特殊的效果,图形对象也可以与演员同台合唱,还可采用图像处理的方法来产生所需的特技效果等。电视片、电影片制作中所采用的图形技术,在这里都可应用。

另外,电子游戏机之所以对人们有如此大的吸引力,利用图形技术所产生的生动画面是功不可没的。

5. 教育与培训

利用图形图像处理技术可以将许多抽象的事物以图的形式展示给人们,从而在教学上得到了广泛的应用。采用该项技术做成教学辅助工具使学生理解和掌握相关技术变得比较容易。教师们可以利用计算机动画来说明诸如计算机内的控制流和数据流的流动情况、分子的内部结构、机械传动装置的工作原理、外科手术过程和天体运动规律等。

训练模拟器是为专业训练而专门设计的计算机图形图像系统,如训练飞行员的飞行训练模拟器,如图1.7所示,训练船员的舰船训练模拟器,训练汽车驾驶员的汽车训练模拟器,训练核电站操作人员的核装置训练模拟器等,都是这样的一些专用系统。利用飞行训练模拟器可以使受训人员坐在模拟训练舱内,面对显示屏幕上的视景来演练控制飞机起飞和降落的过程。经过数十小时的模拟训练,飞行学员试飞的成功率将会大幅度提高,而且还节省了燃油,又不需占用飞机、机场等昂贵资源。这些技术对于宇航员的航天训练更显现出其优越性。

图1.7 飞行训练模拟器

广泛采用汽车训练模拟器,可大大缩短汽车驾驶员的训练周期,又可用来考察紧急情况下驾驶员的行为特点,根据驾驶员的反应规律来优化汽车设计,以进一步提高汽车的安全性。

6. 可视化

科研、工程、商业及社会的各行各业都在产生着大量的数据,对这些数据进行收集和处理,从而获得有价值的信息,是一项繁杂的工作,如果能够将这些数据转换成可视形式,那么这些数据间的关系、变化趋势和模式就显得清晰、直观了。数据的可视化(visualization)给人们分析数据和理解数据提供了方便。为科学计算、工程和化学分析等的数据集或过程而生成的图形表示通常称为科学计算可视化(scientific visualization);为工业、商业、金融和其他非科学计算领域的数据可视化通常称作商用可视化(business visualization)。

可视化技术有着广泛的用途,它可以用彩色的图像来表示飞行器表面的气流形态(如图1.8所示)、航海器产生的湍流等。三维实体图形还可以表示高分子结构模型、空气污染模型和金属断裂模型等。在统计分析过程中,更是常用直方图、曲线图和饼图等图式来表示其结果。

图1.8 流经航天飞机表面的气流可视化效果图

7. 医学

大家所熟知的CT(computer tomography)即计算机X射线断层造影就是图形学和图像处理相结合的产物。首先采用X射线获取人体器官的各断层影像,采用图像处理技术对器官的改变区域进行边界跟踪,再采用图形学算法进行三维恢复,以确定病变部位的三维形态。医学影像学中还采用超声波和核磁医学扫描仪等设备来获取数据,后续的数据处理也都采用了图形学和图像处理技术。如图1.9所示,这是一张X光图片,从中可以清晰地看出固定胫骨的钢板和钢钉。在医学上还使用这些技术来建模和研究物理功能,以设计人工肢体,制订手术方案和开展手术模拟训练等,这种计算机辅助手术(computer aided surgery)系统将会在临床与研究上得到广泛的应用。利用虚拟现实技术生成的人体解剖模型可供医学院校的学生学习人体解剖学,学习外科的手术过程及开展科研工作。

图1.9 医学X光影像图

8. 图形用户接口

图形用户接口(graphical user interfaces)在软件设计中得到了普遍应用。图形用户接口的主体部分是一个允许用户显示多个窗口区域(视区)的窗口管理程序。各窗口可以获得图形的或非图形的显示。这种窗口功能对于人机交互过程是不可缺少的,特别是图形用户接口,为用户提供了直观和易于理解与接受的人机界面,缩短了计算机与用户的距离。

习题一

1.解释下列概念:

(1)图形;(2)图像;(3)计算机图形学;(4)数字图像处理。

2.分析图形和图像这两个概念的联系与区别。

3.计算机图形学的主要研究内容是什么?

4.数字图像处理的主要研究内容是什么?

5.图形图像处理与相关学科的关系如何?

6.简述图形图像处理的发展方向和热点研究领域。

7.结合Windows的使用,谈谈你对图形用户接口的体会。

8.列举日常生活中图形图像处理应用的实例。