基于MATLAB的人工智能模式识别
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 模式识别的基本方法

模式识别方法(Pattern Recognition Method)是一种借助计算机对信息进行处理、分类的数学统计方法。应用模式识别方法的首要步骤是建立模式空间。所谓模式空间是指在考察一客观现象时影响目标的众多指标构成的多维空间。模式识别对多维空间中各种模式的分布特点进行分析,对模式空间进行划分,识别各种模式的聚类情况,从而做出判断或决策。分析方法需要利用“映射”和“逆映射”技术。映射是指将多维模式空间通过数学变换投影到二维平面,多维空间的所有模式(样本点)都投影在该平面内。在二维平面内,不同类别的模式分布在不同的区域,这些区域之间有较明显的分界域。由此确定优化方向并返回到多维空间(原始空间),得出真实信息,帮助人们找出规律或做出决策,指导实际工作或实验研究。

d维特征空间已经确定的前提下,讨论分类器设计问题,其实是一个选择什么准则、使用什么方法,并将已确定的d维特征空间划分成决策域的问题。针对不同的对象和不同的目的,可以用不同的模式识别理论或方法,目前基本的技术方法有统计模式识别、句法模式识别。

1.统计模式识别

统计模式识别是发展较早也比较成熟的一种方法。被识别的对象首先数字化,变换为适合计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识别系统在 数字化环节之后还要进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后再进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征,模式可用特征空间中的一个点或一个特征矢量表示。特征是选定的一种度量,它对一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此引入鉴别函数,由特征矢量计算出相应的各类别的鉴别函数值,通过鉴别函数值的比较实现分类。

统计模式识别方法适用于给定的有限数量样本集,其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征向量。不同的特征向量,或者不同类别的对象,都对应于此空间中的一点。在分类阶段,利用统计决策的原理对特征空间进行划分,从而达到识别不同特征对象的目的。在已知研究对象统计模型或已知判别函数类的条件下,根据一定的准则通过学习算法能够把d维特征空间划分为c个区域,每一个区域与每一类别相对应,模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定它所属的类别。统计识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。基于统计模式识别的方法有多种,通常较为有效,现已形成了完整的体系。尽管方法很多,但从根本上讲,都是直接利用各类的分布特征,即利用各类的概率分布函数、后验概率或隐含地利用上述概念进行分类识别。其中,基本的技术为聚类分析、判别类域界面法、统计判决等。

(1)聚类分析:在聚类分析中,利用待分类模式之间的“相似性”进行分类,更相似的作为一类,更不相似的作为另外一类。在分类过程中不断地计算所分划的各类的中心,下一个待分类模式以其与各类中心的距离为分类的准则。聚类准则的确定,基本上有两种方式。一种是试探方式,即凭直观和经验,针对实际问题定义一种相似性测度的阈值,然后按最近邻规则指定某些模式样本属于某一聚类类别。例如,欧氏距离测度,它反映样本间的近邻性,但当将一个样本分到两个类别中的一个时,必须规定一距离测度的阈值作为聚类的判别准则,按最近邻规则进行的简单试探法和最大最小聚类算法就采用了这种方式。另一种是聚类准则函数法,即规定一种准则函数,其函数值与样品的划分有关。取得极小值时,就认为得到了最佳划分。实际工作中采用最多的聚类方法之一是系统聚类法。它将模式样本按距离准则逐步聚类,类别由多到少,直到满足合适的分类要求为止。

(2)判别类域界面法:判别类域界面法中,用已知类别的训练样本产生判别函数,这相当于学习或训练。根据待分类模式判别函数所得值的正负来确定其类别。判别函数提供了相邻两类判决域的界面,最简单、最实用的判别函数是线性判别函数。利用线性判别函数进行决策就是用一个超平面对特征空间进行分割。超平面的方向由权向量决定,而位置由阈值权的数值确定,超平面把特征空间分割为两个决策区域。

(3)统计判决:在统计判决中,在一些分类识别准则下严格地按照概率统计理论导出各种判决准则,这些判决准则要用到各类的概率密度函数、先验概率或条件概率,即贝叶斯法则。

2.句法模式识别

句法模式识别是对统计模式识别的补充。统计模式识别方法用数值来描述图像特征,句法模式识别方法则用符号来描述图像特征。它模仿了语言学中句法的层次结构,采用分层描述的方法,其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。在句法模式识别方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法模式识别方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程即可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。

句法模式识别方法又称结构方法或语言学方法,主要用于文字识别、遥感图形识别与分析,以及纹理图像的分析。该方法的特点是识别方便,能够反映模式的结构特征,能够描述模式的性质,对图像畸变的抗干扰能力较强。如何选择基元是本方法的一个关键问题,尤其是当存在干扰及噪声时,抽取基元更困难,且易失误。把复杂图像分解为单层或多层的简单子图像,主要突出识别对象的结构信息。图像识别是从统计模式识别发展起来的,而句法模式识别扩大了识别的能力范围,使其不局限于对象物的分类,而且还用于景物的分析和物体结构的识别。

模式识别方法的选择取决于问题的性质。当被识别的对象极为复杂,而且包含丰富的结构信息时,一般采用句法模式识别,当被识别对象不很复杂或不含明显的结构信息时,一般采用统计模式识别。统计模式识别方法发展较早,比较成熟,取得了不少应用成果,能考虑干扰、噪声等影响,识别模式基元能力强;但是它对结构复杂的模式抽取特征困难,不能反映模式的结构特征,难以描述模式的性质,对模式本身的结构关系很少利用,难以从整体角度考虑识别问题。而很多识别问题,并不是用简单的分类就能解决的,更重要的是要弄清楚这些模式的结构关系。句法模式识别能反映模式的结构特性,识别方便,可从简单的基元开始,由简至繁描述模式的性质;但单纯的句法模式识别方法没有考虑模式所受环境、噪声干扰等不稳定因素的影响,当存在干扰及噪声时,抽取基元困难,且易失误。

在应用中,常常将这两种模式识别方法结合起来,分别施加在不同的层次上,会收到较好的效果。两者的结合已是模式识别问题的一个研究方向,如随机文法、属性文法等研究方向,并取得了一定的成果。