空间信息智能处理
上QQ阅读APP看书,第一时间看更新

2.3 结构模式识别

在汉字、指纹、连续语音等模式分类中,它们要求的特征量十分巨大;此类问题可以考虑采用结构模式识别法。结构模式识别法是用模式的基本组成元素(基元)及其相互间的结构关系,对模式进行描述和识别的方法。在多数情况下,可以有效地用形式语言理论中的文法表示模式的结构信息,因此也称为句法模式识别。结构模式识别着眼于对待识别对象的结构特征的描述,先把复杂模式分解为若干简单的子模式;再把子模式分解为若干基元,通过对基元的识别,进而识别子模式;最后识别复杂模式。

结构模式识别系统主要由预处理、模式描述和语法分析等三个部分组成,如图2.7所示。预处理阶段包括模式分割和基元抽取;模式描述是把面板模式的基元串与各类模式的基元串进行比较,按照预定的匹配准则实现分类;语法分析是判断输入模式是否由学习过程中所推断出来的文法产生的,因而是一个识别过程。

图2.7 结构模式识别系统

例如对某个矩形,可以考虑选图2.8(a)中所示的基元。若选取模式关系为“链接”,则可以用这四种基元表示图2.8(b)的矩形,其基元串为:aaabbcccdd.若用“+”表示“从头到尾的链接”,那么图2.8(b)的矩形可表示为a+a+a+b+b+c+c+c+d+d.

图2.8 矩形结构模式识别表示

对汉字的识别,可以首先根据汉字的结构进行分割操作,如图2.9所示。

图2.9 汉字的结构关系

在解决了基元选择问题后,接下来就要建立一种或几种文法,以产生一种或几种语言描述待试模式。到目前为止,设计者都是依据经验来设计所需的文法;常用的有串文法、扩展的串文法、阵列文法、树文法、网文法、图文法等。对串的识别可以采用自动机技术,它对输入字符串从左向右检查,每接受一个输入状态便右移一个单元,并改变一次状态,直到一个句子的全部符号输入结束。若所有的符号都能被接受,表明该句子是自动机能接受的语言。

结构模式识别大都被应用于遥感图像的识别、分析以及文字与纹理图像的识别领域。此方法的优势在于,对图像的处理或识别过程较为简便、可操作性强,且能够充分反映图像模式的结构特征,从而使人们了解该方法所描述模式的性质。同时,在图像处理过程中,对图像畸变具有较强的抗干扰能力,能确保处理精度。但需要说明的是,结构模式识别中的一个关键问题则是基元的正确选择,特别是在有噪声的情况下,抽取基元的难度也将进一步增加。基元抽取或选择出现偏差,则会导致文字识别、纹理图像分析等图像处理结果出现严重偏差。