人工智能的未来
上QQ阅读APP看书,第一时间看更新

自联想和恒常性

我在第2章曾讨论过,怎样在整个模式并不完整且又被扭曲的情况下识别出一个模式。第一项能力叫作自联想(autoassociation):将一个模式与其自身的某一部分联系起来的能力。模式识别器的结构本来就支持这项能力。

来自低层级模式识别器的每个输入都流向一个高层级模式识别器,每个联结关系有一个“权重”,来表示模式中特定因素的重要性。因此,模式中的因素越重要,在考虑该模式是否应该触发进行“识别”时所占的权重就越大。林肯的胡须、猫王的鬓角和爱因斯坦著名的伸舌头动作等,可能在我们认识这些标志性人物面容的模式中占很大权重。模式识别器计算概率时会考虑到权重参数。因此,如果一个或更多的元素缺失,总概率就会变低,尽管仍然可能达到阈值。就像我指出的那样,总概率的计算(模式出现)比简单计算加权和要复杂得多,因为还要考虑数值大小参数。

如果模式识别器接收到了来自高层级模式识别器的信号——该模式是“预期的”,那么阈值就会有效降低(即使之易于完成)。或者,这样一个信号只是被简单地添加到加权输入总量当中,这样就可以补偿缺失的因素。这在每个层级都会发生,即一个模式便有多个特征缺失(例如一张脸与底层相距多个层级),也可以被识别。

在多个方面发生改变的情况下仍能识别模式的能力称为特征恒常性(feature invariance),主要有4个处理方法。第一个方法是在大脑新皮质在接收到感觉数据之前先对其进行整体变换。我们将在后文专门讨论来自眼睛、耳朵以及皮肤的感觉数据的传递过程。

第二个方法利用了皮质模式记忆中的冗余。我们获得了针对每个模式的许多不同视角和观点,特别是对于重要的事项。因此许多变化都是分别存储和处理的。

第三个方法是合并两个列表。一个列表有一组我们已习得的变换,我们也许会将之应用到某一列模式当中。另外,皮质也可能会将这列可能的改变应用到另一个模式。这就是我们对隐喻和明喻这类语言现象的理解方式。例如,我已认识到某些音位(语言的基本音)在口语中也许会缺失,例如“goin”。如果我们认识一个口语新词,例如“driving”,即便它的一个音位缺失,我们也能识别该词语。尽管之前从未见过该词语的这一形式,但我们已熟悉某些音位缺失的现象。此外,我们也许了解某些艺术家喜欢强调(通过放大)一张脸的某些元素,例如鼻子。所以虽然这张脸经过了这种修饰,而且即使我们之前并未见过,我们仍能识别出熟悉的那张脸。特定的艺术修饰注重特别的特征,而这些特征能被基于模式识别的大脑新皮质识别。正如前面提到过的那样,这恰恰就是讽刺画的基础。

第四个方法源于大小参数,借助于这些参数,单个模块可以包容多个模式实例。例如,我们听到过单词“steep”很多次。正在识别这个口语词的特定模式识别模块能编码多个实例,因为[E]的发音持续时间发生变化的可能性很大。如果所有的词语(包含[E])模块都有相似的现象,这种变化就能在[E]自身的模块中被编码。可是,包含[E](或其他音位)的不同单词会有不同程度的预期可变性。例如,单词“peak”就不可能有像“steep”那样拉长的[E]音位。