2 隐喻的相似性考察
关于隐喻的相似性,目前大家的看法基本一致:认为源域和目标域在语义上符合“同从异出”或“异中求同”的原则,即源域和目标域来自不同的概念域,同时源域和目标域在某一点上有相似性。其中源域和目标域的相似性是构成隐喻的认知基础,这种相似性就是通常所说的隐喻“喻底”。计算机隐喻理解的最终目的就是能够找到隐喻表达的喻底,为了和其他词语的相似性区分,本文把隐喻表达中源域和目标域的相似性称作“隐喻表达内部相似性”。图示如下:
我们能否根据隐喻内部相似性来进行隐喻推理?Xiaoxi Huang[5]尝试利用WordNet和HowNet的概念之间的反义、同义、上下位、部分-整体等多种语义关系来发现“律师是狐狸”这种隐喻表达的喻底。目前这种推理难度较大,原因在于隐喻表达中,无论是“n1是n2”还是“n1的n2”都是在强调源域和目标域的共同属性突显。例如,“律师是狐狸”突显了“律师”和“狐狸”的“狡猾”属性。
名词一般有多种属性,如果把名词n的各种属性组成一个集合,称之为n的属性集合,n1的属性集合和n2的属性集合有交集的时候,在这个交集上,n1和n2就有可能构成隐喻关系。以“知识的海洋”为例,名词“海洋”具有“辽阔、广博、无边、多、大”等多种属性特征,名词“知识”具有“丰富、富有、贫乏、多”等特征,“知识的海洋”突显了知识的“多、大”等属性。这里需要细致的名词与其属性特征的描述,而现有的语义资源提供的知识非常有限。WordNet名词语义关系提供了表示“属性关系”的指针。不过就它目前的“属性关系”的描述还很粗糙,覆盖面很小。笔者根据WordNet名词库、形容词库中的属性字段synset和word做了统计,得到名词词库有属性连接的word比例,如表1所示:
表1 名词库和形容词库的属性连接
synset表示名词词库中的同义词集合的数量,word表示名词词库中同义词集合中的词条数,调查表明名词库中只有0.59%的词语有表示属性关系的连接,这样小的比例还无法提供全面发现隐喻内部相似性的必要知识。因此根据隐喻表达的内部相似性来识别隐喻还有一定距离。
不同的隐喻表达之间源域或目标域也具有某种相似性,本文称作“隐喻外部相似性”。图示如下:
如果给定了隐喻表达1,就可以以其为原型,利用词语之间相似性推断出隐喻表达2,例如,知道了“玫瑰的海洋”是个隐喻表达,就可以根据这个原型推断出“蔷薇的海洋、玫瑰花的海洋、蔷薇花的海洋”也是隐喻表达。这是因为在人的经验中,“玫瑰、蔷薇、玫瑰花、蔷薇花”都是一种花,它们因为具有“花”的相似性可以进行同义替换。这种基于“同义或近义”的知识在中文概念词典(CCD)中得到了很好体现。“玫瑰、蔷薇、玫瑰花、蔷薇花”在CCD中被表述成下列形式。
玫瑰 [20]植物20_08920236
蔷薇 [20]植物20_08920236
玫瑰花 [20]植物20_08920236
蔷薇花 [20]植物20_08920236
以上四个词语来自同一个概念节点,它们共同属于【植物】这一语义大类。这些相似性的知识正好可以为计算机处理隐喻的扩展推理提供资源。
除此之外,对于不同的隐喻表达,有的可以说出它们的喻底,如“知识的海洋”“文化沙漠”一般可概括出知识的“多和广”,文化的“贫瘠”。有的须在上下文中仔细分析,例如:记忆的沙滩、生命的山脊、理想的风帆,但是人们为什么这么运用,也许是受民族文化背景的制约。最初的隐喻表达是一种创造,后来更多的是根据这些创造出来的原型进行某种类推,产生类似的表达。
因此目前比较可行的做法就是把难度高的隐喻理解部分先暂时交给人来完成,即通过语料的人工观察,发现隐喻表达的特点,通过人的世界知识把隐喻表达从大规模文本中剥离出来,建立隐喻表达和字面表达的分类,然后让计算机根据训练语料提供的信息进行识别,最后根据隐喻的外部相似性建立隐喻相关推理。