
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.5.5 文档检索
文档检索的任务是根据用户的搜索文本提供满足用户搜索查询的文档。这方面最好的例子是我们每天都要进行多次的网络搜索。网络搜索是最为人熟知的文档检索示例,但文档检索方法也适用于在任意一组文档中查找信息,例如,文档可以是数据库或表单的文本字段。
文档检索基于用户查询文本和已有文档之间的良好匹配,因此需要同时分析用户的查询文本和文档。可以使用关键词搜索完成文档检索任务,但简单的关键词搜索容易出现两种错误。首先,查询中的关键词可能与文档中匹配的关键词有着不同的含义。例如,如果一个用户在寻找glasses,他需要的是戴在眼睛上的眼镜,而不是喝酒用的杯子(注意,眼镜和杯子在英文中都是glasses)。另一种错误是由于关键词不匹配而找不到相关结果。如果用户只使用了关键词glasses,就可能发生这种情况,即错过使用关键词spectacles或eyewear找到的结果,即使用户对这些结果感兴趣。使用NLP方法代替简单的关键词查找技术可以提供更准确的结果。