自制AI图像搜索引擎
上QQ阅读APP看书,第一时间看更新

大约十年前的某一天,我正徜徉在互联网的世界里,忽然一个名叫“TinEye”的图像搜索引擎网站映入我的眼帘。我满怀憧憬地在那个网站中上传了一幅图片,它很快搜索并返回了许多这幅图片在互联网中不同URL上的结果。我接着尝试上传了另一幅图片,一会儿它又返回了许多近似这幅图片的结果,很显然,结果中的很多图片是在同一幅图像上修改的。面对如此准确和令人惊艳的结果,我不禁脑洞大开、浮想联翩,构思着一个个可以运用该技术实现的奇思妙想。猛然间,我觉得心中产生了一股强大的力量——我要弄懂它背后的技术原理。

为了彻底弄清楚这类图像搜索引擎的技术原理,我反复查找和阅读当时互联网上甚为稀缺的相关资料,但收效甚微。直到后来,我遇到了一个叫作LIRE的开源项目,它让我初步理解了图像搜索引擎的技术原理。但是在实际应用中,LIRE的效果并不是太好。为了解决这个问题,我又找到“深度学习”这个强有力的助手。在探索原理的过程中,我发现国内几乎找不到一本介绍图像搜索引擎基本原理和实现的书,这也成了本书诞生的缘由。

基于内容的图像检索技术自20世纪90年代提出以来,得到了迅速的发展。研究人员提出了不同的理论和方法,其中具有代表性的是SIFT、词袋模型、矢量量化、倒排索引、局部敏感散列、卷积神经网络,等等。与此同时,产业界也推出了许多实用的图像搜索引擎,比如TinEye、谷歌图像搜索、百度图像搜索和以淘宝为代表的垂直领域图像搜索引擎。但是到目前为止,此项技术还远未完全成熟,还有许多问题需要解决,改进和提高的空间还很大。搜索的结果和用户的期望还有一些距离,存在一定的图像语义鸿沟。这也是从事这项技术研究与开发的人员不断进步的源动力。

希望本书的出版能够在一定程度上缓解图像搜索引擎资料稀少的现状,并能够吸引和帮助更多的技术人员关注并研究图像检索技术。

明恒毅

2018年11月