SEO实战密码:60天网站流量提高20倍(第4版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.5.1 李彦宏超链分析专利

百度创始人李彦宏在回国创建百度之前,就是美国顶级的搜索引擎工程师之一。据说李彦宏在寻找风险投资时,投资人询问了其他三个搜索引擎业界的技术高人一个问题:要了解搜索引擎技术应该问谁?这三个被问到的高人中有两个回答:搜索引擎的事就问李彦宏。由此投资人断定李彦宏是最了解搜索引擎的人之一。

这其实就是现实生活中链接关系的应用:要判断哪个页面(人)最具权威性,不能光看页面(人)自己怎么说,还要看其他页面(人)怎么评价。

李彦宏在1997年就提交了一份名为“超链文件检索系统和方法(Hypertext document retrieval system and method)”的专利申请,这是非常具有前瞻性的研究工作,比Google的创始人发明PR值要早得多。在这份专利中,李彦宏提出了与传统信息检索系统不同的、基于链接的排名方法。

这个系统除了索引页面,还建立了一个链接词库,记录链接锚文字的一些相关信息,如锚文字中包含哪些关键词,发出链接的页面索引,包含特定锚文字的链接总数,包含特定关键词的链接都指向哪些页面等。词库不仅包含关键词原型,也包含同一个词干的其他衍生关键词。

根据这些链接数据,尤其是锚文字,计算出基于链接的文件相关性。在用户搜索时,将基于链接的相关性与基于关键词匹配的传统相关性综合使用,将得到更准确的排名。

在今天看来,这种基于链接的相关性计算是搜索引擎的常态,每个SEO人员都知道。但是在二十多年前,这无疑是非常创新的概念。当然现在的搜索引擎算法对链接的考虑,已经不仅仅是锚文字,实际上要复杂得多。

这份专利的所有人是李彦宏当时所在的公司,发明人是李彦宏。感兴趣的读者可以通过下面这个地址查看美国专利局发布的“超链文件检索系统和方法”专利详情:

http://patft.uspto.gov/netacgi/nph-Parser?patentnumber=5,920,859