新科学核心素养套装(全十册)
上QQ阅读APP看书,第一时间看更新

透视互联网

1.网络变成了一个巨大的信息生态系统,能用来定量地检测关于人类行为和社会性互动作用的理论。

2.在《人人都该懂的互联网思维》这本书中,我将提供网络上显现的若干定律,以及它们对理解某些社会现象、设计更好的信息访问机制的影响。

3.网络浏览体现出了一种模式,揭示了人们在寻找信息时呈现出的一种规律,以及如何将这些认识转变成设计更好网站的方法。同样,我也希望传达对于研究大规模社会动力学的方法的感受,它源于我们研究互联网现象的实践,这些实践在信息时代为我们研究社会行为提供了一个全新的途径。

在加州旧金山风景如画的普雷西迪奥区(Presidio)的一栋小楼里,一群人做了一件意义非凡的工作——这大概发生在1996年,是类似某种规模庞大的生态调查,但他们不需要离开自己的办公桌。计算机工作站中的一个程序在互联网的疆域里“爬行”原文为“crawl”,被用来形象地描述一个程序从网上不断获取网页的行为,它的直译是“爬行”,表示该程序顺着网页中的超链接,递进地获得一篇篇网页的过程。这个程序叫“crawler”或“爬取器”,也叫“爬虫”。——译者注,源源不断地为这群互联网档案馆(Internet Archive)的工作人员抓取网页,并将其存储起来。为了未来的研究,这群工作人员要收集并存储整个网络上的文本内容,从硅谷的网站到遥远的地球另一面的服务器上的网页。在某种意义上,他们不仅像生态学家,而且也在构造一个图书馆,其规模不久就要使世界上那些非常大的图书馆,如美国国会图书馆或法国国家图书馆,相形见“小”了。到2000年7月,他们已经收集了10亿个网页,占33.5TB(万亿字节)的存储空间,并且其收藏的规模在以每月10%的速度增长。北京大学网络实验室从2001年开始了类似的工作,到2009年已经搜集了30多亿个中国网站上的网页,获得的数据超过50TB,并且以每天约200万个网页的速度增长。——译者注为了理解这个收藏的规模,我们可以和书籍做个对比。一本书的文字内容经数字化后对应的数据量约为1MB(兆字节),1TB约等于100万MB,美国国会图书馆中有2000万册书,数据规模大约是20TB(而且不包括图片)。

欢迎来到终身学习的知识时代

尽管网络的规模及其增长速度是惊人的,但存储它的内容并不需要一个很大的建筑物。不同于那些古老的机构,比如位于纽约的美国自然历史博物馆或者伦敦的大英博物馆,互联网档案馆以一个冰箱大小的服务器就能将这些馆藏的内容存储其中。我们现在还不清楚整个档案最终会有多少,也不清楚有多少目前在网上看得见的东西几年后依然存在。建立互联网档案馆的目的,是将这种容易流逝的数据保存到一个永久的介质中,为未来做研究用。建立此项目的人认为,科学家、历史学家,以及新闻记者等都会对这样的研究感兴趣。因此,当人们想查询这些被收藏起来的数据时,就不需要专门到普雷西迪奥区这样一个美丽的地方,只要有合适的授权,人们就可以通过世界上任何一台计算机浏览它们。

欢迎来到信息时代,这是一个几乎不用任何代价就可以获取多样性知识的时代。那些电子信息正在从价值上取代传统工业生产出来的物品,用来体现国家、组织和个人的财富。网络信息空间已经给生活在地球上的人们带来了无与伦比的奇观。

互联网档案馆的工作人员并不是在孤军奋战。在美国,波士顿大学计算机科学系的一群研究人员在从事一项活动,从某种意义上来说,这项活动正好与互联网档案馆的工作互补。前者的主要工作是,通过在一些网络浏览器中安插某种监测程序,记录用户访问过的网站和停留的时长等。他们试图通过分析人们在网上寻找信息的行为规律,从中总结出一种使用模式,指导人们设计出更好的网站。其他相关的活动还有许多,比如一些科学家对网络内容及其结构的研究,他们对此表现出来的强烈兴趣与生物学家对热带雨林的兴趣不相上下。在美国新泽西州,位于普林斯顿的NEC实验室(Nippon Electric Company Labs)的研究人员在对网络上的内容进行抽样调查,希望能明确它的规模,并确定总共有多少内容能被人们常用的搜索引擎罗列出来。结论是,其实并不多。

从普雷西迪奥往南行驶几公里,在环绕斯坦福大学的山丘上,帕洛阿尔托研究中心(PARC)互联网研究组的科学家正在好奇地探究和分析一个巨大的网络资源数据库。他们通过综合利用互联网档案馆和许多其他来源的数据,揭示了在过去3年里网络中存在若干隐形的模式,这些模式反映了人们在信息空间中交流和寻找信息的方式。除他们之外,其他研究人员也发现了一些模式,既令人惊奇,也十分有趣。比如,他们已经发现每个网站中的网页数和网页中的链接数的分布显现出一种普遍的、规律性很强的现象,即少数网站有许多网页,而许多网站只有少量网页。同样,我们也已经了解到,由网民在网上造成的堵塞能引发一种可预测的“互联网风暴”,它会突然出现,并以一种带有统计学意味的模式消退。

这些结果之所以令人感到惊奇是因为,人们以前看到网络是以混沌无序的方式生长的,没有想到其中会有什么规律。在网络中,没有中央规划者告诉互联网用户如何设计网站、寻找信息,或者如何组织可以从一个网页或网站跳转到另一个的超链接。网络的结构和内容是千百万人自发行动汇聚产生的结果,他们很少会意识到,在他们的网站中添加一个网页或链接会对全局造成什么影响。于是,随着对互联网研究的深入,人们自然就会期望发现一种没有任何特征可言的网络,而不是现在所发现的规律性很强的行为现象。

有意思的是,这些很强的规律性与它们的来源有关,这一现象也影响了解释它们的方式。我们不仅可以利用这些有规律的模式来设计更好的网站,或者设计应对网络堵塞的策略,而且通过适当地考虑网络用户和网页设计者的行为机制网络用户的行为是形成那些有规律的模式的基本根源。——译者注,我们可以提炼出能够解释这些模式的理论。随着这些理论的发展,将个人在网络上的行为与网络的累积效应关联起来,就得出了一些在网络之外也适用的社会机制。它们通过一些定律表现出来,解释了人们如何浏览互联网,如何通过一种堵塞模式相互影响,以及如何判定既定网站的流行程度。从这种视角来看,网络变成了一个巨大的信息生态系统,能用来定量地检测关于人类行为和社会性互动作用的理论。

每条定律,都是一次互联网风暴

在《人人都该懂的互联网思维》这本书中,我将提供网络上显现的若干定律,以及它们对理解某些社会现象、设计更好的信息访问机制的影响。通过这些定律,我会解释获得这些理论的方法,它们提供了一种理解社会动力学中复杂问题的新方式。理论的原始形式是通过数学语言描述的,因而有比较精确的结论,但在本书中,我会用平实的语言解释核心思想,这样更容易被广泛的读者接受。

在揭示这些定律的同时,我也希望阐述一种方法——它在解释局部性质或个体行为,以及它们在相互作用时所产生的聚集效果之间的关系中被证明是成功的。这种方法最初是由物理学家发展起来的,他们当时希望理解某种物质的行为——该物质的存在形式是大量离散的粒子或者分子的集合。如果我们期望用这样的方法在人类寻找信息的过程中立即带来成效,那么就太天真了,但我们可以通过结合期望、效用和用户理性的观念来改善它,这就有望产生对人类行为的合理解释和预测,而且可以通过在网络上进行检测来验证。

预测本身是重要的,与许多动物和岩石等非生命体的不同之处在于,人类决定一个特定的行动路线时会考虑未来。一个生物体的存储结构越复杂,其考虑问题的视野所能达到的边界就越远。这意味着,任何涉及个人动态行为的研究,都必须考虑到我们每个人对未来事件做出的预测,尽管这些预测可能是不正确的。

从网站之间网页和链接的分布到“互联网风暴”,从上网模式到市场本质,这些都能够为我们提供一些知识,它们不仅本身有意思,还有益于信息的提供者和消费者。而且这些融入了用户上网模式的知识有助于人们设计出更好的网站,从而使用户能够更快、更可靠地访问信息。

在本书后面的章节里,我会阐述一些隐含的定律或法则,它们支配着网络的增长和结构的变化,以及链接关系的形成,然后说明我们如何用互联网来理解它与所关联的用户之间的相互作用。我将通过描述用户所面对的两难情形来阐释网络堵塞现象的形成、“互联网风暴”的不可避免性,以及构成它的密集小流量使网络减速的情形,也会谈及如何用这些知识来设计一种能较快访问网站的方法。网络浏览体现出了一种模式,揭示了人们在寻找信息时呈现出的一种规律,以及如何将这些认识转变成设计更好网站的方法。同样,我也希望传达对于研究大规模社会动力学的方法的感受,它源于我们研究互联网现象的实践,这些实践在信息时代为我们研究社会行为提供了一个全新的途径。