数联网:大数据如何互联
上QQ阅读APP看书,第一时间看更新

|1.5 数联网与互联网的关系|

数联网是在互联网上的叠加网,故其基础仍旧是互联网。数联网改变的是互联网中上层的应用层次内容,构建虚拟的数联网层,完成数据的各种标准化工作,构建数联网的应用内容等。

1.5.1 数联网解决“数据+计算”的问题

互联网面向的是人类信息连接,解决的是物理连接问题;数联网则面向的是数据的连接,解决数据的互通问题,然后在数据连接的基础上,提供各种计算的能力。

数联网在解决数据的连接之后,会提供上层的计算能力,这些计算不仅是标准化的,而且是贴近应用的。

例如,一些大型企业在传统的计算模式中,需要先把数据从省里集中到总部,然后在总部进行集中计算。而有了数联网之后,计算就可以由总部控制,每个省先进行分布计算,然后将结果上传给总部即可。这避免了大量数据的搬移工作,提高了计算的效率。

1.5.2 互联网解决底层连接的问题

互联网是底层网络,已经连接了世界上的各种计算机,构建了最大的信息网络。其中每个有IP地址的计算节点(计算机、手机等)均存储着大量的数据,是数据的附着点。互联网已经将这些终端在物理上连接起来,但这些节点的数据标准化程度不高,语言、文字不通,数据的语义仍难以被理解。

1.5.3 数联网解决数据互通的问题

数据的内容千千万万,数联网首先要解决数据的连通问题。就像构筑一条高速公路一样,数据的连通首先连接彼此的数据池,然后解决数据的标准表述问题,之后在之上构筑标准的数据应用。

数联网就是要解决数据的标准协议、数据解读等问题。数联网要提供标准的应用接口,开发出一些标准的业务应用,解决分布计算等问题。

1.5.4 数联网是互联网的升华

数联网建立在互联网基础之上,就像牛顿当年的描述:“站在巨人的肩膀上”。数联网是在互联网之上的升华!是互联网在数据领域应用的结晶!

数联网借助互联网的高速公路设施,可以大展身手,产生更多的应用模式。如果没有互联网,数联网也就是无本之木,无处发力,如图1-15所示。

图1-15 数联网从数据的连接开始

例如,互联网通过“爬虫”技术,可以获取网络上关键词的一些链接位置,用户据此可以去互联网上寻找自己所需的信息。数联网可以借鉴这种模式,产生新的数据“爬虫”,据此完成数据的寻址工作。这些数据可能存放在不同的数据仓库中,也可能存放在不同的Hadoop文件中,但这些语义要进行标准化,并进行互通。

1.5.4.1 从面向连接的二进制数据开始

互联网是底层的网络,传输的是二进制数据。这些数据必须依靠上层的协议才能被解读。例如,IE浏览器借助HTTP可以解读底层的二进制数据,形成丰富多彩的网页,辅助用户读取互联网信息。

同样地,数联网中也会传送这些二进制数据,但在应用侧,其可以被解读成不同的数据格式,用于不同的内容。

1.5.4.2 从面向连接到面向信息处理的数据连接

数联网也可以提供很多应用工具,为用户提供各种数据分析应用。例如,用户可以使用用户离网分析模型,进行数据的分析工作,不用自己从头开始编写算法程序,这不仅提升了效率,还降低了开发成本。

1.5.5 数联网具有更大的市场价值

数联网完成的是数据的传输,而数据具有更大的经济效益。例如,某个上市公司的财报数据是公开的资料,通过数联网,用户可以从多个侧面了解该公司的真实数据情况。通过对该公司的数据进行血缘分析,用户可以了解该公司的上游企业分布情况,并侧面了解该公司的实际运营情况。如果上游企业的供货增加,证明该公司的库存加大;如果下游企业的产品需求数据增多,则证明该公司的销量增加。通过这些数据,用户可以判断该公司的经营情况是否正常。

这些数据对于判断该公司的真实市场经营情况具有重要意义。如果该公司经营情况不好,进行数据造假,用户则可以通过这些外围数据可判断数据的准确性,以此降低投资的风险,提升对企业运营情况的真实性的了解程度。

1.5.6 是互联网上的应用?还是另一种互联网(互联网2.0)

数联网目前是互联网上的叠加网,未来是否会替代互联网,成为下一代互联网的发展主干呢?当数联网发展到一定的阶段,是有这种可能性的。

互联网的架构,从创立之初到目前为止,基本没有大的体系变革。底层的TCP/IP也十分成熟,但站在数联网的角度,TCP不适合大数据量的传送,如果部分大数据中心之间使用UDP进行传输,那么未来是否会产生为了数联网数据传输的协议呢?这个仅是一个例子而已,其他的改进需求也会很多。

所以,当数联网的应用遍地开花之后,也可以反向提出一些互联网改造、升级的需求,从而促进互联网的发展。

1.5.7 数联网与语义网的关系

语义网是对未来网络的一个设想,现在与Web 3.0这一概念结合在一起,作为3.0网络时代的特征之一。简单地说,语义网是一种智能网络,它不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以使交流变得更有效率和价值,如图1-16所示。

图1-16 语义网的体系结构

语义网的核心是:通过给万维网上的文档(如HTML文档、XML文档)添加能够被计算机所理解的语义“元数据”,整个互联网成为一个通用的信息交换媒介。

我们由此可以看出,语义网是个终极目标,目前实现起来比较困难。

1.5.7.1 迈向语义网的中间产品

数联网不会一步达到语义网的目标要求,而要有个循序渐进的过程。数联网会用到部分语义网的要求,也会自带一定程度的语义,但是这种应用侧的要求不会在网络层实现。

数联网的语义靠自带的元数据进行解释,而这种元数据是可以让人读懂的,未来也可以达到语义网中机器解读的要求。

我们对语义网的构想比较宏大,会在网络底层就进行很多修订,甚至改动互联网的架构。而数联网作为叠加网,短期内不需要如此大的变动。

1.5.7.2 强调数据的互通为主,暂不考虑语义理解

与语义网相比,数联网中的语义是半解析式的,是建立在数据互通基础上的,借助技术元数据和业务元数据完成对语义的解释,这种解释不是面向机器的,而是面向人的,因此网络层面不用进行大的调整。

未来,如果数联网充分发展,那么其对于网络层面的语义解析需求也会被提上日程,这也许是数联网给传统互联网提出的升级要求之一。