一本书读懂大数据(全彩图解版)
上QQ阅读APP看书,第一时间看更新

第1章 大数据时代:不可逆转的大趋势

全面认识大数据

随着网络的普及,“大数据”这个字眼在人们的视线中出现的频率越来越高。大数据给人们带来的神奇感,以及人们对大数据的追捧,让大数据在人们今后的商业领域、生活领域中的地位如芝麻开花一般。但是对于大多数人来说,对大数据的了解仅仅是皮毛而已,真正能将大数据在生活中应用自如的人还是少之又少的,因此对大数据的使用并没有达到路人皆知、人人皆用、人人会用的阶段。那么究竟什么是大数据呢?

简单来说,大数据实际上就是巨量资料的一种学术称谓,它具体指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

那么,这么一个“巨量资料”是凭借什么潜质,受到人们越来越多的追捧以及青睐呢?这还得归功于大数据的四大特点。我们将其简称为4V:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。

1.Volume(大量):到目前为止,人类所生产出来的全部印刷材料的数据总量为200PB(1TB=1024G,1PB=210TB,合43008000G),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB,合225792000G)。现在,个人计算机硬盘的容量一般为TB量级,某些大企业的数据量已经惊人地达到EB量级。

2.Velocity(高速):例如我们要存储1PB的数据,假设带宽(网速)能达到1G/s,电脑24小时不间断运行且容量足够,将其存入电脑需要12天完成。大数据通过云计算在短短的20分钟之内便可以完成。

3.Variety(多样):结构化数据和非结构化数据构成了数据的多样性。以往的结构化数据是以文本为主来对数据进行存储,现在的诸如音频、视频、图片、网络日志、地理位置信息、购物记录、搜索记录等非结构化数据越来越多。

4.Value(价值):如果我们能够合理利用数据,能够进行正确、准确的数据分析,那么它将会为我们带来很高的价值回报。在欧洲的一些发达国家,政府管理部门通过合理使用大数据,改进效率之后节约了超过14900亿美元的经费。

大数据在各大领域的使用中占得一席高地,它采用的是一种什么样的战略战术呢?事实上,大数据技术的战略意义并不仅仅局限于对庞大的数据信息的掌握,而在于对这些含有意义的数据进行专业化处理。简单来说,这好比是一种产业,要想使这种产业能够真正意义上带来盈利,那么如何提高对数据的“加工能力”并实现数据“增值”便是问题的关键。

除此之外,大数据还具有一大技术特色,它可以依托云计算分布式处理、分布式数据库和云存储、虚拟化技术,来对海量数据进行分布式挖掘。因此,大数据与云计算是密不可分的。值得注意的是,大数据在处理海量数据的时候必须用分布式架构,单台计算机是断然不能完成这样浩繁的工作的。