1.1 大数据的方圆之地
1.1.1 大数据:新要素的定义
从结绳计数到超大型计算机,从烽火传信到万物互联,数据信息利用程度见证了人类文明的发展,也必将照亮人类未来发展之路。现代管理学之父彼得·德鲁克在其著作《后资本主义社会》中预言:“知识将取代土地、劳动、资本与机器设备,成为最重要的生产因素。”信息化、数字化的发展正加速这一预言的实现。大数据作为信息化发展新阶段的必然产物和新的生产要素,在推动社会、经济等方面质量变革、效率变革、动力变革的基础性核心作用已成为共识,但对于其概念,始终存在多种理解和解释。
2001年,Gartner的分析师道格·莱尼首次给出了以数据量大、处理速度快和多样性为三个特征的大数据“3V”定义,并得到了当时的普遍认同。2012年,Gartner又对大数据的定义进一步完善,指出“大数据是大量、高速和/或多变的信息资产,它需要新型的处理方式来促成更强的决策能力、洞察力与最优化处理”。2008年Nature推出了大数据专刊,在学术界首次提出了大数据的概念,但未给出明确的定义。麦肯锡公司2011年在其报告《大数据:下一个创新、竞争和生产力的前沿》中认为:“大数据是指大小超出常规的数据库工具获取、存储、管理和分析能力的数据集合。”该定义更加突出数据的难以处理性,同时也强调并不是一定要超过某个具体数量的数据集才能算是大数据。
随着相关研究与应用的深入,越来越多的学者开始尝试在已有描述的基础上从技术处理、属性归纳、产业等角度诠释大数据。维克托·迈尔等编写的《大数据时代》一书中指出,大数据指不用随机分析法(抽样调查)等捷径,而是采用所有数据进行分析处理;吴军的《数学之美》一书也从数据所能发挥的作用和重要性的角度对大数据进行了描述;Facebook工程总监帕瑞克豪指出,大数据的意义在于具有能从数据中挖掘出对商业有价值的决策力和洞察力。表1-1中列举了部分研究机构、专家、政府等给出的大数据定义及相关解释。总的来说,大数据除了体量巨大,更重要的是需要云计算、人工智能等新技术处理后为决策力、洞察力和流程优化能力提供支撑,是一种分析能力、决策能力的体现。
表1-1 大数据相关定义及相关解释
续表