前言
人类步入信息化社会,得益于计算机技术、网络技术、通信技术和传感技术等的飞速发展,信息化建设已经渗透到各个行业。在信息化建设过程中,人们利用应用系统、移动App和传感器设备等积累了越来越多的行业数据,形成了大量结构化数据、半结构化数据和非结构化数据,记载了生产、分配、交换和消费的历史足迹,每一条数据都清晰地记录了某人或某物,在某一时刻,某一地方涉及的相关内容或产生的金额。
随着时间的不断推移,历史业务数据积累到了TB、PB甚至更高的量级,人们也逐渐意识到这些数据蕴藏着潜在的关联关系。与此同时,海量数据也给信息技术提出了前所未有的挑战,需要解决计算、存储、数据库和网络通信这4个瓶颈问题,使人们在可承受的时间范围内,利用新的处理模式对所有数据进行分析和处理,以适应海量、高增长和多样化的信息资产。由此,大数据便孕育而生,人们归纳提炼出大数据应具备的4个特征,它们分别是数据体量巨大(Volume)、数据类型繁多(Variety)、处理速度快(Velocity)和价值密度低(Value)。
当前,新的处理模式如Hadoop生态圈和Spark生态圈等开源软件已助大数据技术日趋成熟,降低了大数据产业化门槛。进入产业化阶段,大数据成为培育和带动经济及新产业的重要力量,从商业角度和技术角度厘清大数据的核心产业链尤为重要。从商业角度上看,大数据产业链由大数据提供者、大数据产品提供者和大数据服务提供者等角色构成;而从技术角度上看,大数据产业链由大数据采集、大数据存储管理和处理、大数据分析和挖掘,以及大数据呈现和应用等4个环节构成。在大数据产业具体实施过程中,产业链上的4个环节涉及6个关键技术,它们分别是大数据采集、大数据预处理、大数据存储、大数据处理、大数据分析和大数据可视化。这些内容,本读本都有详细阐述。
本读本是一本不受专业限定的科普性通识读物,编写的目的是让人们了解和认识大数据,并吸引人们积极参与到大数据产业发展中来,为国家大数据战略做出贡献。本读本较为全面地介绍了大数据涉及的国家政策、经济、产业和技术发展等内容,主要包括信息技术发展现状、大数据时代到来的成因、大数据的发展现状、大数据技术概况、典型事例解析、贵州省大数据产业发展概况、大数据的其他重要话题等内容。如果你想零基础入门大数据,相信此读本一定能够给你提供很多帮助。
夏道勋
贵州师范大学
贵州省教育大数据应用技术工程实验室
2019年2月10日