大数据导论
上QQ阅读APP看书,第一时间看更新

2.4 云计算与大数据

云计算是一种商业模式,也是一种计算模式。云计算将成为第四代IT产业改革模式。云计算可以使互联网的速度更快,容量更大,成本更低。所以,云计算是以大数据为基础进行的,大数据的主要目的是在海量数据中发现其背后的潜在价值,让使用者更好地理解和掌握信息,而云计算更偏重于向使用者提供服务,二者相互关联。本节将阐述云计算与大数据的关系和结合。

2.4.1 云计算与大数据的关系

大数据注重数据,为实际的业务提供数据采集,是对信息的积淀;云计算注重计算,为IT提供基础架构,是对信息的处理。云计算与大数据存在以下联系。

1)从整体角度看,大数据与云计算相辅相成。

云计算与大数据都是为数据存储和处理服务的,都需要占用大量的存储和计算资源。

2)从技术角度看,大数据根植于云计算。

海量数据存储技术、海量数据管理技术和MapReduce等并行处理技术既是大数据技术的基础,也都是云计算的关键技术。

3)从结构角度看,云计算及其分布式结构是大数据的商业模式与架构的重要途径。

大数据的处理技术改变着计算机的运行模式,能够处理目前存在的各种海量数据,包括博客、电子邮件、文档、音频和其他类型的数据,并且其工作速度非常快,硬件成本低,具有普及性,而云计算将计算任务分给资源池,使用户能够按需获取信息服务,云计算给使用者提供低成本获取计算和存储的能力,云计算架构能够支持数据的存储和处理,结合大数据的低成本硬件+云计算的低成本软件+低成本运维,推动了大数据的处理,并得以充分利用。图2-10所示为利用云计算处理海量数据。

图2-10 云计算处理海量数据

尽管云计算与大数据相辅相成,但大数据与云计算也有很多方面的差异。

1)目的不同:大数据主要是通过充分挖掘海量数据以发现数据中的价值,而云计算是节省企业的IT部署成本,主要通过互联网更好地调用、扩展和管理计算及存储资源和能力。

2)对象不同:大数据的处理对象是“数据”;云计算的处理对象是“IT资源、处理能力和应用”。

3)推动力量不同:大数据的推动力量是从事数据存储与处理的软件厂商和拥有海量数据的企业;云计算的推动力量是存储及计算设备的生产厂商和拥有计算及存储资源的企业。

4)带来的价值不同:大数据由数据中的价值发现带来收益,云计算节省IT部署成本。

因此,不难发现云计算和大数据实际上是工具与用途的关系,即云计算为大数据提供了有力的工具和途径,大数据为云计算提供了很有价值的用武之地。而且,从所使用的技术来看,大数据可以理解为云计算的延伸。

2.4.2 云计算与大数据的结合

云计算可以使互联网的速度更快,容量更大,成本更低。全球云计算市场将以28%的复合年增长率快速扩张,云计算快速发展背后的驱动力是全球数据的快速增长。大数据若与云计算相结合,将相得益彰,互相都能发挥最大优势。云计算能为大数据提供强大的存储和计算能力,能更加迅速地处理大数据的丰富信息,并更方便地提供服务;而来自大数据的业务需求,能为云计算的落地找到更多、更好的实际应用。图2-11形象地说明了云计算与大数据的结合。

图2-11 云计算与大数据的结合

1.阿里云

阿里云是目前中国公有云IaaS市场最大的服务提供商,阿里云由阿里巴巴集团投资成立于2009年9月10日,阿里云计算为阿里巴巴、淘宝、支付宝及一些中小企业提供云计算服务。

阿里云的云计算建立在大规模分布式计算系统上,提供了开放数据存储OSS、关系型数据库RDS、开放结构化数据服务OTS和开放数据处理服务ODPS等一系列云端的数据存储和计算服务。阿里云共有3类产品,包括弹性计算、数据存储与数据库和大规模计算,每类产品具体包括的内容如表2-4所示。

表2-4 阿里云产品

与Amazon的云存储服务不同的是,阿里云拥有完全的自主知识产权的飞天内核,可以通过构建存储和分析平台,做到多种服务器并行架构,数据的安全性由可靠的服务器和传输方式来保证。在阿里云的数据中心,信息的传输和转移是通过并行处理的应用程序、数据库、备份站点和处理器来完成的。其中,数据的获取通过ODPS进行计算和数据处理,ODPS提供数据存储和数据分析的平台,用户可以使用该平台上的数据模型和服务,也可以发布数据分析工具。

中石化基于阿里巴巴提供的基础云服务建设共享服务中心“易派客”,其系统架构图如图2-12所示,基于大数据的技术与营销方法,精准服务8000万加油卡客户,提升客户体验。

图2-12 “易派客”系统架构图

2.通信业的大数据与云计算

大数据通过与云计算结合能够释放出巨大的能力,这对于每个行业都有推动作用,而信息、互联网和通信产业表现相对突出,特别是在通信业,传统的话务业务不能适应互联网发展的需求,而通过大数据与云计算的结合能够为通信业转型提供动力和途径,带来新的机遇。

(1)提升网络的服务质量

随着互联网和移动互联网的逐步发展,运营商的网络也越来越繁忙,监测网络运行状态的信息数据也在急剧增长。基于大数据的海量数据存储技术,可以满足用户的存储需求;通过智能分析技术,能够有效提高网络维护的实时性,及时预测网络流量高峰值,对异常流量预警,给网络改造和优化提供参考依据,从而提高用户的体验。

(2)提高客户洞察的准确性

客户洞察是指企业层面把全面掌握的客户数据提供给市场营销和客户联系等环节,使这些客户数据得到有效应用。通过使用大数据的分析挖掘工具和方法,通信业可以整合来自内部各个部门的数据,如市场部、营销部和服务部等,能够全面客观地了解客户,精准刻画用户的形象,寻找到目标客户,并制订行之有效的营销计划、产品组合或者商业决策,提升客户形象和价值。通过数据挖掘中的情感分析、语义分析等技术,可以针对客户的喜好和情绪,进行个性化的业务推荐等。

(3)增强行业信息化的服务水平

通信业在智慧城市的发展中占据重要地位,而目前的通信业主要还是提供终端和通信管道,通信行业的应用软件和系统集成还需要整合外部的应用软件提供商,主要在网络化、自动化等较低水平体现用户的价值。而随着社会、经济的发展,用户对于智能化的要求将逐步强烈,因此运营商如能把大数据技术整合到行业信息化方案中,通过数据采集、存储和分析帮助用户更好地进行决策,将能极大地提升信息化服务的价值。

(4)基于云的数据分析服务

大数据和云计算相结合,可以提供一种数据分析的服务,通信业目前的云计算服务以数据中心等资源的提供为主。下一步,通信业可以在数据中心的基础上搭建大数据分析平台,通过自行采集、第三方提供等方式汇聚数据,并对数据进行分析,为相关企业提供分析报告。