Spark 3.0大数据分析与挖掘:基于机器学习
上QQ阅读APP看书,第一时间看更新

1.5 星星之火,可以燎原

Spark一个新兴的、能够便捷和快速处理海量数据的计算框架,得到了越来越多从业者的关注与重视。使用其中的ML能够及时准确地分析海量数据,从而获得大数据中所包含的各种有用信息。例如,经常使用的聚类推荐、向感兴趣的顾客推荐相关商品和服务;或者为广告供应商提供具有针对性的广告服务,并且通过点击率的反馈获得统计信息,进而有效地帮助他们调整相应的广告投放能力。

2015年6月15日,IBM宣布了一系列Apache Spark开源软件相关的措施,旨在更好地存储、处理以及分析大量不同类型的数据。IBM将在旧金山开设一家Spark技术中心,这一举措将直接教会3500名研发人员使用Spark来工作,并间接影响超过一百万的数据科学家和工程师,让他们更加熟悉Spark。

相对于IBM对Spark的大胆采纳,其他一些技术厂商对Spark则是持相当保留的态度。IBM近年来将战略重点转向数据领域,在大数据、物联网、软件定义存储及Watson系统等领域投入大量资金。

IBM在Spark开源软件方面的举动,将会对许多以Spark为框架协议的初创公司带来利益,最重要的是会使业界对Spark开源软件的接受度和应用率增加。因为Spark开源软件不仅对初创公司有利,对于一些大的数据项目来说也是非常好的解决方案。

Spark将是大数据分析和计算的未来,定将会成为应用最为广泛的计算架构。越来越多的公司和组织选择使用Spark,不仅体现出使用者对大数据技术和分析能力要求越来越高,也体现出Spark这一新兴的大数据技术对于未来的应用前景越来越好。