前言
近几年,许多人开始对如何分析大规模系统中的流数据感兴趣,部分原因是,在某些场景下对实时数据进行实时分析显得非常有价值和吸引力。然而,通过低延迟的应用程序及时获得有用的信息,只是高性能流处理带来的众多好处之一。
本书介绍的Apache Flink(以下简称Flink)作为一种高度创新的开源流处理器,具备惊人的潜力,能够帮助你在以流为基础的各种计算中获益。Flink不仅可以真正实现实时的容错性分析,还可以分析历史数据,并且极大地简化数据处理流程。最让人惊喜的是,Flink用同一种底层技术来实现流处理和批处理。它拥有完备的语义和强大的性能,这使得应用程序的开发变得简单,其架构也使得应用程序的维护变得容易。
本书将全面介绍Flink的功能,并且讲解常见的使用方法,包括如何在生产环境中使用它。Flink社区由来自世界各地的开发人员和用户组成,整个社区十分活跃,并且成长迅速。第一届Flink专属研讨会定名为Flink Forward,于2015年10月在德国柏林举行,第二届于2016年9月举行。还有各种线下聚会在全球范围内举行,新的Flink用例在聚会中被大家广泛讨论。
如何阅读本书
本书对技术人员和非技术人员都有帮助。对于本书所讲解的设计理念和功能,你并不需要具备特殊技能或者拥有流处理经验就能理解,但是如果对大数据系统有一定的了解,将会使阅读获得更好的效果。如果需要尝试运行本书中的示例代码,则需要具备Java或者Scala的经验。本书会清楚地讲解示例背后的核心概念,即使不懂代码也并不影响阅读。
第1~3章阐述Flink是基于哪些需求被开发出来的,以及它如何满足这些需求;还会介绍流处理架构的优势,以及Flink的整体设计。第4章至附录对Flink的功能进行更深层的技术性阐释。
排版约定
该图标表示一般性注解。
该图标表示提示或建议。
电子书
扫描如下二维码,即可购买本书电子版。