剑指大数据:Flink学习精要(Scala版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4.1 Flink的核心特性

Flink区别于传统数据处理框架的特性如下。

• 高吞吐和低延迟。Flink每秒处理数百万个事件;具有毫秒级延迟。

• 结果的准确性。Flink提供了事件时间(event-time)和处理时间(processing-time)语义。对于乱序事件流,事件时间语义仍然能提供一致且准确的结果。

• exactly-once(精确一次)的状态一致性保证。

• Flink可以连接到最常用的存储系统,如Apache Kafka、Apache Cassandra、ElasticSearch、JDBC、Kinesis,以及分布式文件系统如HDFS和S3。

• 高可用。Flink本身高可用的设置,加上与K8s(Kubernetes)、YARN和Mesos的紧密集成,再加上从故障中快速恢复和动态扩展任务的能力,能做到以极短的停机时间实现7×24小时全天候运行。

• Flink能够更新应用程序代码并将作业(jobs)迁移到不同的Flink集群中而不会丢失应用程序的状态。