更新时间:2023-11-17 16:40:57
封面
版权信息
内容简介
前言
第1章 初识Flink
1.1 Flink的起源和设计理念
1.2 Flink的应用
1.2.1 Flink在企业中的应用
1.2.2 Flink主要的应用场景
1.3 流式数据处理的发展和演变
1.3.1 流处理和批处理
1.3.2 传统事务处理
1.3.3 有状态的流处理
1.3.4 Lambda架构
1.3.5 新一代流处理器
1.4 Flink的特性总结
1.4.1 Flink的核心特性
1.4.2 分层API
1.5 Flink与Spark
1.5.1 数据处理架构
1.5.2 数据模型和运行架构
1.5.3 Spark还是Flink
1.6 本章总结
第2章 Flink快速上手
2.1 环境准备
2.2 创建项目
2.3 编写代码
2.3.1 批处理
2.3.2 流处理
2.4 本章总结
第3章 Flink部署
3.1 快速启动一个Flink集群
3.1.1 环境配置
3.1.2 本地启动
3.1.3 集群启动
3.1.4 向集群提交作业
3.2 部署模式
3.2.1 会话模式
3.2.2 单作业模式
3.2.3 应用模式
3.3 独立模式
3.3.1 会话模式部署
3.3.2 单作业模式部署
3.3.3 应用模式部署
3.3.4 高可用
3.4 YARN模式
3.4.1 相关准备和配置
3.4.2 会话模式部署
3.4.3 单作业模式部署
3.4.4 应用模式部署
3.4.5 高可用
3.5 K8s模式
3.6 本章总结
第4章 Flink运行时架构
4.1 系统架构
4.1.1 整体构成
4.1.2 JobManager
4.1.3 TaskManager
4.2 作业提交流程
4.2.1 高层级抽象视角
4.2.2 独立模式
4.2.3 YARN集群
4.3 一些重要概念
4.3.1 数据流图
4.3.2 并行度
4.3.3 算子链
4.3.4 作业图与执行图
4.3.5 任务和任务槽
4.4 本章总结
第5章 DataStream API基础篇
5.1 执行环境
5.1.1 创建执行环境
5.1.2 执行模式
5.1.3 触发程序执行
5.2 数据源
5.2.1 准备工作
5.2.2 从集合中读取数据
5.2.3 从文件读取数据
5.2.4 从Socket读取数据
5.2.5 从Kafka读取数据
5.2.6 自定义数据源
5.2.7 Flink支持的数据类型
5.3 转换操作
5.3.1 基本转换算子
5.3.2 聚合算子
5.3.3 用户自定义函数
5.3.4 物理分区
5.4 输出
5.4.1 连接到外部系统
5.4.2 输出到文件
5.4.3 输出到Kafka
5.4.4 输出到Redis
5.4.5 输出到Elasticsearch
5.4.6 输出到MySQL
5.4.7 自定义Sink输出
5.5 本章总结
第6章 Flink中的时间和窗口
6.1 时间语义
6.1.1 Flink中的时间语义
6.1.2 哪种时间语义更重要