更新时间:2021-04-22 17:08:11
封面
前折页
版权页
致数字化人才的一封信
前言
第1章 Flink及其运行模式简介
1.1 Flink介绍
1.2 Flink的特性
1.3 功能模块
1.4 编程模型
1.5 重新编译
1.6 任务提交模型
1.7 部署运行模式
1.8 本章小结
第2章 Flink的部署安装及入门案例
2.1 local模式部署安装
2.2 standalone模式部署安装
2.3 standalone模式的HA环境
2.4 standalone模式在HA环境下提交任务
2.5 Flink on YARN模式
2.6 入门案例
2.7 shell命令行代码调试
2.8 本章小结
第3章 Flink实时处理之DataStream
3.1 DataStream的数据源
3.2 DataStream常用算子
3.3 窗口和时间
3.4 用watermark解决乱序与数据延迟问题
3.5 DataStream的状态保存和恢复
3.6 DataStream集成Kafka
3.7 本章小结
第4章 Flink批量处理之DataSet
4.1 DataSet的内置数据源
4.2 DataSet常用算子
4.3 DataSet的参数传递
4.4 DataSet连接器
4.5 广播变量、累加器与分布式缓存
4.6 本章小结
第5章 Flink的Table与SQL
5.1 Table与SQL简介
5.2 为什么需要SQL
5.3 Table与SQL的语法解析
5.4 Table与SQL编程开发
5.5 本章小结
第6章 Flink数据去重与数据连接
6.1 数据去重
6.2 流的连接实现
6.3 本章小结
第7章 Flink中的复杂事件处理(CEP)机制
7.1 CEP简介
7.2 CEP中的模式
7.3 CEP综合案例
7.4 本章小结
第8章 Flink调优与监控
8.1 监控指标
8.2 反压机制与监控
8.3 checkpoint监控
8.4 checkpoint调优
8.5 内存管理调优
8.6 本章小结
第9章 基于Flink实现实时数据同步解析
9.1 实时数仓架构
9.2 MySQL数据实时同步
9.3 数据库建表
9.4 开发模拟数据生成模块
9.5 数据获取模块开发
9.6 本章小结
第10章 基于Kylin的实时数据统计
10.1 Kylin简介
10.2 Kylin基础知识
10.3 Kylin环境搭建
10.4 Kylin的使用
10.5 Kylin的构建流程
10.6 Cube构建算法
10.7 Cube构建的优化
10.8 备份以及恢复Kylin的元数据
10.9 Kylin的垃圾清理
10.10 BI工具集成
10.11 使用Kylin分析HBase数据
10.12 本章小结
封底