实战大数据：分布式大数据分析处理系统开发与应用

井超杨俊乔钢柱编著

更新时间：2023-10-27 18:05:32

最新章节：内容简介

封面

版权信息

前言

第1章大数据概述

1.1 大数据的基本概念

1.1.1 何谓大数据

1.1.2 大数据的产生阶段

1.1.3 大数据的核心技术和计算模式

1.2 大数据的应用

1.2.1 大数据的应用场景

1.2.2 大数据系统的作用

1.3 大数据技术生态圈

1.3.1 Linux操作系统

1.3.2 Hadoop生态系统

1.3.3 Spark对Hadoop的完善

1.4 大数据技术的新发展

1.4.1 Hadoop 3.0的新特性

1.4.2 大数据引擎Flink

1.4.3 智能化大数据分析处理

本章小结

第2章大数据分析的基本流程与工具

2.1 数据采集

2.1.1 网络爬虫采集数据

2.1.2 使用Excel爬取数据

2.2 数据存储

2.2.1 关系型数据的存储——基于MySQL

APP免费

2.2.2 非关系型数据的存储——基于Redis、HBase

APP免费

2.3 数据分析与数据处理

APP免费

2.3.1 数据分析常用工具——pandas

2.3.2 分布式计算框架

2.3.3 分布式数据挖掘和深度学习

2.4 数据可视化

2.4.1 Python数据可视化库Matplotlib

APP免费

2.4.2 Python数据可视化库pyecharts

APP免费

2.4.3 数据可视化图表库ECharts

APP免费

2.4.4 数据可视化工具Apache Superset

本章小结

第3章分布式大数据分析处理系统概述

3.1 什么是分布式大数据分析处理系统

3.2 分布式大数据分析处理系统的作用

3.3 分布式大数据分析处理系统的应用场景

3.4 分布式大数据分析处理系统的构成

3.4.1 数据采集子系统

3.4.2 数据存储系统

3.4.3 数据分析处理系统

3.4.4 数据可视化系统

3.5 分布式大数据分析处理系统的实现

3.5.1 系统前端——HTML、CSS、jQuery

APP免费

3.5.2 系统后端——SpringBoot、SSM

APP免费

3.5.3 Web服务器端——Tomcat

本章小结

第4章构建大数据集群环境

4.1 部署大数据处理环境

4.1.1 搭建Hadoop集群

4.1.2 ZooKeeper的安装部署

4.1.3 Kafka的安装部署

4.1.4 Spark集群搭建

4.2 部署大数据存储环境

4.2.1 MySQL的安装部署

4.2.2 Hive的安装部署

4.2.3 HBase的安装部署

4.2.4 Redis的安装部署

本章小结

第5章构建基于LayUI的集群管理系统

5.1 集群管理系统概述

5.1.1 需求分析

5.1.2 系统架构——系统+集群+UI

5.2 系统开发的前期准备操作

5.2.1 本机环境配置

5.2.2 集群环境配置

5.2.3 构建项目工程结构

5.3 系统的代码实现

5.3.1 Controller层实现

5.3.2 构造系统所需工具包

5.3.3 核心类实现

5.4 构造系统UI界面——基于LayUI

本章小结

第6章基于HBase的大数据离线分析系统

6.1 系统架构概述

6.1.1 需求分析

6.1.2 系统架构——HBase+SpringBoot+ECharts

6.2 采集股份转让数据

6.2.1 使用爬虫抓取数据

6.2.2 数据采集模块测试

6.3 数据存储和处理模块实现

6.3.1 数据库设计

6.3.2 使用HBase存储并处理数据

6.3.3 数据存储和处理模块测试

6.4 数据可视化模块实现

6.4.1 数据可视化模块后端设计——基于SpringBoot

APP免费

6.4.2 数据可视化模块前端设计——基于ECharts

APP免费

6.4.3 数据可视化页面展示

APP免费

本章小结

APP免费

第7章基于Hive+Hadoop+Spark的大数据离线分析系统

APP免费

7.1 系统架构概述

APP免费

7.1.1 需求分析

APP免费

7.1.2 数据存储——Hive+Hadoop

APP免费

7.1.3 数据处理与可视化——Spark+SSM+ECharts

APP免费

7.2 采集旅游相关数据

APP免费

7.2.1 使用爬虫采集城市、景点数据

APP免费