更新时间:2020-04-24 15:09:54
封面
版权信息
作者简介
前言
第1章 Python大数据开发入门
1.1 大数据工程师必备技能
1.2 Python开发环境
1.3 Python开发工具
1.4 Python数据类型
1.5 Python函数和类
1.6 Python常用库
1.7 Python技巧
1.8 Python常见问题
第2章 科学计算Numpy
2.1 多维数组
2.2 数组元素运算
2.3 常用函数
第3章 数据操作Pandas
3.1 数据对象
3.2 数据存取
3.3 分组运算
3.4 日期时间处理
第4章 数据可视化
4.1 Matplotlib绘图库
4.2 Seaborn高级数据可视化
4.3 PyEcharts交互图
第5章 获取数据
5.1 读写文件
5.2 读写数据库
5.3 读写数据仓库
5.4 获取网络数据
5.5 选择数据存储方式
第6章 数据预处理
6.1 数据类型识别与转换
6.2 数据清洗
6.3 数据归约
6.4 数据抽样
6.5 数据组合
6.6 特征提取
第7章 数据分析
7.1 入门实例
7.2 假设检验
7.3 参数检验与非参数检验
7.4 T检验
7.5 方差分析
7.6 秩和检验
7.7 卡方检验
7.8 相关性分析
7.9 变量分析
7.10 TableOne工具
7.11 统计方法总结
第8章 机器学习基础知识
8.1 基本概念
8.2 评价模型
第9章 机器学习模型与工具
9.1 基于距离的算法
9.2 线性回归与逻辑回归
9.3 支持向量机
9.4 信息熵和决策树
9.5 关联规则
9.6 贝叶斯模型
9.7 隐马尔可夫模型
9.8 集成算法
第10章 模型选择与相关技术
10.1 数据准备与模型选择
10.2 自动机器学习框架
10.3 自然语言处理
10.4 建模相关技术
第11章 大数据竞赛平台
11.1 定义问题
11.2 算法竞赛
第12章 决策问题:幸福感挖掘
12.1 赛题解读
12.2 模型初探
12.3 模型调优
12.4 模型输出
12.5 XGBoost模型
第13章 迁移学习:猫狗图片分类
13.1 深度学习神经网络
13.2 使用现有的神经网络模型
13.3 迁移学习
13.4 解决猫狗分类问题
第14章 图像分割:识别图中物体
14.1 Mask R-CNN算法
14.2 Mask R-CNN源码解析
14.3 训练模型与预测
第15章 时间序列分析
15.1 时序问题处理流程
15.2 趋势分析工具ARIMA
15.3 傅里叶和小波变换
15.4 Prophet时序模型
第16章 自然语言处理:微博互动预测
16.1 赛题分析
16.2 中文分析
好书分享