更新时间:2022-07-27 18:23:51
封面
版权信息
内容简介
作者简介
前言
第1章 构建数据分析开发环境
1.1 数据分析概述
1.1.1 为什么要进行数据分析
1.1.2 数据分析的流程与思维
1.2 开发环境的构建
1.2.1 安装Anaconda
1.2.2 安装Jupyter库
1.2.3 安装PyCharm社区版
1.2.4 包管理工具
1.2.5 环境测试
1.3 必会的Python数据分析包
1.3.1 NumPy数组操作
1.3.2 Pandas数据清洗
1.3.3 Matplotlib数据可视化
1.3.4 Sklearn数据建模
1.4 一个简单的数据分析案例
1.5 小结与课后练习
第2章 Python核心基础
2.1 Python数据类型
2.1.1 数值类型
2.1.2 字符串类型
2.1.3 列表类型
2.1.4 元组类型
2.1.5 集合类型
2.1.6 字典类型
2.2 Python基础语法
2.2.1 代码行与缩进
2.2.2 条件if及if嵌套
2.2.3 循环:while与for
2.2.4 格式化:format()与%
2.3 Python高阶函数
2.3.1 map()函数
2.3.2 reduce()函数
2.3.3 filter()函数
2.3.4 sorted()函数
2.4 Python编程技巧
2.4.1 自动补全程序
2.4.2 变量值的互换
2.4.3 列表解析式
2.4.4 元素序列解包
2.5 小结与课后练习
第3章 Python数据分析基础
3.1 数据的读取
3.1.1 本地离线数据
3.1.2 Web在线数据
3.1.3 常用数据库数据
3.2 数据的索引
3.2.1 创建与查看索引
3.2.2 索引重构与恢复
3.2.3 索引调整与排序
3.3 数据的切片
3.3.1 提取多列数据
3.3.2 提取多行数据
3.3.3 提取区域数据
3.4 数据的聚合
3.4.1 指定列数据统计
3.4.2 多字段分组统计
3.4.3 自定义聚合指标
3.5 小结与课后练习
第4章 NumPy数组操作
4.1 NumPy索引与切片
4.1.1 数组的索引
4.1.2 布尔型索引
4.1.3 花式索引
4.1.4 数组的切片
4.1.5 设置切片步长
4.2 NumPy维数变换
4.2.1 reshape()函数
4.2.2 shape()函数
4.2.3 resize()函数
4.2.4 ravel()函数
4.2.5 flatten()函数
4.3 NumPy广播机制
4.3.1 广播
4.3.2 广播机制
4.3.3 广播机制变化过程
4.3.4 广播不兼容
4.4 NumPy矩阵运算
4.4.1 矩阵概述
4.4.2 矩阵的乘法
4.4.3 矩阵的内积
4.4.4 矩阵的外积
4.5 小结与课后练习
第5章 Pandas数据清洗
5.1 重复值检测与处理
5.1.1 重复值的检测
5.1.2 重复值的处理
5.2 缺失值检测与处理
5.2.1 缺失值的检测
5.2.2 缺失值的处理
5.3 异常值检测与处理
5.3.1 异常值的检测
5.3.2 异常值的处理
5.4 金融数据的处理实战
5.4.1 读取上证指数数据