更新时间:2024-12-24 10:12:22
封面
版权页
内容简介
作者简介
推荐序1
推荐序2
前言
第1章 数据科学应用概述
1.1 什么是数据清洗、特征工程、数据可视化、数据挖掘与建模
1.1.1 数据清洗的概念
1.1.2 特征工程的概念
1.1.3 数据可视化的概念
1.1.4 数据挖掘与建模的概念
1.2 为什么要开展数据清洗、特征工程、数据可视化和数据挖掘与建模
1.2.1 数据清洗、特征工程的重要性
1.2.2 数据可视化的重要性
1.2.3 数据挖掘与建模的重要性
1.3 为什么要将Python作为实现工具
1.4 数据清洗、特征工程、数据可视化和数据挖掘与建模的主要内容
1.4.1 数据清洗的主要内容
1.4.2 特征工程的主要内容
1.4.3 数据可视化的主要内容
1.4.4 数据挖掘与建模的主要内容
1.5 数据清洗、特征工程、数据可视化和数据挖掘与建模的应用场景
1.5.1 数据清洗、特征工程的应用场景
1.5.2 数据可视化的应用场景
1.5.3 数据挖掘与建模的应用场景
1.6 数据清洗、特征工程和数据可视化的注意事项
1.6.1 数据清洗、特征工程的注意事项
1.6.2 数据可视化的注意事项
1.7 数据挖掘与建模的注意事项
1.8 习题
第2章 Python入门基础
2.1 Python概述
2.2 Anaconda平台的下载与安装
2.2.1 Anaconda平台的下载
2.2.2 Anaconda平台的安装
2.2.3 Anaconda Prompt(Anaconda3)
2.2.4 Spyder(Anaconda3)的介绍及偏好设置
2.2.5 Spyder(Anaconda3)窗口介绍
2.3 Python的注释
2.4 基本输出函数——print()函数
2.5 基本输入函数——input()函数
2.6 Python的保留字与标识符
2.6.1 Python中的保留字
2.6.2 Python的标识符
2.7 Python的变量
2.8 Python的基本数据类型
2.9 Python的数据运算符
2.10 Python序列的概念及通用操作
2.10.1 索引
2.10.2 切片
2.10.3 相加
2.10.4 相乘
2.10.5 元素检查
2.10.6 与序列相关的内置函数
2.11 Python列表
2.11.1 列表的基本操作
2.11.2 列表元素的基本操作
2.12 Python元组
2.12.1 元组的基本操作
2.12.2 元组元素的基本操作
2.13 Python字典
2.13.1 字典的基本操作
2.13.2 字典元素的基本操作
2.14 Python集合
2.15 Python字符串
2.16 习题
第3章 数据清洗
3.1 Python数据清洗基础
3.1.1 Python函数与模块
3.1.2 numpy模块数组
3.1.3 pandas模块序列
3.1.4 pandas模块数据框
3.1.5 Python流程控制语句
3.2 Python数据读取、合并、写入
3.2.1 读取、合并、写入文本文件(CSV或者TXT)
3.2.2 读取、合并、写入Excel数据文件
3.2.3 读取、合并、写入Stata数据文件
3.2.4 读取、合并SPSS数据文件
3.3 Python数据检索
3.4 Python数据行列处理
3.4.1 删除变量列、样本行
3.4.2 更改变量的列名称、调整变量列顺序
3.4.3 改变列的数据格式
3.4.4 多列转换
3.4.5 数据百分比格式转换
3.5 Python数据缺失值处理
3.5.1 查看数据集中的缺失值
3.5.2 填充数据集中的缺失值
3.5.3 删除数据集中的缺失值
3.6 Python数据重复值处理
3.6.1 查看数据集中的重复值
3.6.2 删除数据集中的重复值
3.7 Python数据异常值处理
3.7.1 运用3δ准则检测异常值
3.7.2 绘制箱图检测异常值
3.7.3 删除异常值
3.7.4 3δ准则替换异常值
3.7.5 1%/99%分位数替换异常值