更新时间:2019-01-05 06:07:48
封面
版权信息
作者介绍
封面介绍
译者序
前言
第2版新内容
本书约定
使用代码示例
O'Reilly Safari
如何联系我们
致谢
第1章 准备工作
1.1 本书内容
1.2 为何利用Python进行数据分析
1.3 重要的Python库
1.4 安装与设置
1.5 社区和会议
1.6 快速浏览本书
第2章 Python语言基础、IPython及Jupyter notebook
2.1 Python解释器
2.2 IPython基础
2.3 Python语言基础
第3章 内建数据结构、函数及文件
3.1 数据结构和序列
3.2 函数
3.3 文件与操作系统
3.4 本章小结
第4章 NumPy基础:数组与向量化计算
4.1 NumPy ndarray:多维数组对象
4.2 通用函数:快速的逐元素数组函数
4.3 使用数组进行面向数组编程
4.4 使用数组进行文件输入和输出
4.5 线性代数
4.6 伪随机数生成
4.7 示例:随机漫步
4.8 本章小结
第5章 pandas入门
5.1 pandas数据结构介绍
5.2 基本功能
5.3 描述性统计的概述与计算
5.4 本章小结
第6章 数据载入、存储及文件格式
6.1 文本格式数据的读写
6.2 二进制格式
6.3 与Web API交互
6.4 与数据库交互
6.5 本章小结
第7章 数据清洗与准备
7.1 处理缺失值
7.2 数据转换
7.3 字符串操作
7.4 本章小结
第8章 数据规整:连接、联合与重塑
8.1 分层索引
8.2 联合与合并数据集
8.3 重塑和透视
8.4 本章小结
第9章 绘图与可视化
9.1 简明matplotlib API入门
9.2 使用pandas和seaborn绘图
9.3 其他Python可视化工具
9.4 本章小结
第10章 数据聚合与分组操作
10.1 GroupBy机制
10.2 数据聚合
10.3 应用:通用拆分-应用-联合
10.4 数据透视表与交叉表
10.5 本章小结
第11章 时间序列
11.1 日期和时间数据的类型及工具
11.2 时间序列基础
11.3 日期范围、频率和移位
11.4 时区处理
11.5 时间区间和区间算术
11.6 重新采样与频率转换
11.7 移动窗口函数
11.8 本章小结
第12章 高阶pandas
12.1 分类数据
12.2 高阶GroupBy应用
12.3 方法链技术
12.4 本章小结
第13章 Python建模库介绍
13.1 pandas与建模代码的结合
13.2 使用Patsy创建模型描述
13.3 statsmodels介绍
13.4 scikit-learn介绍
13.5 继续你的教育
第14章 数据分析示例
14.1 从Bitly获取1.USA.gov数据
14.2 MovieLens 1M数据集
14.3 美国1880~2010年的婴儿名字
14.4 美国农业部食品数据库
14.5 2012年联邦选举委员会数据库
14.6 本章小结
附录A 高阶NumPy
A.1 ndarray对象内幕
A.2 高阶数组操作
A.3 广播