更新时间:2019-01-05 00:58:13
封面
版权信息
内容提要
译者简介
作者简介
审稿人简介
前言
本书的主要内容
读者须知
本书的目标读者
体例
约定
读者反馈
用户支持
第1章 Python在数据科学中的应用
1.1 简介
1.2 使用字典对象
1.3 使用字典的字典
1.4 使用元组
1.5 使用集合
1.6 写一个列表
1.7 从另一个列表创建列表——列表推导
1.8 使用迭代器
1.9 生成一个迭代器和生成器
1.10 使用可迭代对象
1.11 将函数作为变量传递
1.12 在函数中嵌入函数
1.13 将函数作为参数传递
1.14 返回一个函数
1.15 使用装饰器改变函数行为
1.16 使用lambda创造匿名函数
1.17 使用映射函数
1.18 使用过滤器
1.19 使用zip和izip函数
1.20 从表格数据使用数组
1.21 对列进行预处理
1.22 列表排序
1.23 采用键排序
1.24 使用itertools
第2章 Python环境
2.1 简介
2.2 使用NumPy库
2.3 使用matplotlib进行绘画
2.4 使用scikit-learn进行机器学习
第3章 数据分析——探索与争鸣
3.1 简介
3.2 用图表分析单变量数据
3.3 数据分组和使用点阵图
3.4 为多变量数据绘制散点阵图
3.5 使用热图
3.6 实施概要统计及绘图
3.7 使用箱须图
3.8 修补数据
3.9 实施随机采样
3.10 缩放数据
3.11 数据标准化
3.12 实施分词化
3.13 删除停用词
3.14 词提取
3.15 执行词形还原
3.16 词袋模型表示文本
3.17 计算词频和反文档频率
第4章 数据分析——深入理解
4.1 简介
4.2 抽取主成分
4.3 使用核PCA
4.4 使用奇异值分解抽取特征
4.5 用随机映射给数据降维
4.6 用NMF分解特征矩阵
第5章 数据挖掘——海底捞针
5.1 简介
5.2 使用距离度量
5.3 学习和使用核方法
5.4 用k-means进行数据聚类
5.5 学习向量量化
5.6 在单变量数据中找出异常点
5.7 使用局部异常因子方法发现异常点
第6章 机器学习1
6.1 简介
6.2 为建模准备数据
6.3 查找最近邻
6.4 用朴素贝叶斯分类文档
6.5 构建决策树解决多类问题
第7章 机器学习2
7.1 简介
7.2 回归方法预测实数值
7.3 学习L2缩减回归——岭回归
7.4 学习L1缩减回归——LASSO
7.5 L1和L2缩减交叉验证迭代
第8章 集成方法
8.1 简介
8.2 理解集成——挂袋法
8.3 理解集成——提升法
8.4 理解集成——梯度提升
第9章 生长树
9.1 简介
9.2 从生长树到生长森林——随机森林
9.3 生成超随机树
9.4 生成旋转森林
第10章 大规模机器学习——在线学习