更新时间:2022-07-28 20:05:53
封面
版权信息
内容简介
前言
第1章 防止过拟合
1.1 过拟合和欠拟合的背后
1.2 性能度量和损失函数
1.3 假设空间和VC维
1.4 偏差方差分解的意义
1.5 正则化和参数绑定
1.6 使用scikit-learn
第2章 特征选择
2.1 包裹法Warpper
2.2 过滤法Filter
2.3 嵌入法Embedded
2.4 使用scikit-learn
第3章 回归算法中的贝叶斯
3.1 快速理解判别式模型和生成式模型
3.2 极大似然估计和平方损失
3.3 最大后验估计和正则化
3.4 贝叶斯线性估计
3.5 使用scikit-learn
第4章 分类算法中的贝叶斯
4.1 广义线性模型下的sigmoid函数和softmax函数
4.2 对数损失和交叉熵
4.3 逻辑回归的多项式拓展和正则化
4.4 朴素贝叶斯分类器
4.5 拉普拉斯平滑和连续特征取值的处理方法
4.6 使用scikit-learn
第5章 非参数模型
5.1 K近邻与距离度量
5.2 K近邻与kd数
5.3 决策树和条件熵
5.4 决策树的剪枝
5.5 连续特征取值的处理方法和基尼指数
5.6 回归树
5.7 使用scikit-learn
第6章 核方法
6.1 核方法的本质
6.2 对偶表示和拉格朗日乘子法
6.3 常见算法的核化拓展
6.4 高斯过程
6.5 使用scikit-learn
第7章 混合高斯:比高斯分布更强大
7.1 聚类的重要问题
7.2 潜变量与K均值
7.3 混合高斯和极大似然估计的失效
7.4 EM算法的核心步骤
7.5 使用scikit-learn
第8章 模型组合策略
8.1 Bagging和随机森林
8.2 Boosting的基本框架
8.3 Adaboost
8.4 GBDT和XGBoost
8.5 使用scikit-learn
第9章 核化降维和学习流形
9.1 线性降维
9.2 核化线性降维
9.3 流形学习
9.4 使用scikit-learn
第10章 处理时间序列
10.1 概率图模型和隐变量
10.2 高阶马尔可夫模型
10.3 隐马尔可夫模型
10.4 隐马尔可夫模型的EM算法
10.5 使用scikit-learn
参考文献