统计学习必学的十个问题：理论与实践

李轩涯张暐

更新时间：2022-07-28 20:05:53

最新章节：参考文献

封面

版权信息

内容简介

前言

第1章防止过拟合

1.1 过拟合和欠拟合的背后

1.2 性能度量和损失函数

1.3 假设空间和VC维

1.4 偏差方差分解的意义

1.5 正则化和参数绑定

1.6 使用scikit-learn

第2章特征选择

2.1 包裹法Warpper

2.2 过滤法Filter

2.3 嵌入法Embedded

2.4 使用scikit-learn

第3章回归算法中的贝叶斯

3.1 快速理解判别式模型和生成式模型

3.2 极大似然估计和平方损失

3.3 最大后验估计和正则化

3.4 贝叶斯线性估计

3.5 使用scikit-learn

第4章分类算法中的贝叶斯

4.1 广义线性模型下的sigmoid函数和softmax函数

4.2 对数损失和交叉熵

4.3 逻辑回归的多项式拓展和正则化

4.4 朴素贝叶斯分类器

4.5 拉普拉斯平滑和连续特征取值的处理方法

4.6 使用scikit-learn

第5章非参数模型

5.1 K近邻与距离度量

5.2 K近邻与kd数

5.3 决策树和条件熵

5.4 决策树的剪枝

5.5 连续特征取值的处理方法和基尼指数

5.6 回归树

5.7 使用scikit-learn

第6章核方法

6.1 核方法的本质

6.2 对偶表示和拉格朗日乘子法

6.3 常见算法的核化拓展

6.4 高斯过程

6.5 使用scikit-learn

第7章混合高斯：比高斯分布更强大

7.1 聚类的重要问题

7.2 潜变量与K均值

7.3 混合高斯和极大似然估计的失效

7.4 EM算法的核心步骤

7.5 使用scikit-learn

第8章模型组合策略

8.1 Bagging和随机森林

8.2 Boosting的基本框架

8.3 Adaboost

8.4 GBDT和XGBoost

8.5 使用scikit-learn

第9章核化降维和学习流形

9.1 线性降维

9.2 核化线性降维

9.3 流形学习

9.4 使用scikit-learn

第10章处理时间序列

10.1 概率图模型和隐变量

10.2 高阶马尔可夫模型

10.3 隐马尔可夫模型

10.4 隐马尔可夫模型的EM算法

10.5 使用scikit-learn

参考文献

更新时间：2022-07-28 20:05:53