更新时间:2023-05-06 17:55:04
封面
版权信息
内容概述
内容简介
大数据与“智能+”产教融合丛书编辑委员会
丛书序一
丛书序二
前言
第1章 工业大数据分析概览
1.1 工业大数据分析的范畴与特点
1.1.1 数据分析的范畴
1.1.2 典型分析主题
1.1.3 工业数据分析的特点
1.1.4 数据分析的典型手段
1.2 数据挖掘的过程方法
1.2.1 CRISP-DM简介
1.2.2 分析课题的执行路径
1.3 数据分析工具软件
1.3.1 脚本语言软件
1.3.2 图形化桌面软件
1.3.3 云端分析软件
1.4 工业大数据分析师的算法修养
1.4.1 分析算法理解的维度与路径
1.4.2 必读图书
1.4.3 分析算法背后的朴素思想
1.4.4 工程化思维
参考文献
第2章 数据预处理
2.1 数据操作基础
2.1.1 数据框的基本操作
2.1.2 数据可视化
2.2 数据分析的数据操作技巧
2.2.1 cumsum等primitive函数的利用:避免循环
2.2.2 带时间戳的数据框合并
2.2.3 时序数据可视化:多个子图共用一个x轴
2.2.4 时序数据可视化:NA用来间隔显示时序
2.2.5 参数区间的对比显示(在概率密度图上)
2.2.6 获取R文件的所在路径
2.2.7 分段线性回归如何通过lm()实现
2.3 探索型数据分析(EDA)
2.3.1 引言
2.3.2 R语言EDA包
2.3.3 其他工具包
2.3.4 小结
2.4 数据质量问题
2.4.1 数据的业务化
2.4.2 业务的数据化
2.4.3 机理演绎法
2.4.4 细致求实的基本素养
2.4.5 小结
2.5 特征提取
2.5.1 基于数据类型的特征提取
2.5.2 基于关联关系的特征自动生成
2.5.3 基于语法树的变量间组合特征生成
2.6 特征选择
2.6.1 特征选择的框架
2.6.2 搜索策略
2.6.3 子集评价
2.6.4 小结
第3章 机器学习算法
3.1 统计分析
3.1.1 概率分布
3.1.2 参数估计
3.1.3 假设检验
3.2 统计分布拟合
3.2.1 引言
3.2.2 基于核函数的非参数方法
3.2.3 单概率分布的参数化拟合
3.2.4 混合概率分布估计
3.2.5 小结
3.3 线性回归模型
3.3.1 引言
3.3.2 基础线性回归模型——OLS模型
3.3.3 OLS模型检验
3.3.4 鲁棒线性回归
3.3.5 结构复杂度惩罚(正则化)
3.3.6 扩展
3.4 多元自适应回归样条(MARS)
3.4.1 引言
3.4.2 前向计算过程
3.4.3 后剪枝过程
3.4.4 变量重要性评价
3.4.5 MARS与其他算法的关系
3.5 神经网络
3.5.1 ANN逼近能力的直观理解
3.5.2 极限学习机
3.6 决策树
3.6.1 决策树的概念
3.6.2 决策树构建过程
3.6.3 常用决策树算法
3.7 支持向量机(SVM)
3.7.1 引言
3.7.2 epsilon-SVR算法
3.7.3 nu-SVR算法
3.7.4 不同SVM算法包的差异
3.7.5 扩展
3.8 隐马尔可夫模型
3.8.1 引言
3.8.2 工作原理