上QQ阅读APP看书,第一时间看更新
内容提要
本书是大数据分析与挖掘领域的入门教材,全书共6章,内容主要涵盖大数据分析与挖掘过程中用到的基本算法,目的是通过算法原理的介绍,使学生能更高效地将它们运用于数据分析与挖掘的实践中。第1章主要介绍大数据分析与挖掘技术发展与应用的特点,以及三种主流的工具。第2章主要讲解数据特征分析与预处理,详细介绍了数据各种特征的描述方法、预处理技术,以及Spark机器学习库中的数据预处理功能。第3章详细介绍频繁模式挖掘的几种经典算法,并结合Spark机器学习库进行实践,对序列模式挖掘进行了讲解。第4章详细介绍几种基本的分类与回归算法,并结合Sklearn和Spark机器学习库进行实践。第5章详细介绍主流的聚类算法。第6章综合运用多种数据挖掘算法进行异常检测。
本书可作为高等院校数据科学与大数据技术、计算机科学与技术等相关专业的本科生教材,也可作为大数据分析与挖掘技术初学者的参考书。