前言
随着信息技术的蓬勃发展和大数据时代的来临,学习和掌握分析处理数据的方法日益成为一种迫切的需求,甚至成为一种时尚。业界需要大量数据科学人才进行数据分析,数据科学人才需要能够掌握并灵活运用各个相关领域的方法,包括机器学习、数据挖掘、人工智能、计算机和统计学等。其中,机器学习处在这几个交叉学科中心的位置,深入了解和掌握机器学习方法和应用技巧是进入大数据分析领域的一个很好的切入点。
本书是作者多年教学和科研的结晶,全面介绍了机器学习理论及相关的实践知识,并对机器学习相关知识进行了系统介绍、分类和梳理,从理论、案例分析和动手编程多个角度来帮助读者学习、理解和掌握机器学习的各种理论方法和实践技巧。全书共12章,主要内容包括机器学习概述、Python科学计算简介、无监督学习、线性回归和正则化方法、分类、局部建模、模型选择和模型评估、统计推断基础、贝叶斯方法、树和树的集成、深度学习、强化学习。本书内容丰富,讲解通俗易懂,非常适合本科生、研究生,以及对机器学习感兴趣或者想要使用Python语言进行数据分析的广大读者使用。
本书面向应用导向,加入编程元素和模拟仿真练习,读者在学习的过程中可以提高动手编程能力和分析数据能力。同时,本书的每一章均有实际案例数据分析来支持方法的学习,加深对方法的理解和掌握。本书使用Python语言作为示例和分析数据的工具,并对很多方法配有相应的Python实现程序,包括模拟仿真和真实案例。本书所有的数据集和相关代码可以在相关网页中下载,适合作为配套学习资料和参考资料,辅助加深读者对所学方法的理解。对于机器学习的理论,本书也有全面介绍,并在重要之处均给出相关参考资料,供有能力的读者自行查阅学习。
与同类教材相比,本书加入了新的统计学习、深度学习和深度强化学习等内容,更加侧重程序实现和数据分析应用。本书的许多实际例子涉及与经济金融和投资相关的数据分析,更适合经管类相关专业学生学习数据挖掘和机器学习,特别是面向经济、金融科技和量化投资方向的学生,既可以作为相关专业高年级本科生的教材,也可以作为研究生的教材或参考资料。
机器学习涵盖的内容十分广泛,作者也不可能对每个分支方向都有深入见解,有不少机器学习相关的内容(如概率图模型、关联规则和文本挖掘等)没有放到本书中。此外,书中必定会有很多不足之处,一些错误在所难免。如读者能批评指正则不胜感激,我将虚心接受并加以改进。
黄勉
2020年6月1日