Python预测分析与机器学习
上QQ阅读APP看书,第一时间看更新

前言PREFACE

笔者在Loblaw Companies任职全栈数据分析师期间,深刻体会到了有时许多校内学习到的理论知识并非即刻适用。这样的传统零售业在走向数据驱动模式时,往往不需要使用庞大的深度学习模型,或其他消耗巨大算力的算法。一些可解释性高,所需数据量较小的模型足以贡献十分可观的商业价值。相比起走学术路径中理论基础的重要性,在行业实操中更重要的是掌握数据分析的全过程,以及拥有足够的经验让步骤间有节奏地配合,因此笔者决定写这本书,将预测分析中重点的步骤和其间配合以可着手的方式展现给读者。

本书的着重点在于预测分析与机器学习的实战思路,其中加入算法或模型的理论知识介绍,让读者在学习如何运用的同时,更加深入地学习为何在该实践场景下使用该特定算法或模型。书中侧重讲解实操中常用、回报率高的算法。内容简单易懂,图文搭配,借鉴实际例子让学习过程更具实用感。

本书致力于帮助3类读者在预测分析与机器学习这条路上有所成长。第1类,有Python编程基础但缺乏数据科学背景,有意入门的读者。书中不设置有关数据科学背景的阅读门槛,每个相关背景都将先介绍再进行引用。另外,因本书偏向实操而非理论,内容对于这一类读者将更加容易消化,书中的代码注释丰富,容易着手跟随。第2类,有数据科学理论基础知识,有意进入实操的读者,例如缺乏业界经验的学生。这类读者已经掌握了许多理论背景知识,只是缺少实践经历。本书有效地展示理论算法如何在实操中运行,以及各理论知识运用的搭配。第3类,有数据科学理论基础与实操经验,但日常工作集中在数据分析管道中的数据分析师。本书可以帮助这类读者了解在工作中如何与同事配合。在项目经理职位的读者也可以通过阅读本书更好地理解队内成员的工作、难点,以及定位项目突破口。

本书还包含部分理论知识,希望通过介绍算法的运作原理,帮助读者建立面对问题选择解决方案的思路。浏览目录便会发现,第4章不到100页的内容包含了大量机器学习模型及算法,每种算法的介绍从其运作原理讲起,到将其运用在一个实际例子中。笔者尽量平衡了理论深度与实践思路的讲解,希望可以在有限的篇幅中帮助本书面对的群体。

机器学习这一领域有着长达数十年的理论研究,其内容包罗万象。笔者学识有限,书中难免存在疏漏,望得到各位读者的指正。

王沁晨

2022年2月