上QQ阅读APP看书,第一时间看更新
前言
本书的目标读者是那些对 R 或 Python 编程语言有一定了解,并学习过(短期、不系统的学习也可以)一些统计学知识的数据科学家。本书的第一作者和第二作者就是从统计学转入数据科学领域的,他们对统计学对于数据科学的贡献有一定的见解。但是同时,我们也深知传统统计学的局限性。统计学是一门有着一个半世纪悠久历史的学科,多数统计学教材和课程像远洋客轮一样按部就班。本书中的所有方法都与统计学有某种联系,不论是历史上的,还是方法论上的。不过,本书并未涉及那些主要来自计算机科学的方法,比如神经网络。
本书有两个基本目标。
- 以通俗易懂、分门别类的方式,介绍那些来自统计学、与数据科学相关的关键概念。
- 从数据科学的角度,解释哪些概念重要、哪些不那么重要,以及为什么是这样。