Python数据分析从入门到精通(第2版)
上QQ阅读APP看书,第一时间看更新

1.2 常见数据分析方法

数据分析是从数据中提取有价值信息的过程,过程中需要对数据进行各种处理和归类,只有掌握了正确的数据分析方法,才能起到事半功倍的效果。

数据分析方法一般分为描述性数据分析、探索性数据分析和验证性数据分析,如图1.1所示。其中,探索性数据分析和验证性数据分析属于比较高级的数据分析。

图1.1 数据分析方法的类别

 描述性数据分析是最基础、最初级的数据分析。例如,本月收入增加了多少、客户增加了多少、哪个单品销量好等,都属于描述性数据分析。

 探索性数据分析侧重于发现数据规律和特征。例如,有一份数据,你对它完全陌生,又不了解业务情况,会无从下手。如果你什么都不管,直接把数据塞进各种模型,却发现效果并不好,这时就需要先进行数据探索,找到数据的规律和特征,知道数据里有什么,没有什么。

 验证性数据分析就是已经确定使用哪种假设模型,通过验证性数据分析来对该假设模型进行验证。

数据分析方法从技术层面又可分为以下三种。

 统计分析类,以基础的统计分析为主,包括对比分析、同比分析、环比分析、定比分析、差异分析、结构分析、因素分析、80/20分析等。

 高级分析类,以建模理论为主,包括回归分析、聚类分析、相关分析、矩阵分析、判别分析、主成分分析、因子分析、对应分析、时间序列分析等。

 数据挖掘类,以机器学习、数据仓库等复合技术为主。

下面重点介绍对比分析、同比分析、环比分析、回归分析、聚类分析等常用的数据分析方法。