数据科学中的实用统计学(第2版)
上QQ阅读APP看书,第一时间看更新

1.4 变异性估计

在对某个特征的摘要统计中,位置只是其中的一个维度。另一个维度是变异性(variability),也称为离散度(dispersion)。它测量的是数据值是紧密聚集还是分散的。统计学的核心任务都与变异性相关:测量变异性、消除变异性、从真实变异性中识别出随机因素、找出真实变异性的各种来源,以及在变异性存在的情况下做出决策。

偏差

 观测值与位置估计之间的差异。

 同义词

   误差、残差

方差

 与均值的偏差的平方和除以 n-1,其中 n 是数据值的数量。

 同义词

   均方误差

标准误差

 方差的平方根。

平均绝对偏差

 所有数据值与均值的偏差的绝对值的均值。

 同义词

   L1 范数、曼哈顿范数

中位数绝对偏差

 所有数据值与中位数间偏差的绝对值的中位数。

极差

 数据集中最大值和最小值之差。

顺序统计量

 基于从小到大排序的数据值的度量。

 同义词

   秩

百分位数

 举例来说,第 P 个百分位数的意思是,一个数据集中百分之 P 的值小于等于它,百分之 (100-P) 的值大于等于它。

 同义词

   分位数

四分位距(IQR)

 第 75 个百分位数和第 25 个百分位数之间的差异。

 同义词

   四分位差

测量位置有多种方法(均值、中位数等),同样,测量变异性也有多种方法。