上QQ阅读APP看书,第一时间看更新
1.2.5 聚类分析法
聚类分析多用于人群分类,如客户分类。所谓聚类,是指将数据集中某些方面相似的数据成员进行分类组织的过程。简单地说,就是将相似的数据合并成一组,是一种发现内在相似结构的技术。聚类可把一个大数据集按照某种距离计算方式,分成若干个分类,每个分类内的差异性比类与类之间的差异性要小很多。
聚类与分类分析不同,所划分的类是未知的。因此,聚类分析也称为无指导或无监督学习。它是静态数据分析的一门技术,在许多领域被广泛应用,包括机器学习、数据挖掘、模式识别、图像分析以及生物信息。
例如,客户价值分析中对客户进行分类(根据业务需要分为4类),其中的某类客户如图1.8所示。
图1.8 聚类分析