34招精通商业智能数据分析:Power BI和Tableau进阶实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 派生维度的概念

在《三体》中,存活于三维空间的人类文明最终被来自更高维度的文明所毁灭。在面临被灭种的灾难时,人类甚至无法对敌人发起一次有效的反抗,甚至连对方的样貌都看不到,因为二者的竞争力完全不是处于同一个水平(维度)。引用这个情景主要是为了陈述维度的重要性。在BI领域,这个原理也是适用的。

数据分析的核心概念其实只有两个:数值与维度。

BI分析依据不同的维度(字段)(如国家维度、日期维度)将聚合数值(如销售金额、销售利润)切割成具体的数据立方体,即分析结果,如某年某国家的销售利润。这个过程被称之为切片。可想而知,切片越多,数值结果越详尽,分析的角度就越广,其所具有的洞察力就更强。因此,一款BI产品的执行力除了取决于其聚合能力,还取决于其创建维度的能力(见图1.2.1)。

图1-2-1

1.原生维与派生维

原生维的概念很直观:一切直接来源于数据源,且可用于维度分析的字段,如案例文件中自带的【客户ID】【产品ID】字段,即为原生维。原生维可用于最基本的维度分析。但维度分析不仅仅局限于原生维自身。

在日常的分析场景中,分析师通过对原生维进行加工生成新的维度,即派生维。派生维的存在形式是依存于原生维的,例如在原生维【客户ID】和【订单ID】的基础上,通过计算,衍生出的【客户购买次数】维度,被称为派生维。使用派生维,可增加分析维度。

在图1.2.2所示的分析中,是对不同购买次数的顾客数量进行求和。其中X轴为【客户购买次数】,是派生维。如之前所述,【客户购买次数】维度并不直接存在于数据源中,需要派生。

图1-2-2

需求强调的是,如果仅仅使用普通函数,则无法直观生成派生维。

例如,在Tableau中,创建普通字段【购买次数】。将【购买次数】字段和【客户名称】字段分别放入【列】和【行】中,如图1.2.3和图1.2.4所示。

图1-2-3

图1-2-4

按住Ctrl键,将【购买次数】胶囊放入筛选器中并将值固定,单击【确定】按钮退出。

将【客户名称】字段放入【标签】卡中,通过表计算完成汇总。

图1.2.5显示了购买5次的客户人数是5人。虽然我们最终能得出部分答案,但是其过程烦琐,效果也不直观。

图1-2-5

上述案例说明,如果仅仅依靠原生维,则分析会受到局限。派生维的应用为分析师带来更加具有洞察力的分析结果。

回到工具应用层面,令人鼓舞的是,无论是Tableau还是Power BI,都有非常强大、成熟的功能用于创建派生维,而这也是自助式BI工具与传统BI工具的一大区别。高度灵活的维度分析能力,使Tableau和Power BI更加适合探索性分析场景。

Tableau和Power BI在魔力象限图中的Y轴(易用性)上的得分也正好印证了其具有强大的探索性分析能力。