2.1 Tableau计算精要
Tableau函数大致可分为三大类:字段计算函数、表计算函数和LOD(详细级别表达式)。表2.1.1中列出了其特点简介。其中,字段计算函数类似于计算字段,通俗易懂,在此不进行详细介绍。本节内容的重点是表计算函数和LOD。
表2.1.1
2.1.1 表计算
表计算是常见及重要的分析概念,其功能是在数据聚合后进行二次聚合计算。Tableau提供了很强大的表计算操作选项,表计算公式可通过菜单操作生成。其中,快速表计算功能中提供了11种具有代表性的计算方式,例如汇总、合计百分比、排序等,满足绝大多数的商业分析需求,如图2.1.1所示。
图2-1-1
表计算方向:除了计算方式,另一个表计算的重要元素是【计算依据】。通常来说,依据区域可以是表、区、单元格和特定维度。计算方向可以是向下、横穿或者是两者的组合,表计算依据无法通过公式实现,需要通过【编辑表计算】功能完成,如图2.1.2所示。值得一提示的是,区和单元格是非常重要的概念,在后面的例子中会经常使用它们。
图2-1-2
复合表计算:除了上文介绍的11种普通表计算功能,Tableau还有令人惊叹的复合表计算功能,即在已有的表计算结果上进行二次表计算。例如,在汇总表计算的结果上计算合计百分比,其结果为汇总合计百分比表计算,帕累托分析就是对基于该复合表计算的结果的分析。
图2.1.3所示的为复合表计算界面。第一次表计算是汇总计算,第二次表计算是基于合计结果的差异表计算,后文会有详细案例重点介绍复合表计算。
图2-1-3
通过Tableau的菜单操作,虽然可以瞬间完成表计算操作,但读者有必要了解一下通过菜单生成相应的表计算公式的含义。表2.1.2中包括了Tableau中最基本的关键表计算公式。
表2.1.2
2.1.2 详细层级计算
LOD函数是Tableau 9.0以后的版本推出的概念,其提供了更细粒度的计算聚合功能。LOD表达式有三种逻辑表达形式:FIXED(固定)、INCLUDE(包含)、EXCLUDE(排除),如表2.1.3所示。图2.1.4所示的是Tableau官网对LOD的公式结构的解释。
表2.1.3
图2-1-4
INCLUDE/EXCLUDE在逻辑上是相互对应的关系,而FIXED自成一体。不同的LOD表达式具有不同的筛选优先顺序。如图2.1.5所示,FIXED会优先于维度筛选,而INCLUDE/EXCLUDE则在维度筛选之后。需要强调一点,LOD函数自身可带多层嵌套,用于更加复杂的逻辑表达分析,后文会介绍。
图2-1-5
上述内容属于基础知识,此处仅作为对Tableau重要概念的总结。如需要了解更详细的内容,则可在Tableau 官网中找寻更多参考资料,也可阅读作者的另一部作品《商业智能数据分析:从零开始学Power BI和Tableau自助式BI》。