Power BI零售数据分析实战
上QQ阅读APP看书,第一时间看更新

2.1 Power BI 基础知识

Power BI 是微软推出的商业数据分析工具,能够帮助用户在复杂多变的商业环境下快速理清思路,发现数据中隐藏的见解和价值。对于企业,Power BI 是可以制定一整套商业智能解决方案的工具;对于个人,Power BI 是自助式商业智能分析软件,即Power BIDesktop,可以快速实现自助式商业智能分析。本书的重点在于自助式商业分析,将着重介绍如何利用Power BIDesktop 搭建数据分析模型。

Power BI Desktop 是一款可在本地计算机上安装的、完全免费的应用程序。它不同于其他数据分析软件,是专门为数据分析师设计的,内置了业界领先的数据查询转换功能及数据建模功能,可将分析结果以专业、精美的可视化图表展现,最后可将报告分享至云端,供团队成员随时随地获得见解。

2.1.1 Power BI Desktop操作界面

Power BI Desktop操作界面包含三大视图,分别为“报表”视图、“数据”视图、“模型”视图,对应于图2-1中标注的3个小图标。

1.“报表”视图介绍

Power BI Desktop的默认界面即为“报表”视图。“报表”视图用于生成可视化图表,包含6个主要区域,如图2-2所示。

① 功能区:包含获取数据、转换数据、新建视觉对象、新建度量值、报告发布等一系列功能对应的按钮。

② 画布区域:用于创作和展现可视化图表及报告的区域,是Power BI可视化效果的直接展现。

图2-1 Power BI Desktop操作界面三大视图对应的图标

③ 页面选项卡:用于选择、新建、删除报表页面。

④ “筛选器”窗格:可在其中添加任意字段作为筛选字段,对可视化图表的数据进行筛选。

⑤ “可视化”窗格:包含常用的可视化图表样式,可将字段和度量值拖入“可视化”窗格相应位置,制作各种可视化图表。

⑥ “字段”窗格:用于显示所有查询报表的可用字段,可以将这些字段拖放到画布区域、“筛选器”窗格或“可视化”窗格中,用于创建或修改可视化图表,也可以在任意一个查询中新建度量值或者计算列,以丰富模型的分析维度。

2.“数据”视图介绍

单击Power BI Desktop操作界面左侧的“数据”图标,进入“数据”视图。“数据”视图主要展示每张报表中每个字段的详细信息。“数据”视图包含4个主要区域,如图2-3所示。

① 功能区:包含新建表、新建列、调整字段的数据类型等功能的按钮或选项。

② 当前视图:用于显示当前视图的字段明细,可以右击视图中的某一字段,进行排序、新建列等相关操作。

③ “字段”窗格:用于显示所有查询报表的可用字段,但是字段在“数据”视图中不可通过拖曳进行可视化分析。

图2-2 “报表”视图的6个主要区域

④ 状态栏:用于显示当前视图中选中列的行数及非重复值的个数。

图2-3 “数据”视图的4个主要区域

3.“模型”视图介绍

单击Power BI Desktop操作界面左侧的“模型”图标,进入“模型”视图。“模型”视图主要显示模型中的所有表、列和关系。当模型加载多张表时,为了准确计算结果并在“报表”视图中显示正确信息,需要在表与表之间建立关系。

在图2-4中,“产品信息表”和“销售表”之间通过产品ID字段建立了一对多的关系。“产品信息表”包含主键产品ID字段,是关系的一端,“销售表”是关系的多端。关系展现形式为一条从“产品信息表”(一端)指向“销售表”(多端)的实线。这种建立关系的过程类似于在Excel中使用VLOOKUP函数,通过两张表的共同字段产品ID,将“产品信息表”中的相关列匹配进“销售表”。不同之处在于,在Excel中需要进行多次VLOOKUP操作才能将“产品信息表”中的多列字段匹配进“销售表”,效率低;而在Power BI Desktop中,只需在“产品信息表”和“销售表”间建立一次一对多的关系,“产品信息表”的所有字段就和“销售表”产生了关联,过程非常简单、高效。

图2-4 在“模型”视图中建立表间关系

2.1.2 Power Query操作界面

Power Query 是Power BIDesktop的内置组件,专门用于轻量级的ETL。ETL 是英文单词Extract(抽取)、Transform(转换)、Load(加载)的缩写,特指从数据源导入数据,将其进行数据转换后加载到数据模型中的过程。作为专业的数据转换工具,Power Query 可以实现个人自助领域绝大多数的数据转换,而且大部分通过单击鼠标即可轻松实现,这也契合了普通数据分析师的需求。Power Query 操作界面包含6个主要区域,如图2-5 所示。

① 功能区:包含Power Query 中数据导入、转换、加载等的各种功能对应的按钮,完成各种ETL操作。

② “查询”窗格:用于显示所有可用的查询视图,包括从数据源导入的原生表格以及在数据建模中通过新建表功能创建的表格。图2-5中展示的是刚刚导入的示例数据中的4 张工作表:产品信息表、日期表、门店信息表和销售表。

③ 编辑栏:用于显示每一步数据转换使用的M 语言公式,或是在此处输入M语言公式进行数据转换。

④ 当前视图:用于显示当前查询视图的预览。在Power Query中对当前查询视图进行的任何操作都可以在此处看到操作效果,也可以右击某一列,进行数据转换操作。

⑤ “查询设置”窗格:用于显示当前查询视图的名称,并且记录当前查询视图从数据导入到完成数据转换的每一个步骤。如果某一步操作有误,可以单击“应用的步骤”中相应步骤右侧的小齿轮图标,对相应步骤进行修改。

⑥ 状态栏:用于显示当前查询视图的相关重要信息,如总列数、行数,列分析的执行范围、执行时间。

图2-5 Power Query操作界面的6个主要区域