34招精通商业智能数据分析:Power BI和Tableau进阶实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4 Power BI和Tableau的对比

下面从6个方面讨论Tableau和Power BI的区别:

(1)视觉呈现和易用性

(2)数据准备

(3)数据建模

(4)生态系统

(5)产品与服务费用

(6)安全控制

1.4.1 第一回合:视觉呈现和易用性

Tableau被誉为“数据挖掘时代的梵高”,用Tableau做出来的报表从美学视角上看效果很不错。前文提及,Tableau的报表设计是有很深厚的学术理论做背书的,无论是色彩搭配还是图形精致度,都是首屈一指的。用Tableau做出的图表效果都很精美,如图1.4.1所示。

图1-4-1

另外,Tableau在易用性方面也是可圈可点的。在其中通过界面操作即可产生多种简易度量,无须输入公式,非常直观。在图形控制方面Tableau也是十分灵活的,这使其商业分析更具洞察力,如图1.4.2所示。

图1-4-2

相比之下,Power BI有一点像数学统计功底很强的理科生,使用Power BI做出来的图表中规中矩,缺少让人惊艳的感觉。另外,Power BI虽然计算功能强大,但在许多场景中需要通过公式来实现,在易用性方面略微逊色。

所以,在视觉与易用性方面,Tableau明显胜出。

1.4.2 第二回合:数据准备

在数据准备方面,Power BI的功能非常全面。微软设计了一套M语言专门用于数据准备工作。通过Power BI的IDE(集成开发环境)界面(见图1.4.3),分析人员不需要编写代码就可以轻易完成许多数据清洗任务。高级用户甚至还可以通过直接编写M公式来完成更为复杂的数据清洗工作。M语言的学习难易度与VBA相近。

图1-4-3

直到2018年5月,Tableau才推出数据清洗工具Tableau Prep(见图1.4.4)。Tableau Prep的功能也有独到之处,其最大的亮点是可以智能改正拼写错误。即使如此,Tableau在自动化方面与Power BI仍有一段明显的差距,而且其IDE界面只支持图形操作,不支持代码编写,高级功能受到限制。就像一个真正的Excel高手不可能不懂VBA代码,IDE永远无法完全取代代码的功能。

图1-4-4

与任何新产品一样,Tableau Prep未来必定需要一段时间去完善,相信Tableau Prep必然会成为Power BI强有力的竞争者。Tableau Prep有30天的试用期,已经购买了Tableau Desktop的用户则有两年的免费使用期。有兴趣的读者不妨到Tableau官网下载一试。

1.4.3 第三回合:数据建模

强大、高效的数据模型可以支持BI工具准确地计算商业数据,这也是BI工具的核心价值之一。在传统BI产品中,大多数分析人员无法直接接触数据模型。初级分析人员往往将重点放在光彩夺目的报表图形上,而忽略了合理构建数据模型的重要性。

前文提到,因为有SQL的“基因”,Power BI在建立数据模型方面有着得天独厚的优势。而在使用时,通过拖曳就可以快速建立表间关系,非常直观,如图1.4.5所示。一些在SQL或者Excel里用尽全力也未必能实现的计算逻辑,通过DAX语句可以巧妙实现。DAX语句的难易程度随着应用场景的复杂程度而变化,因此,即使用户已经有若干年的DAX语句使用经验,仍会在不经意间发现DAX新颖神奇的用法。

图1-4-5

在计算性能方面,DAX是基于xVelocity内存优化技术的高性能列计算,其优点是运算高效、空间高度压缩。任何度量值的计算都是在内存中释放及完成的,其本身不占用磁盘空间。DAX Studio是一款针对DAX开发的专业设计工具,可用于DAX算法性能测试,帮助使用者找到最优算法。可见,在建模方面Power BI做到了极致。

在模型搭建方面,Tableau主要通过联接和混合两种方式建立表关系,初学者需要一些时间理解它们的区别,如图1.4.6所示。因此,对于相对复杂的关系图,Power BI的视图关系会更为直观。Tableau也有自己的一套查询语言:Tableau Query Language(TQL)和LOD (Level of Details language)表达式,其功能覆盖了大多分析场景,难易程度接近普通的Excel公式,但不如DAX的公式应用范围全面。

图1-4-6

在计算性能方面,Tableau 10.5版本发布了一款Hyper数据引擎技术,该技术使查询海量数据的速度提升了5倍,提取生成数据的速度提升了3倍。Hyper可以被看作是Tableau新推出的内存驻留数据引擎技术,可对大型或复杂的数据集快速进行数据提取、分析、查询、处理。另外,Tableau中的“集”这个概念是独有的。集和组的不同之处在后文会介绍,但集的应用使自助化分析更加灵活。

对于分析中的一些普通的业务场景,无论是Tableau还是Power BI,都能快速、高效地实现,它们的优点各有千秋。但若是遇到特别复杂的业务场景,例如复杂的迭代计算,那么Power BI在数据建模方面多年积累的优势就凸显出来了。

世界上没有十全十美的事物,对于一个武林高手,其强大的武功水平和练习的时间是成正比的,唯有深度理解并掌握分析表达式,才能真正发挥BI工具的神奇之处。SSBI虽然看上去简单,但掌握并不容易。如果简单地认为只是创建几个表,就学会Power BI/Tableau了,就太天真了。

优秀的BI模型设计好比把房子盖在磐石上,当发大水时,因为根基立在磐石上,房子不会被冲倒,保障了住户的安全。不良的BI模型设计好比把房子建在沙土上,水一冲,房子就坍塌了。因此,建立数据模型对于分析师来说非常重要。

1.4.4 第四回合:生态系统

这里说的生态系统分为两个方面:软件生态系统和用户生态系统。

1.软件生态系统

从SQL数据库到组织协作工具Share Point,再到办公工具Office 365、移动平台、Azure数据流服务等,微软丰富的产品线是其他厂商无法比拟的。而这些应用程序都能与Power BI配合使用。举几个例子,企业级Power BI的应用后台可以直接连接SSAS服务,报表呈现可以依赖Power Point或者Share Point,前端销售人员可以通过移动设备里的Power APP将数据通过Power BI更新到数据库中,Azure数据流服务也可以通过Power BI进行实时数据展现。

2.用户生态系统

微软在近几年越来越接地气了,也越来越为用户考虑了。Power BI社区就是一个好例子:用户可在Power BI社区中提出各种改进建议,微软会采用其中一些好的建议,并于每月初发布到Power BI Desktop的新版本中。这样高效的更迭频率从Power BI Desktop问世以来就一直保持着,让人咋舌。不仅如此,微软还鼓励Power BI的用户自主开发视觉化图形,其中优秀的设计图形会被纳入公共图形库中让用户共享,目前其基础图形库已达百余种。

Tableau支持的数据源类别很丰富,基本与Power BI相当,而展现端的分享却只能依赖Tableau Server平台。虽然Tableau同时支持在移动设备上展示,但Tableau公司目前只有Tableau Desktop与Tableau Server两款主打产品,即使再加上新问世的Tableau Prep,其生态系统仍略显单薄。

Tableau也有自己的在线社区,与Power BI类似,但不提供用户共享Tableau图形。除了社区,Tableau还有一个对公众完全免费开放的在线平台Tableau Public,用户只需下载Public版本的Tableau,就可以免费使用Tableau Desktop的所有功能了,该平台上的所有作品都由来自世界各地的用户创作,其中的主题丰富多彩,用户可以充分利用此平台进行实践和学习,如图1.4.7所示。

图1-4-7

1.4.5 第五回合:产品与服务费用

Power BI在收费方面更有优势。首先,Power BI Desktop工具本身是免费的,从其官网直接下载就可以了。Pro License会收取9.99美元/月的升级服务费用,服务包含网上共享协作、额外空间、增加刷新频次。云计算能力由微软公有云提供,用户可以享受60天免费体验Pro License,但需要用公司邮箱注册账号。Power BI Premium适合企业级应用场景,在这个Premium包里,企业享有专用的CPU、带宽,并可以自行决定Power BI Pro用户的数量,购买数据的用户不需要再购买Power BI Pro,可以为企业节约一笔可观的资金,如图1.4.8所示。

图1-4-8

需要提醒的是,Power BI Pro分为国际版和国内版。国际版由微软提供运营支持,国内版本由21世纪互联提供运营支持。这两个版本之间的数据不能相互流通。所以,在一开始选产品时要根据企业的自身需求进行选择。

图1.4.9展示了Tableau的费用,此处的Tableau Creator其实是Tableau Desktop+Tableau Prep+Tableau Server的组合;Tableau Explorer包括Tableau Server;Tableau Viewer其实是只读属性的Tableau Server,最小购买数量为100个许可。Tableau Desktop有14天的试用期,Tableau Server Online有30天的试用期。

图1-4-9 Tableau的收费表

1.4.6 第六回合:安全控制

下面从两个层面讨论Power BI及Tableau的安全控制。第一个层面是用户或用户群对报表的访问权限控制,第二个层面是指行级别安全控制。

举一个例子,例如亚太区的销售人员,只能查阅亚太地区的销售数据,不能查阅北美地区的销售数据。换言之,第一个层面的访问权限控制是控制是否能查看数据,第二个层面的行级别安全控制是控制在第一个层面的基础上能看什么。

对于第一个层面的权限功能,所有的BI工具都可以做到,Power BI及Tableau都支持目录服务认证(Active Dictionary认证)。至于第二个层面的控制,Power BI和Tableau分别通过DAX语句和Tableau语句进行行级别权限更细化的控制。

总体而言,二者的功能相当,只是实现过程有少许差别:Power BI中有权限角色(Role)的概念,管理员通过角色设置规则,再为具体用户或用户组添加权限,如图1.4.10至图1.4.12所示。

图1-4-10

图1-4-11

图1-4-12

而Tableau使用USERNAME函数和ISMEMBEROF函数来判断用户是否属于Tableau Server或Tableau Online中某个组的成员,从而限制用户的具体访问内容,方便管理员对用户组的管理,如图1.4.13所示。

图1-4-13

Power BI与Tableau的功能实在太强大,都有可圈可点之处,而且日新月异,这样比下去可能要比到100回合。与其仅仅停留在理论上的比较,倒不如通过Power BI与Tableau分析商业实例,走入真实的BI世界,更直观地比较二者的区别。