1.5 本章小结
在很大程度上,分析是一项有弹性的工作,因为它能够影响我们的工作方式、我们所做的决策以及我们取得的成果。分析常常与大数据、数据科学、信息学,甚至商业智能放在一起讨论。
然而,分析应该被看作是一种组织战略,分析生命周期是一组最佳实践,每一种实践都有互补的过程。事实上,我在本书中从操作上将分析定义为一种全面的、由数据驱动的解决问题的策略。这个定义可能不会减少那些把分析与统计学、计算机算法、数据可视化或海量大型数据库混为一谈的人的困惑,但如果你一定要这样做,请务必相信:(1)分析与上述领域确实不是一回事;(2)尽管它们都非常有用,但它们的许多内容仍然只是工具,而不是由数据驱动的、基于事实的探索和解决问题的科学或者方法论。我认识很多没有统计博士学位的杰出分析思想家,这从另外一个角度也说明分析与统计并不是一码事。
分析应被描述为一个过程,并具有以下可以观察到的特征:
·分析不是终点,而是获得洞察力以实现变革的过程。分析是将数据转化为切实可行的措施的艺术和科学。
·分析使我们在数据中发现有意义的模式,支持使用数据来检验所得到的结论(或采取行动)。
·分析不是一种技术,虽然技术是用来支持分析过程的。
·分析不仅仅是简单地计数或使用基本的数学,而是利用我们对过去的了解来预测和优化未来。
·分析可以包括但不一定必须是计算密集型的、只能由硅谷“数据科学家”使用的算法,而是由对预测未来充满好奇心的人们——我们称之为“数据倡导者(Data Champion)”——掌握的方法。
·分析必须从创建“决策”过程的输入开始,也就是说,分析过程需要创建一个数据产品——不论其大小,不论其是否可重复使用——该数据产品将为另一个分析过程提供输入信息。
就像许多在现代分析方法出现之前建立的组织策略一样,我们将继续进化我们的思想,提高我们理解世界的能力。我们得益于以前工作所积累的知识,包括科学流程、统计学、探索性数据分析、数据挖掘、人工智能、数据可视化、计算科学、心理学和行为经济学、精益思维、六西格玛等。以上领域均对分析科学做出了独特的贡献,包括思考、学习、解决问题、决策制定和行为改变等。
探索性数据分析
探索性数据分析(Exploratory Data Analysis,EDA)是在开展分析工作之前理解数据和决定需要澄清哪些问题的过程。
在本书的第三部分,我们提供了一个将分析付诸行动(actioning)的实用视角。虽然付诸行动是一个非正式术语,我们仍使用“付诸行动”这个词,是因为它意味着通过分析成果去推动变革;也就是说,“将分析付诸行动”是一种有组织的、基于特定目标的、需要取得产出的活动。