前言
现代企业往往被描述为“数据丰富,但信息贫乏”。由于在交互点(如客户、病人、供货商)产生的数据的规模很大且种类繁多,这一挑战呈现出加剧且进一步失衡的现象。不管你是进行数据准备,还是分析、呈现或者使用数据,建立一套坚实的数据管理和分析方法论的基础,对于有效地通过数据表达观点都至关重要。
在本书中,我把大数据、数据科学和数据分析相关知识有机地结合起来,形成一个全面的实用指南,为你提供经过实践验证的管理分析团队和分析过程的方法论框架,作为支持本书读者探索数据分析最佳实践艺术和科学的工具箱。
本书的重点是,讨论如何建立富有成效且高效的分析组织架构和分析流程,从而加强数据与分析在组织成功中的作用。
当我开始考虑写这个特定的主题时,主要是针对当时市面上有关数据分析的论述缺少“人与流程”方面的内容。也就是说,十多年来,人们一直在撰写关于数据分析的概念、数据分析在业务中的重要性以及Python、R或SAS等技术的具体实现方面的论述。然而,这些论述一般都不涉及分析模型开发或业务案例开发的策略,也不涉及分析对操作流程的影响。
自从Tom Davenport和Jeanne Harris发表其重要著作Competing on Analytics(Davenport和Harris,2007)的十多年来,各类组织一直在努力设法解决的问题,已经从“我们可以用数据分析解决哪些问题”转变为“如何发现、培养、留住数据分析专业人才”。这种从“什么”到“如何”的转变促成了我编写这本书的初衷。我自己也认为这本书正合时宜,因为各个行业都在通过对数据和分析的接纳与使用来改变自己。虽然不少企业已经克服了在日常业务处理以及战略决策中如何有效使用数据分析的障碍,但还有很多企业刚刚认识到数据分析的价值,他们看到了数据分析的光明前景,却没有明确的路线图来实现这一目标。对前者来说,挑战是有效性或者进一步提高效率。对于后者来说,真正的挑战往往是为数据分析创造一种企业文化或者思维模式,为发展企业的数据分析能力找到合理依据,并为成功开展数据分析而规划和调整组织架构。
本书的灵感来自Ralph Kimball的作品,我记得当我读第1版的Data Warehouse Toolkit(Kimball,1996)时,我在心里对自己说“这本书讲得有道理。”与一般商业和技术书籍中经常出现的大谈概念的处理方法非常不同,Kimball在这本书中为我们提供了真正进行数据仓库建设所需要的实用方法、工具和流程。不管是针对已经熟悉数据仓库的专业人士,还是刚开始接触这一解决方案的初学者,Kimball在书中都给他们提供了数据仓库相关领域的准确概述,以及数据仓库全生命周期和关键流程的完整框架。我希望你会发现,本书能够不负这一灵感,它为数据分析生命周期提供了一个全面和实用的指南,并着重于为你的组织打造行之有效的数据分析能力。
这本书不同于其他讲“如何做”的工具书,因为它不是指导你如何构造分析模型的“食谱”,而是重点讨论数据分析中用到的最佳实践和各种流程。本书的适用人群包括:
·组织的领导者和分析决策者。指那些需要理解建立和保持企业分析能力与文化的重要意义的组织领导者和分析决策者,包括那些近年才有的首席分析官或首席数据官。
·分析团队。指那些以设计、开发和提供分析服务或分析产品为主要任务的分析师团队。该团队包括分析产品经理、团队负责人、分析人员、项目经理、统计学家、科学家、工程师、数据科学家,以及构建分析模型的量化专家。
·有抱负的数据倡导者。指那些通过数据或分析产品基于事实依据来解决业务问题的人。所谓数据倡导者,也就是那些希望通过数据来提高业务绩效、支持决策或改变某些业务流程的人。
这本书分为三个部分:
1.分析基础。首先概述分析是什么,以及如何把分析应用于解决组织中的一些实际问题。重点转移到把分析作为一种组织的内在能力,并从不同的角度来阐述如何让分析为组织的整体目标服务,分析(和数据)策略如何指导我们的行动,如何实现这些能力。然后讨论如何通过整合组织的人员、流程、技术和数据等资源来实现这样的分析能力。
2.分析生命周期最佳实践。介绍不同种类的分析产品和服务,以及如何支持分析产品或服务的设计、开发和交付。整个分析生命周期可分解为五个最佳实践领域,以及相对应的支持分析产品开发的特定流程。
3.分析能力卓越常青之道。围绕如何让分析产品对组织的完善和持续改进产生最大作用展开讨论,内容包括如何衡量分析项目的效果和效率两个方面,以及如何应用行为经济学、社会心理学和变革管理等其他学科的经验与知识改进并完善分析过程。
在第1章中,你可能会觉得分析学的语言或术语令人困惑甚至望而生畏。在对分析学进行概念讨论或者描述时,通常会用到像科学、学科和最佳实践这样的术语。
然而,像方法(method)、方法论(methodology)或方式(approach)这样的术语则一般用来指分析流程。
编写本书时,我的做法是不做主观假设,尽可能把整个分析过程中的方法论都描述清楚。为此,我尽自己最大的努力,通过简明的例子和尽可能准确的描述,使数据分析变得容易理解。
读到这里,如果读者认同数据分析是个有趣的主题,值得深入学习和探讨的话,你会认同我的做法。但如果还需要列出进一步阅读本书的10个其他理由,这些理由大致如下:
1.为那些想理解分析工作的完整生命周期并由此构建组织架构和有效分析流程的人士提供了一个实用指南。
2.为组织提供建立分析师团队的方法论框架,包括团队职能定位和团队设计方法。
3.围绕如何高效发挥分析团队的作用以及关于创建分析产品的设计思维两个方面,探索分析工作中所涉及的人才管理和流程设计两个主要问题。
4.讨论分析工作岗位序列以及分析团队成员需要如何进行分工和承担哪些角色。
5.来自现实世界的一些分析案例研究。
6.把与分析文化相适应的概念(例如“数据中心主义”和计算能力)与数据和技术策略联系起来。
7.为分析工作的领导者提供理解分析的方法和知识,为分析工作的实践者提供开展工作的工具箱。
8.提供对一个工具和模板库的访问权限,包括支持领导力、流程改进和团队赋能的最佳实践方法。
9.从分析生命周期的基本内容开始,讨论相关的知识领域和最佳实践案例,然后详细介绍分析团队的各项流程。
10.本书作者是一位长期从事数据分析的专业人士,他参与并见证了横跨多个行业的数百个各具特色的数据分析场景和应用。
希望本书可以为刚开始从事分析工作的人士提供有用的指导,也可以为那些有丰富分析工作经验的人士提供参考意见。分析旅途愉快!
关于配套的网站
在本书的配套网站(http://www.analyticslifecycletoolkit.com/)上可以找到各种资源[1],包括本书中提到的工具和模板。除了那些可以用来加深理解本书所阐述概念的检查清单(checklist)、模板与各种材料外,该网站还包含各种与分析相关的资源、引用及其他信息的链接。此外,你可以在网站上注册并通过电子邮件随时获得内容的更新,你还将找到一个博客,我在这个博客里会讨论整个数据分析生命周期的实际含义与影响。
[1] 关于本书教辅资源,只有使用本书作为教材的教师才可以申请,需要的教师可向约翰·威立出版公司北京代表处申请,电话010-84187869,电子邮件sliang@wiley.com。——编辑注