5.4 评判数据中台建设效果
在建设一个项目之前,我们一般要先定义好评判这个项目建设效果的标准。那么,如何判断我们建设的系统是不是成功的数据中台呢?
目前来看,企业的数据平台建设可能有以下形态。
·企业级数据仓库:传统的基于关系型数据库的数据仓库、BI、数据可视化。
·传统大数据平台:以Hadoop、Hive、Spark为代表的传统大数据生态系统。
·云原生数据平台:实时数据和流数据处理、数据流水线、数据服务及机器学习。
第1章介绍了评判一个大数据平台能否承担数据中台任务的标准。简单来讲,一个大数据平台能够让企业所有部门在同一个平台上使用同一个数据管理体系和同一个数据应用体系来实现数据价值,就代表它能够承担建设数据中台的任务。也就是说,同一套体系能支持全局的数据能力的抽象、复用和共享,我们就认为它实现了数据中台的功能。阿里的OneID、OneModel讲的就是同一个数据管理体系,OneService讲的就是同一个数据服务体系。
我们认为,数据中台建设的成功与否不应由一些名词来评判,而应由数据中台在企业中的使用方式及使用效果来评判。下面列出评判数据中台使用效果的12个方面,大家可以从这些方面判断数据中台的建设是否成功。这些方面是指导性的指标,我们会在第6章介绍数据中台建设方法论时详细讲述如何使用具体的指标来量化这些方面。
·数据能力复用度:系统中提供了多少种可以共享的数据能力?这些能力达到了何种复用程度?
·可协作程度:跨部门的协作是如何在系统中实现的?能否在各部门独自开发的情况下达到全局的有序管理?
·可理解性:系统的当前状况、数据和应用的使用情况、数据如何使用等,是否有直观可理解的方式?对系统的理解和认识是仅个别人掌握还是存在系统的方法?
·可适应性:添加一个新的工具或处理框架所需操作的复杂性如何?多快能够将其加入系统?添加一个新的数据源类型需要多长时间?
·自动化程度:系统中的手工操作有多少?有哪些人工操作是应该由系统自动完成的?系统是否能自动发现运行中的问题?
·可衡量性:系统的效率和ROI是否可衡量?系统的使用程度和资源消耗是否能精细化管理?
·管理程度:系统中的人员、数据、应用、资源是否完全在管理之下?在每个时刻系统的运行情况是不是明晰?日常管理需要进行哪些操作?
·系统复杂度:整个系统的复杂度会不会随着数据、人员、应用的增加而不断升高,最后导致不可管理?
·用户易用程度:用户需要多长时间的培训才能使用系统?业务部门需要多长时间才能自助管理自己的数据和提供数据服务?在平时操作(例如导入新数据源、开发新的数据看板)中,需要多少专门的大数据开发人员支持?
·弹性和扩展性:系统的资源使用情况是不是合理(系统负载不能太高也不能太低)?是否可以随时实现扩缩容?
·安全管理复杂度:系统里的数据和应用都需角色管理、权限管理,我们的系统是如何处理的?人员加入、人员离职都是如何处理的?是否能自动发现对系统的异常访问?
·可靠程度:系统可靠程度如何?系统如何处理机器失效、数据错误、程序故障?出现需要人工干预才能恢复的故障的频率是多少?一般多长时间能够恢复系统正常运行?
可以为这个列表创建一个打分卡,看看我们在数据中台建设中各个方面的表现,并在后续的工作中持续改善。