第1章 EDIT模型概述
本章主要讲解EDIT(探索、诊断、指导和工具)模型的基本思想。
首先是关于感知型企业与EDIT数字化模型的由来。感知型企业的定义来源于同名畅销书。在“感知型企业”的概念中,把企业分为5个不同的阶段,分别是敏捷分析阶段、行为数据阶段、协同思维阶段、分析应用阶段和自主决策阶段,如图1-1所示。
图1-1 “感知型企业”与数据应用系统的演进图
敏捷分析是第一阶段,是对于某个类型的企业在进行经营决策时所需要的数据分析支撑。例如,分析某款产品是否有利可图,或者公司现在的某个业务绩效如何,又或者企业投资了多家机构之后试算投资产出比是多少等问题。我们经常会遇到这样的问题,相对传统的机构需要每个部门在指定日期上报相关指标,但是经常发现不同部门相同指标的计算方法和口径不一致,或者上个月计算的指标和这个月计算的指标不一致,原因是计算的人员发生了改变。因此需要企业进行规范,由统一的部门负责数据采集、数据整理和指标计算,在这里企业所用的平台一般被称为数据仓库。传统的数据仓库是整个企业数据的集散中心,它从很多源系统中把数据采集过来,根据统一的指标定义进行数据加工,用于满足业务部门常用的报表或可视化平台数据分析等需求。在这类数据分析中,主要工作者是BI工程师。
在敏捷分析阶段,主要针对业务宏观方面的分析,如财务报表、财务报告或经营分析等,希望能够从业务宏观角度把控结果。但是,如果企业准备开展某款产品的精准营销,想了解哪些用户更容易接受这次营销,又或者某家银行想对一批用户推广贷款业务,需要明确哪些用户的违约概率最低,这些问题都需要进行微观行为分析,对每个个体进行算法建模来预测其行为结果。那么,什么是行为分析或行为数据呢?行为数据就是用户与企业交互中产生的动账类数据和非动账类数据。例如,银行对某个用户进行贷款营销推广,这个用户接受本次营销,于是产生的就是申请贷款的行为。如果该用户办理贷款后未按时还款,那么就出现了违约行为。在行为数据阶段,我们其实需要预测用户未来的行为是什么。在进行预测时,我们是在用户个体层面上进行分析、建立模型的,这样的分析属于微观层面。但用户行为产生的数据量是非常大的,这些数据全部被存储在数据仓库中是不现实的。过去传统的数据仓库基本上存储的都是用于处理公司业务的经营业绩等数据,目前很多产品App中存在着大量的用户浏览行为数据,这类数据一般情况下是不会被存储到数据仓库的,但是为了对用户行为偏好进行数据挖掘,会将这部分数据保存在数据平台中。数据平台底层(也称为数据湖)存储着大量用户的交易和行为方面的数据,而用户标签体系就是将用户的基本行为信息进行抽象,从而建立标签,如用户的平均收入标签或收入波动性标签,都是可以通过对用户过去6个月的账户余额求均值或计算过去一年每个月收入的变异系数来分别衡量的。这些标签被提炼出来可以用于进行产品或渠道的用户画像。因为数据平台中存在大量的数据,而建立用户标签是一个非常复杂的过程,既需要用户掌握编程语言,又需要学习统计学和机器学习方法,甚至需要会一些深度学习的算法,所以数据平台的主要用户是数据科学家。
在开始建立模型时,一般情况下都是数据科学家主导建模的。例如,银行需要对用户信用等级进行评分,但是数据科学家对业务的理解并不是那么透彻,而且数据科学家没有从事银行一线工作,对具体的需求并不了解,难以分析业务真正的需求。为了更好地分析业务需求,业务运营人员与数据科学家进行深度合作,企业进入协同思维阶段,也被称为协同分析。
在协同思维阶段,业务运营人员会逐渐认识到数据驱动的重要性,与数学科学家合作一同完成模型的开发,也就是业务与技术的协同。
随着数据应用场景逐渐丰富,企业开始进行数据产品化管理,大量的数据产品使用相同的算法模型,如信用评分卡,在很多场景中都会被使用。这些场景包括个人经营贷款、信用卡申请、小微企业贷款,甚至可以用在整个生态中与其他合作伙伴共享。因此,建立数据产品制度被重视起来。数据产品的需求量越来越大,于是进入了分析应用阶段,其依赖的基础就是数据中台。
数据中台主要是为数据产品服务的,可以理解为一个数据产品的生产工厂。数据中台提供数据产品开发的流水线。只有满足业务需求的数据产品,才是最有价值的,所以数据中台的用户更多的是业务人员。数据中台提供数据资产化的指标、标签、知识图谱和算法模型等,还集成了DataOps和MLOps工具,从而方便业务人员自主建立数据产品,包括从简单地制作各种报表,到诸如预测用户响应和识别反欺诈等复杂模型。
最后的阶段是自主决策阶段,实现数据自适应,业务流程完全自动化。例如,当业务运行时,突然发现某个信贷产品的申请通过率从过去的50%降到20%,这时就要分析出现问题的原因。在该阶段的流程中,当发现存在生产问题时,会自动识别出现问题的具体原因,是客群发生变化,还是策略调整出现问题,又或是数据出现问题,找到出现问题的原因并进行及时修正。如果是数据出现问题,那么就需要重新计算标签、训练模型、调整参数。
以上就是企业数据应用能力的5个层次,为了简洁地描述数字化企业的工作模式,我们提出了EDIT企业数字化模型,如图1-2所示。
图1-2 EDIT企业数字化模型
外环是企业的业务部门要做的事情,如对业务的探索、发现运营中存在的问题、定位问题后进行原因诊断。诊断完毕后提供解决方案并指导落地,这是需要业务人员来完成的。而数字化工作中需要用到的一些工具,如数据模型、算法模型、优化模型,都需要企业的数据部门提供。