1.2 数据分析的思维模式
运用数据分析的方法去思考问题、解决问题对数据分析师来说是十分重要的,毕竟工具的运用大同小异,思维的不同才决定个体的差异。初级数据分析师如何进阶成为高级、资深的数据分析师呢?就是学习思维模式。思维决定发展,思维的不同导致结果的不同。这一节我们来探索数据分析的思维模式。思维模式有很多,这里列出5个数据分析中常见的思维模式供读者学习参考。
1.2.1 结构化思维
结构化思维是很重要且应用极为广泛的一种思维模式,该思维不仅会被应用于数据分析,几乎所有的行业都会用到。结构化思维其实是一种分类汇总的思想,如图1.2.1所示,就是将看起来复杂凌乱的内容以某种结构呈现出来。你可能每时每刻都在用这种思维,只是没有刻意去关注。例如生活中的收纳方法:收纳鞋子有鞋柜,收纳厨具有橱柜,将杂乱无章的东西分门别类地归纳在一起,在需要用的时候可以很方便地找出来。又如写作的时候先列出大纲和目录,再填充内容。这些都是结构化思维在生活中的运用。在数据分析中也是这个道理,我们给数据表起名、给列赋予字段,这些都是简单的结构化思维的应用;更深入一些,可以给指标分层,如用户的姓名、性别、年龄是用户基本数据信息,用户的关注率、点击率、浏览率是拉新阶段的数据信息。例如一个微信公众号,它每时每刻可以产生大量的数据,我们可以从拉新、促活、转化3个阶段来将这些数据分类,使之条理化、结构化,便于分析。
图1.2.1 结构化思维
常见的运用结构化思维的例子有麦肯锡7S模型,如图1.2.2所示。该模型是用来描述企业在发展过程中要考虑的各方面的情况,从而有理有据地制定战略规划的手段。“7S”主要包括结构(Structure)、制度(System)、风格(Style)、员工(Staff)、技能(Skill)、战略(Strategy)和共同价值观(Shared Values)。将所有要考虑的想法先按“7S”分类,再进行汇总,从不同的层次出发分析问题,最后得出结论,这就是典型的结构化思维。
图1.2.2 麦肯锡7S模型
1.2.2 漏斗思维
图1.2.3 用户行为转化漏斗
漏斗思维是通过确定关键环节,进而完成一套流程式分析的思路。该思维在各行各业都有应用,如注册转化率分析、用户浏览路径的分析、流量监控等。以图1.2.3所示的用户转化率分析为例,从网页展示到下单的全过程运用漏斗思维,实际分为5个关键步骤:曝光、点击、浏览、咨询、下单。假设该网站在曝光阶段拉取到了100个用户,其中有80个用户点击了该网站,那么从曝光到点击这一步骤的转化率就为80%;又有50个用户浏览了整个页面,点击到浏览的转化率为62.5%;有30个用户咨询了网页客服,那么浏览到咨询的转化率为60%;有10个用户最终完成了订单交易,那么咨询到下单的转化率为33.3%。这样统计每一步的用户数,得到相应的转化率,按照用户数来画图,步骤越往下,用户数越少,形状像是一个漏斗,因此这个图又称为“漏斗图”,这种分析方式称为“漏斗分析”。运用漏斗分析时要注意确定关键的环节,并得到相应的数据。
1.2.3 矩阵思维
矩阵思维是通过两组指标的交叉结合来分析问题的思维方法,比较典型的矩阵思维应用是波士顿矩阵,如图1.2.4所示。波士顿矩阵又叫“市场增长率—相对市场份额矩阵”或“四象限分析法”。波士顿矩阵广泛应用于商业营销对产品的组合分析中,它由横纵两坐标构成,纵坐标为增长率,横坐标为市场份额;这两个指标在平面中交叉,可以划分出公司所有产品的4种业务组合。
① 问题型业务:高增长率,低市场份额。这种业务带来的利润高,市场份额却少,前途可以说是一片光明,对公司来讲有较大的风险,同时也有很大的利润。
② 明星型业务:高增长率,高市场份额。这种业务增长率高,市场份额也高,是成长起来的明星,公司对这种业务要加大资金投入。
③ 金牛型业务:低增长率,高市场份额。这种业务增长率低,市场份额高,在公司所有业务中属于已经很成熟的,趋于稳定,能够为企业带来大量的现金流。
④ 瘦狗型业务:低增长率,低市场份额。这种业务没有足够的增长率,也没有足够的市场份额,应趁早放弃,及时止损。
矩阵思维还可应用到平时工作和生活中,如将事情按重要和紧急程度划分为四象限的任务分析矩阵,如图1.2.5所示。应优先处理重要且紧急的事情,其次处理紧急不重要的事情,通常情况下重要不紧急的事情可能才是真正能提高技能的工作,而不紧急又不重要的事情可以暂缓。我们按照这个象限法则可以平衡地处理工作和生活中的琐事。
图1.2.4 波士顿矩阵
图1.2.5 任务分析矩阵
1.2.4 相关性思维
相关性思维是通过分析几个指标之间的相互关系,得到相应的规律,以为企业的决策提供支撑。运用相关性思维分析问题时,不仅要看单个指标的变化,还应关注两个甚至多个指标之间的相互关系,从而发现一些内在的规律。体现相关性关系的指标是相关系数,在第4章中会对相关系数进行详细讲解。
需要注意的是,相关性并非因果性。相关性是指两个变量有着相同(或相反)的变化趋势,因果性是指一个变量的变化导致另一个变量也跟着变化,所以有相关关系的两个变量不一定存在因果关系。例如,科学家经过统计发现,人的睡眠时间同收入呈反比,那我们可以由此得出睡眠时间越短,收入就越高的结论吗?显然不行,因为这两个变量只是在统计学上存在相关关系,而非因果关系。蝴蝶效应可以说是一种因果关系,即因为蝴蝶扇动了翅膀,导致身边的空气系统发生变化,进而引发了龙卷风。但是蝴蝶效应更趋向于一种混沌现象。现实生活中,很难找到100%的因果关系。
1.2.5 降维思维
数据量大是大数据时代一个典型的特征,如何通过分析大量繁杂的数据得到一个问题的答案?这就要用到降维的思维,如图1.2.6所示。降维首先要有维度,用结构化思维将大量的数据拆解成各个维度,再给每个维度赋予相应的权重,最后得到一个综合评价指标。将多个数据变成一个指标,这就是降维。灵活运用降维思维有助于对数据的理解和分析。
举一个简单的例子:如何评价学生的综合能力,从而确定优秀学生呢?我们可以从语文成绩、数学成绩、英语成绩、体育成绩、思想政治成绩5个相互独立的指标来衡量。对每个指标进行标准化,将所有的成绩指标都转换为0~100的数值,并确定每个指标的权重(权重根据历史数据和经验划定,或根据特定算法计算,权重累加为1),最后得到学生综合能力分数=语文成绩×0.3+数学成绩×0.3+英语成绩×0.2+体育成绩×0.1+思想政治成绩×0.1,这就是降维思维的应用。
降维思维经常能在各个数据分析报告中体现,如高德地图发布的《2019年Q1中国主要城市交通分析报告》中提到了一个“地面公交出行幸福指数”。该指数融合了地面公交运行的多项指标,综合地描述地面公交的运行水平,该指数越高,说明公交运行水平越好。类似的降维思维在实际生活中运用得十分广泛。
图1.2.6 降维思维
练一练
如何分析一款游戏?
提示1:用漏斗思维思考游戏的生命周期,包括成长期、成熟期、衰退期。
提示2:用结构化思维思考游戏在生命周期各阶段有哪些指标值得关注。