2.6 假设检验分析方法
2.6.1 什么是假设检验分析方法?
假设检验分析方法底层思想其实很简单,就是逻辑推理。这个逻辑推理,在我们生活中无处不在。如果你看过《神探狄仁杰》《白夜追凶》《唐人街探案》这些破案片,就会发现,剧中的破案高手都有一个破案套路,那就是先假设某个人是嫌疑人,然后找证据,如果有足够的证据证明该嫌疑人犯罪,才宣判嫌疑人有罪。
同样在现实中,法官在审理案件的过程中,也首先会假设被告方无罪,而指控方的工作就是搜集证据来说服法官或陪审团,最后得出罪犯有罪的结论。
我们平常说某个人心思细腻、逻辑严谨,其实你也可以做到,那就是掌握逻辑推理的方法:假设检验分析。假设检验分析方法是一种使用数据来做决策的过程。假设检验分析方法分为3步(图2-49):
图2-49 假设检验分析方法的步骤
1)提出假设
根据要解决的问题,提出假设。例如警察破案的时候会根据犯罪现场提出假设:这个人有可能是嫌疑人。
2)收集证据
通过收集证据来证明。例如警察通过收集嫌疑犯的犯罪数据,来作为证据。
3)得出结论
这里的结论不是你主观猜想出来的,而是依靠找到的证据得到的结论。例如警察不能主观地去猜想,然后下结论说这个人是罪犯,而是要通过收集的数据(证据)来证明这个人是不是罪犯。
2.6.2 假设检验分析方法有什么用?
由于假设检验分析方法背后的原理是逻辑推理,所以学会这个方法以后,可以显著提高我们的逻辑思维能力。
假设检验分析方法的另一个作用是可以分析问题发生的原因,也叫作归因分析(图2-50)。例如面试过程中,面试官问“为什么申请量上升了,放款量反而下降了?”这类问“为什么”的题是工作中经常遇到的场景,例如是什么原因导致活跃率下降等。这类问题就是分析原因。通过找到问题发生的原因,才能根据原因制定对应的策略。
图2-50 假设检验分析方法的作用
下面通过案例看下假设检验分析方法是如何起作用的。
电影《决战中途岛》讲述的是第二次世界大战中,太平洋战争重要的转折点—中途岛海战。在电影里,美军发现了日军的一段密码。破译密码后,得到一个关键词:AF。这表示日军将要在AF岛发动进攻。
可是,这个AF到底代表哪个岛呢?
美军内部出现了两种意见,夏威夷情报处认为AF是中途岛,而华盛顿情报处认为AF是阿留申群岛。如果你是作战的指挥官该听谁的呢?
你可能会说,在两个岛上都部署航母,这样做到万无一失。理想是美好的,但是现实却是残酷的。因为当时美国的航母比日军少,它只能把有限的资源集中放到一个岛上。确定这个岛是中途岛还是阿留申群岛,直接决定了战局的胜败。
现在假设检验分析方法派上了用场,目前有两个假设:假设1是AF是中途岛,假设2是AF是阿留申群岛(图2-51)。
图2-51 《决战中途岛》案例
如何验证假设呢?需要收集证据。
夏威夷海军情报处的负责人想到,很久以前,他也捕获过一条包含AF的信息,当时信息显示:日军飞机的航线会经过AF。根据那次的观察,他认为AF就是中途岛。
为了验证这个假设,美军发出了一个假情报:中途岛上的淡水处理器坏了,为的是看到日军获取到假情报的反应。果然不久就截获到日军向外发送的情报信息:AF缺淡水。
这就验证了假设,得出结论:AF是中途岛。
指挥官根据这个分析结论做出了决策,把有限的兵力埋伏在中途岛。最终美军在中途岛大胜,从而扭转了整个太平洋战场的局势。
2.6.3 如何使用假设检验分析方法?
前面我们提到假设检验分析方法的步骤分为3步:提出假设、收集证据、得出结论。
那么现在问题就来了,人们建立假设时,很容易依赖之前的经验做出假设,这可能会无意识地排除一些重要的假设。
如何客观地提出假设呢?
我们可以按用户、产品、竞品这3个维度提出假设(图2-52),来检查提出的假设是否有遗漏。这3个维度分别对应公司的3个部门:用户对应运营部,产品对应产品部,竞品对应市场部。这3个维度有助于在发现问题原因以后,对应落实到具体部门上,有利于把问题说清楚。
图2-52 从3个维度提出假设
从这3个维度,我们可以提出3种假设:
(1)假设用户有问题:可以从用户来源渠道这个维度来拆解分析,或者画出用户使用产品的业务流程图来分析原因;
(2)假设产品有问题:可以研究这段时间销售的产品是否符合用户的需求;
(3)假设是竞品导致的问题:可以看竞品是不是在搞什么优惠活动,用户跑到竞争对手那里了。
我们还可以从4P营销理论出发来提出假设。什么是4P营销理论呢?
4P营销理论产生于20世纪60年代的美国,它是随着营销组合理论的提出而出现的。营销组合实际上有几十个要素,这些要素可以概括为4类:产品、价格、渠道、促销。
(1)产品:公司提供给目标市场的有形或无形产品,包括产品实体、品牌、包装、样式、服务、技术等;
(2)价格:用户购买产品时的价格,包括基本价格、折扣价格、付款期限及各种定价方法和定价技巧等;
(3)渠道:产品从生产公司到消费用户所经历的销售路径。
(4)促销:是指企业利用各种方法刺激用户消费,来促进销售的增长。包括广告、人员推销、营业推广等。例如买一送一、过节打折等。
为了寻找销售业绩下降的原因,可以利用4P营销理论从4个维度提出假设(图2-53)。
图2-53 从4P营销理论提出假设
4P营销理论是从公司角度出发研究产品的。还可以从用户角度出发去研究产品,也就是从用户使用产品的业务流程来检查提出的假设是否有遗漏。
例如,某线上店铺最近给新会员的折扣券的领取率降低,原因是什么呢?可以先画出业务流程,根据业务流程,提出以下假设(图2-54):
假设1:进入店铺的用户减少?例如流量减少或者推广引入了大量低质的用户。
假设2:想领取会员卡的用户减少?例如店铺增设了不用领卡就能领取的其他折扣券,分散了用户的注意力。
假设3:成为会员后,想领折扣券的用户减少?例如折扣券需要达到某个门槛才能使用,门槛设置太高对用户失去吸引力。
图2-54 从业务流程提出假设
从业务流程提出假设,这里其实是用到了我们之前讲过的多维度拆解分析方法。
下面通过一个案例来看下如何使用假设检验分析方法来查找问题发生的原因。
解读报表里数据的波动是数据分析的基本功,在面试中会经常考。提出报表解读问题之前,对方通常会给你一个表格。例如图2-55里的表格是一家公司App的一周日活跃率,老板交给你以下任务:
从数据中你看到了什么问题?你觉得背后的原因是什么?
图2-55 解读数据
遇到这类问题,需要先对数据进行可视化,因为光从表格我们无法直观地看出数据随时间变化的趋势。根据这个表格,我们可以绘制出折线图(图2-56),看下数据随着时间变化的趋势。
图2-56 绘制折线图
接下来怎么分析呢?你可能会说,发现了一个问题,周六数据下降了。
之前我们讲到对比分析方法的时候,说到没有对比,就没有好坏。周六的数据和这周数据比较是下降了,那么有没有可能是这个App本身每周六就不活跃,因为周末放假大家想休息?
所以,为了更好地对比分析,对于报表解读问题,你还要问面试官往前几周的数据是怎样的,这样可以从整体上看出数据在一个较长时间范围内是怎样变化的。同时,可以看出数据变化是规律的,还是真的有问题。
你可以这样问面试官:前几周的数据是怎样的?我想和这周数据进行对比分析。
这时候面试官会给你前几周的数据,假设是图2-57的情况。
图2-57 前几周数据
通过和前几周数据对比,发现这个App的规律是每周末的活跃率都有稍微的下降。但是这周六和前几周的周六相比,下降更明显。我们可以计算出前几周周六的平均日活跃率,和这周六的日活率比较,假设发现本周六的日活率下降了5%。
所以,我们把问题明确为:本周六的日活率比前几周周六的平均日活跃率下降了5%。那么,本周六日活率为什么突然下降了呢?如何查找问题发生的原因呢?这时候假设检验分析方法就派上用场了。
假设检验分析方法的第1步是提出假设。如何提出假设呢?我们可以使用前面讲到的方法,从用户、产品、竞品这3个维度提出假设(图2-58)。
图2-58 提出假设
现在我们来看假设检验分析方法的第2步:收集证据。为了理清楚思路,在开始分析之前,可以做一个图,将问题、假设、数据从上至下连起来(图2-59)。
图2-59 分析图
对于这个案例,问题是与前几周周六相比,本周六的日活跃率下降了5%。我们提出了3个假设,为了验证假设,我们需要收集证据。
对于假设1的用户问题,我们需要从用户数据中找出证据。
对于假设2的产品问题,我们需要从产品数据中找出证据。
对于假设3的竞品问题,我们需要从竞品数据中找出证据。
也就是说,要找什么数据,是与你要验证的假设有关系。根据第2步收集的证据,我们得出第3步的结论。
这张图就像我们走路的地图一样,不管我们后面分析到哪里,都可以从这张地图上清楚地看到我们位于地图的哪个位置。
我们先来看第1个假设:用户有问题。
如果是用户方面的问题,那我们可以找到对应的用户数据。将活跃用户数按渠道维度拆解,发现来自渠道B的活跃用户数出现了明显的下跌(这里按渠道拆解,用到了我们之前讲过的多维度拆解分析方法)。
最后可以得出结论,获取用户的渠道B有问题,从而导致了本周六的日活跃率下跌(图2-60)。
图2-60 第1个假设
我们再来看第2个假设:产品有问题。
这时候就需要找相关部门了解情况,一起去排查问题了。例如,服务器是不是崩溃了?最近是否上线了产品新版本,其中新功能有问题?或者是没有处理产品版本问题导致?甚至可以去问客服,最近是不是有大量投诉,投诉原因是什么?还可以查看用户对产品满意度方面的数据。
假设最后经过调查,产品没有问题(图2-61)。
图2-61 第2个假设
我们再来看假设3:日活跃率下降是竞品问题导致的。
竞品问题是指竞争对手有什么大动作,例如竞争对手在搞活动促销,用户都跑到竞争对手那边了。通过调研发现,竞品最近没有搞大的活动。最后得出结论:没有竞品问题(图2-62)。
图2-62 第3个假设
整个分析思路如图2-63所示。
图2-63 分析思路
你可能会问了,既然假设1发现了问题,为什么还要去验证假设2和假设3?这是因为一个问题发生可能是由多个原因造成的,需要找到不同的原因,这样后面决策的时候,才能分别根据不同原因制定不同的策略。
那么分析到这里就结束了吗?当然不是,我们需要多问几个为什么:为什么渠道B的数据下跌了?这时候可以跟负责渠道推广的同事了解情况,例如发现渠道B的投放活动在周六那天正好结束了,导致App的新用户少了,从而导致了日活跃率下降。
综上,假设检验分析方法有3个步骤:提出假设,收集证据,得出结论。得出结论以后,分析还没有停止,要多问几个为什么,然后用数据去验证可能的原因。不断重复假设这个分析过程,直到找到问题的根源(图2-64)。
图2-64 假设检验分析过程
在假设检验里面我们还要用到其他分析方法,例如刚才的案例在提出问题部分,使用了对比分析方法;在搜集证据的过程中,使用了多维度拆解分析方法对用户按渠道进行拆解。
2.6.4 注意事项
假设检验分析方法需要注意4个地方:
(1)第3步得出的结论不是主观猜想出来的,而是要依靠找到的证据去证明;
(2)假设检验的3步是一个需要不断重复的过程。在得出结论以后,分析还没有停止,要多问几个为什么,然后用数据去验证。不断重复假设分析的这个过程,直到找到问题的根源;
(3)在使用假设检验分析方法的过程中,还要用到其他分析方法;
(4)在开始分析之前,为了理清楚思路,可以做一个假设检验分析图(图2-65),将问题、假设、数据从上至下连起来。
图2-65 假设检验分析图
下面来看一个案例:有一款App,在观察用户留存率的时候,发现低年龄用户的留存率比高年龄用户的留存率低很多(图2-66)。
图2-66 留存率案例
这里的低年龄用户是指18岁以下的用户,例如初中生、高中生。进一步观察发现,这些低年龄的用户大多是使用一下App就再也不用了。为什么低年龄用户的留存率很差呢?
有可能是低年龄用户白天还在上学,平日不能玩手机,只能周末玩,这导致低年龄用户留存率比较差。这个假设听起来很合理,也符合逻辑,但真实情况是这样吗?我们需要用数据来验证。
为了不让提出的假设有遗漏,我们可以从业务流程提出假设(图2-67)。
图2-67 从业务流程提出假设
第1步,新用户下载App,然后注册;
第2步,用户看到App首页推荐的内容。新用户注册的时候,App会让用户选择最感兴趣的话题,然后App根据用户的选择,给他推荐相关的内容。推荐的内容如果不准确,会影响用户的体验。例如用户挑选兴趣的时候选了电影,结果系统给他推荐了旅行,那跟用户的预期就会差很远,用户就会觉得这个平台没有他想看的信息,自然就会离开。所以,这一步我们可以提出假设:推荐的内容不是低年龄用户想看的,从而导致留存率差;
第3步,用户还可能会在App里查找自己感兴趣的内容。当用户下载了这个App注册的时候,希望在这个平台上找到对自己有价值的东西。如果没找到,那用户很大概率会流失。这一步我们可以提出假设:低年龄用户搜不到想看的,从而导致留存率差。
这样我们就提出了3个假设(图2-68):
假设1:低年龄用户白天上学没时间用App,周末才玩手机,可能导致留存率差。对于这一点我们可以通过用户的留存数据来验证;
假设2:推荐的内容不是低年龄用户喜欢的。这一点我们可以通过搜索相关的数据来验证;
假设3:低年龄用户搜不到喜欢的内容。这一点我们可以通过与用户兴趣相关的数据来验证。
图2-68 提出3个假设
首先来看假设1:低年龄用户白天还在上学,平日上课不能玩手机,只能周末玩手机,这可能导致低年龄用户留存率比较差。
之前我们把18岁以下用户都算在低年龄用户,但是18岁以下包含了3个学生阶段:小学生、初中生、高中生。如果我们按年龄维度来拆解用户,来比较他们的留存率,他们会不会有什么不同呢?将低年龄用户按年龄划分成3组,分别是小学生、初中生、高中生,然后和正常留存率的高年龄用户去比较。这里要用到对比分析方法,我们把之前讲过的对比万能模板拿出来。通过比较次日留存率,在比较表格里填好对应的数值(图2-69)。这里高年龄的次日留存率作为正常值,和小学生、初中生、高中生的次日留存率比较。表格里空白的地方不是本次比较的范围,所以没有填写。
图2-69 和高年龄次日留存率比
通过对比,可以发现:①小学生和初中生的次日留存率很差;②高中生的次日留存率和高年龄用户的次留存率没有太大的差别。所以导致留存率差的是小学生和初中生这一部分的低年龄用户,后面的分析也把研究对象细化到小学生和初中生。
前面我们提出的假设是,低年龄用户白天上课不能玩手机,只能周末玩手机。
为了验证这一假设,我们需要比较低年龄用户工作日的留存率和周末的留存率。如果工作日的留存率低,但是周末的留存率高,可以证明我们的假设是成立的。因为工作日上课,没时间玩手机,留存率差是正常,周末玩手机了,留存率就不差了。
相反,如果工作日的留存率低,周末的留存率也低,那可以说明我们的假设是不成立的。
通过比较表格里的数据发现,用户工作日和周末的留存率一样差(图2-70),留存率并不会在周末恢复回来。可以得出的结论是假设不成立,也就是在周末可以用手机的时间段,这部分用户也没有回来。
图2-70 和自己的留存率比
通过收集证据,我们发现假设1不成立(图2-71),也就是在周末可以用手机的时间段,这部分用户也没有回来。
图2-71 假设1不成立
现在,我们来看第2个假设:推荐的内容不是低年龄用户喜欢的。
根据分析目标,我们把用户感兴趣的内容和App推荐给他们的内容进行比较,就可以看出App推荐的是不是用户喜欢的了。
对于用户感兴趣的内容,可以找用户兴趣数据,这些数据是在用户注册App时选择的感兴趣话题,这部分数据都记录在App数据库中。然后分析这部分用户对什么最感兴趣。
通过对小学生的兴趣进行排序,发现这部分用户对壁纸、游戏最感兴趣;通过对初中生的兴趣进行排序,发现这部分用户对游戏、动漫最感兴趣。
我们再来看下App推荐给这部分用户的内容是什么。通过分析数据,发现App在给用户推荐的时候,没有对低年龄用户细分,也就是小学生、初中生、高中生推荐的都是电影、读书这类话题(图2-72)。这样一对比就可以发现:App推荐的内容不是用户喜欢的。
图2-72 和APP推荐内容比较
这就证明了假设2成立(图2-73),也就是App推荐的内容不是这部分用户喜欢的。
图2-73 假设2成立
现在我们来看假设3:用户搜不到自己喜欢的内容,导致了留存率很差。
想要弄清楚这个问题,需要查看用户的搜索数据,看看他们想在App里搜到什么。根据这个分析目标,我们可以获取到小学生和初中生的搜索数据,发现他们搜索最多的是壁纸、游戏、音乐,他们搜索壁纸的需求是想找到好看的图片来当头像,但是这个App里面这方面的内容很少,导致用户搜不到。
这就证明了假设3成立(图2-74),也就是这部分用户在App上搜不到他们喜欢的内容。
图2-74 假设3成立
通过假设检验分析方法,我们明确了“低年龄用户留存率很差”的具体情况和原因:
(1)小学生和初中生留存率差,高中生留存率不差;
(2)App给小学生和初中生推荐的内容不是他们喜欢的,导致留存率差;
(3)App里小学生和初中生喜欢的内容不多,导致他们搜不到喜欢的内容,从而导致留存率差。
这个分析结论有什么用呢?可以根据查找的原因给出建议,方便领导根据你的建议制定决策,例如:
(1)在资金有限的前提下,对低年龄用户做付费推广的时候,要精准投放广告,重点推广匹配App的用户,例如高中生;
(2)在做个人推荐的时候,要对用户按年龄进行细分,根据用户的喜欢推荐用户喜欢的内容;
(3)如果产品定位包括小学生和初中生,后期要在App里增加他们感兴趣的内容,例如壁纸等。
再来看一个案例:复购率下降,如何分析原因?
产品A是专为在校学生和职场人士提供技能培训课程的。最近发现,用户的复购率非常低,比竞争对手低50%。
复购率是重复购买频率,用于反映用户的付费频率。例如你在淘宝上买了一次商品,下次又买了一次,这就是复购。复购率低说明用户在这个平台上买过一种产品后,不愿意再买另一种产品了。
为什么用户的复购率低呢?可以使用假设检验分析方法来查找原因。我们先来梳理下产品的业务流程,方便从业务流程提出假设(图2-75):
第1步,用户查看课程详细介绍,选择喜欢的课程;
第2步,用户上课学习;
第3步,助教对用户学习中遇到的问题进行答疑。
图2-75 从业务流程提出假设
对于第1步,可以提出假设:老师不够好,用户在第1步就放弃购买课程了;
对于第2步,可以提出假设:用户的学习效果不好;
对于第3步,可以提出假设:助教的答疑效果不好,没有解决用户的问题。
整个案例的分析过程如图2-76所示。
图2-76 分析过程
我们先来看假设1:老师不够好。
通过对比发现,产品A和竞争对手聘请的都是头部老师。但是,进一步对比两个产品的课程介绍页面,发现产品A给用户提供的老师介绍很简单,几句话就介绍完了;而竞争对手会详细介绍老师的信息,包括个人经历、教学特点、性格等。这能帮助用户更好地了解老师,建立对课程的信任(图2-77)。
图2-77 老师对比
所以得出结论是假设1不成立,不是老师不够好。真正的原因是对课程老师介绍得不够详细(图2-78)。
图2-78 假设1不成立
我们再来看第2个假设:用户上课的学习效果不好。
通过调研发现,产品A上课的模式是预约,例如预约10天后,报名的人一起上课。而竞争对手的上课模式是闯关游戏,报名了课程以后,随时可以开始上课,免去了等待时间。相比而言,用户更喜欢竞争对手的上课模式,因为它更加灵活,不会限制时间,什么时候方便什么时候学习。而产品A必须要等到某个固定时间才能开课(图2-79)。
图2-79 对比课程
所以,假设2是成立的,产品A没有竞争对手的上课模式灵活,导致了复购率低(图2-80)。
图2-80 假设2成立
我们再来看第3个假设:答疑效果不够好。
产品A把助教当成了一个单纯的销售人员,在社群里每天推送的是广告,而对学员学习课程中遇到的问题,并没有实时回答。竞争对手则把助教当作了一个全流程跟踪服务管理人员,他会贯穿整个学习过程,不仅1对1地点评学员作业,对提出的问题也会实时回答(图2-81)。
图2-81 对比答疑
所以,假设3也是成立的(图2-82)。
图2-82 假设3成立
我们总结下,产品A复购率比竞争对手低50%,是因为下列原因:
(1)在课程介绍页面,老师介绍得不够详细;
(2)课程采用了某个时间定时开课的模式,导致用户上课不够灵活,不能够随时加入学习,这对平日还有其他事情的用户来说,不够方便;
(3)助教答疑效果不好,把助教当成了一个单纯的销售人员,而不是全流程地跟踪用户,为用户服务。
2.6.5 总结
可以用图2-83记住假设检验分析方法。
图2-83 假设检验分析方法
第1个问题:是什么?
假设检验分析方法就是逻辑推理,是一种使用数据来做决策的过程。它分为3步:提出假设,收集证据,得出结论。
第2个问题:有什么用?
假设检验分析方法背后的原理就是逻辑推理,所以学会这个方法以后,可以显著提高我们的逻辑思维能力。
假设检验分析方法的另一个作用是可以分析问题发生的原因,也叫作归因分析。以后分析问题发生的原因,就可以使用假设检验分析方法。
第3个问题:如何用?
可以使用3个方法来客观地提出假设,同时防止遗漏假设:
(1)从用户、产品、竞品这3个维度提出假设;
(2)从4P营销理论提出假设;
(3)从业务流程提出假设。
第4个问题:注意事项。
需要注意4个地方:
(1)第3步得出的结论不是主观猜想出来的,不能是“我猜、我觉得、我认为、我感觉”,而是要依靠找到的证据去证明结论;
(2)假设检验这3步是一个需要不断重复的过程。在得出结论以后,分析还没有停止,要多问几个为什么、可能的原因是什么,然后用数据去验证可能的原因。不断重复假设分析的这个过程,直到找到问题的根源;
(3)在使用假设检验分析方法的过程中,还要用到其他分析方法,例如前面的案例里在第1步提出假设的过程中,使用了多维度拆解分析方法;在第2步收集证据的过程中,使用了对比分析方法;
(4)在开始分析之前,为了理清楚思路,可以做一个图,将问题、假设、数据从上至下连起来。
以后在使用假设检验分析方法时,只需要记住以下两张图就可以。图2-84是假设检验分析方法的步骤。图2-85是分析思路图,可以帮助你快速地将问题、假设、数据从上至下连起来。
图2-84 假设检验分析方法的步骤
图2-85 分析思路图