1.4 数据分析师的日常工作
如果希望从事数据分析工作,则需要了解数据分析师的日常工作内容,以便了解这些工作内容所需要的技能。那么,数据分析师的日常工作包括哪些呢?
我们来看一下各企业招聘数据分析师的要求(见图1-12~图1-14)。
图1-12
图1-13
图1-14
我们将以上内容总结后,得到的工作内容和技能如图1-15所示。
工作内容主要有数据体系的搭建、策略模型的搭建和专题分析评估。
1.数据体系的搭建
每一个产品的功能都需要通过数据来监控使用情况,包括用户量的变化情况、使用的体验情况、业务的健康情况、业务的机会点等。所以,在公司或者企业内部都会建立起一套相应的数据体系来帮助监控产品各个功能模块的情况。
什么是数据体系?下面先从指标的定义说起。
指标:指标是通过数据计算得出,用于衡量业务情况的,常见的指标有新增用户数、日活跃用户数、周活跃用户数、活跃时长、付费人数。
数据体系:把指标通过一定的方法论体系组织起来,比如,拼多多的数据体系就包括拼多多新增相关指标、活跃相关指标、留存相关指标、付费相关指标等。
图1-15
数据体系的搭建就是帮助某种业务建立一套完整的指标体系,帮助业务人员监控业务的走势,及时发现问题。
数据体系的搭建过程如图1-16所示。
图1-16
(1)数据上报。一般通过埋点的方式上报需要的数据。数据上报的方式一般有客户端上报和后台上报。有些数据只能从客户端获取,所以只能通过客户端来上报,比如,前端的某个按钮的曝光情况。
(2)数据指标。根据上报的数据、业务的计算口径及需求,我们按照一定的方法计算对应的数据指标,比如,某个按钮的曝光点击比就是按钮点击的次数/按钮曝光的次数。
(3)数据报表。这些数据指标通过一定的展示和组织形成报表,常规的数据指标的展示方式有表格、折线图、饼图等。
(4)数据体系。数据报表按照一定的逻辑进行组织就形成了数据体系,比如,按照新增、活跃、留存、付费、转发的AARRR模型进行组织。
2.策略模型的搭建
针对业务的需求,帮助业务方解决业务问题,我们需要搭建相对应的策略模型。
针对付费的业务,需要搭建付费预测模型,预测未来哪一批用户会付费,哪一些用户会流失。这样就可以针对即将要流失的用户提前做挽留,对已经流失的用户利用礼包等策略进行召回。搭建付费预测模型主要采用机器学习中的分类模型方法,常见的有决策树、逻辑回归模型等。可以将用户付费相关的行为作为特征,比如,用户的活跃行为、活跃时长、年龄、性别、过去付费的行为。
针对用户增长的业务,需要搭建用户流失预警模型,预测未来哪些用户会流失,这样业务方可以对即将要流失的用户利用运营的手段进行挽留。
用户流失预警模型的搭建和付费预测模型的搭建过程类似,都需要采用机器学习中的分类模型方法来解决。但是,对于一些用户分层的问题,分类模型解决不了,就需要用聚类模型,常用的聚类模型有k-means、DBSCAN等。
针对指标预测的问题,常用的方法有时间序列预测法。
3.专题分析评估
专题分析评估主要是针对业务中的一些问题开展的专题分析,常见的专题分析评估如下。
(1)波动归因:针对指标的波动,开展专题分析,挖掘波动的原因,并给出建议。
(2)专题评估:针对产品功能上线,评估迭代效果、活动上线效果,以及策略上线效果。
(3)专题探索:例如,用户留存专题探索,包括什么因素是用户留存的关键抓手、用户增长探索,以及挖掘增长的一些关键行为抓手。