上QQ阅读APP看书,第一时间看更新
1.1 如何理解数据?
拿到数据以后,可以按照图1-1的步骤来理解数据。
图1-1 理解数据
第1步,弄清楚数据里每一列的含义。例如拿到一份Excel数据,要理解清楚每一列表示什么意思。不懂的地方,要和数据提供方沟通清楚。
第2步,对数据进行分类,有助于后期的分析。通常将数据分为3类:用户数据(我是谁)、行为数据(我做了什么)、产品数据(卖什么)。
1)用户数据:我是谁
用户数据是指用户的基本情况,包括姓名、性别、邮箱、年龄、家庭住址、教育水平、职业等。
2)行为数据:我做了什么
行为数据是记录用户做过什么的数据。例如淘宝上,用户行为可以是用户在某个产品页面的停留时间、浏览过哪些产品、购买了哪些产品等。行为数据主要包括用户做了哪些行为、发生行为的时间等。
3)产品数据:卖什么
一个平台里的东西都可以看作产品,例如淘宝里的商品、优酷上的视频、公众号里的文章都可以看作产品。产品数据包括产品名称、产品类别、产品评论、库存等。
举个例子,图1-2里的3个Excel文件是从我的公众号(猴子数据分析)里导出的数据。
图1-2 数据分类
第1个文件“用户分析”里记录了关注公众号的用户信息。第2个文件“图文分析”里记录了公众号发过的文章信息。第3个文件“菜单分析”里记录了用户点击公众号菜单栏的信息。
现在对这3个文件的数据进行分类。“用户数据”包括的列名有性别、年龄、用户所在地区。“行为数据”包括点击某个菜单的次数、文章的分享量和收藏量。把公众号发过的文章看作产品,这样“产品数据”就包括文章的标题、发布文章的日期、文章阅读量。
有些数据从不同角度来看,可以属于不同的分类。例如,对于文章的收藏量而言,收藏是一个行为,那么收藏量可以看作是行为数据;另外,收藏是产品被收藏,那收藏量也可以看作是产品数据。对于数据的分类不是绝对的,要根据具体业务去灵活定义。