Excel+Python轻松掌握数据分析
上QQ阅读APP看书,第一时间看更新

1.3 认识数据

如果有一个数字1,它会表示什么含义呢?如果数字没有出处,没有故事,那么它本身没有什么实际意义。本节会帮助你进一步认识数值数据,了解定量数据和定性数据,以及绝对量和相对量的概念。

1.3.1 定量数据和定性数据

当数字表示事物的数量时,它就是定量数据,如库存的服装有1035件,这里的1035就是定量数据。当数字只作为标识,而不是计数时,如1表示红色,2表示绿色,3表示蓝色,这里的1、2、3就是定性数据。

一一问答

一一问:是不是定量数据都有单位,而定性数据没有?

答:如果这样想能帮助记忆,也可以这么理解。

1.3.2 绝对量与相对量

当数据直接表示事物的数量时,它就是绝对量;当数据表示两个数据之间的关系时,它就是相对量。

比如,一一家的网店在某一时间段共有1000名访问的客户,其中150名客户购买了商品,这里的1000和150是两个绝对量,那么这两个数据之间有什么关系呢?通过这两个数据我们可以计算从访问网店到实际购买的转化率,计算方法是购买量除以访问量再乘以100%,即150÷1000×100%=15%,这里,转化率15%就是一个相对量。

一一问答

一一问:除了百分数以外,相对量还有其他形式吗?

答:因为百分数可以转换为小数和分数,所以,在明确数据应用场景时,相对量也可以是分数或小数。比如,6月的服装销量是600件,7月的服装销量是400件,那么可以说7月的销量只有6月的三分之二(2/3),也可以说6月的销量是7月的1.5倍。

另一种表达相对量的方法是比值,比值可以是两个数据的比值,也可以是多个数据的比值,比如,线下、网店和直播销量分别是200件、500件和300件,则3个渠道的销量比就是2:5:3。

一一问:15%的转化率似乎不太高?

答:单独来看 15%并不高,但在观察相对量时要非常小心,因为相对量表示的是两个数据的关系,解读数据时需要注意相关的绝对量,如网店有 1000 万次访问,其中有150 万名顾客购买了商品,转化率依然是 15%,但实际交易量已经是 150 万笔,而不是 150笔。

一一问:如何提高转化率呢?

答:这似乎是个经营类的问题。实际上,如果网店有2000万次访问,其中有200万笔交易,虽然转化率只有10%,但销量依然很高,所以说提高转化率并不是唯一目的,实际交易量才是最真实的销售成绩。不过,提高访问量和转化率也是提高销量的有效方法,所以在提高产品竞争力的基础上,高质量的推广工作依然很重要。

一一问:在朋友圈做广告怎么样?

答:在朋友圈做广告的确是一个快速传播信息的有效方式,也是最简单的推广方式之一,但在朋友圈做广告需要慎重,不要让朋友们觉得你是为了推销商品而交朋友。

一一问:我的朋友圈大概有200人,广告能被转发多少次呢?

答:并不是朋友圈的所有人都认可广告,保守一点估算,假设200人中有10人转发,每个人的朋友圈又有10人转发,那么广告的投放量就是:

10n+10n-1+10n-2+…+102+10

其中,n表示有多少级转发。如果n等于5,则广告投放量将达到111 110次。

一一问:数字怎么增长这么快?

答:因为使用了乘方运算,所以数据增长特别快。这种增长方式称为“指数级增长”,它还有一个吓人的名字——“病毒式传播”。

你也许听说过关于在国际象棋棋盘上放麦粒的故事,第一个格子放1粒,第二个格子放2粒,第三个格子放4粒,依此类推,64个格子能放多少粒呢?算式如下:

20+21+22+…+261+262+263

结果为18 446 744 073 709 551 615。

一一问:这么大的数据是怎么计算出来的?

答:Excel在进行这么大的数据计算时就有些力不从心了,但是用编程方式解决就很简单。在Python中显示计算结果只需要一行代码,如下所示。

print(sum([2**x for x in range(64)]))

一一问:编程似乎有点意思。我们什么时候开始学习?

答:编程的确很厉害。在了解基本的数据计算和分析方法后我们就会开始学习Python编程,到时会看到更多、更灵活的数据处理功能。

在实际工作中,数据分析并不能依靠假设的数据来完成,当我们需要分析某个领域的数据时,一方面,要获取真实或者尽可能接近真实的数据;另一方面,针对每个领域的数据需要不同的分析方法。所以,面对数据时要具体问题具体对待,处理和分析数据就是发现问题、总结规律、制定目标,不断修正结论和预期的过程。