1.6 大数据思维和寻宝游戏
大数据,开启了一场轰轰烈烈的寻宝游戏。小数据时代无法获得的数据,现在可以获得;小数据时代无法实现的计算(如数据的实时分析),现在可以实现。
举个例子,手机定位,以前做不到,但是现在可以。这些位置数据有什么用呢?从每天准时往返两个地点,可以看出你是上班族,起点是家庭住址,另一处是单位地址;从时间和路线上,可以看出你有无开车,有车可以向你推销车险,没车就向你推销新车,这还只是简单的人工分析。再进一步,有人研发出防走失的儿童手表,有人发明了记录运动的健康手环,都获得了丰厚回报。
因此,我们对数据持有的看法,直接影响获得的价值,而这是大数据时代“寻宝”的关键。在小数据时代,我们一直认为“正确”的或“最佳”的理念、理论、方法、技术和工具越来越凸现出其“局限性”;在大数据时代,我们需要改变思维方式,具备大数据思维。
1.全量思维
全量思维,分析所有的数据样本,而不依靠抽样分析。看问题的角度从局部扩展到整体,数据越大,真实性也就越高。
正如统计学所言,只有拥有全部样本,才能找出规律。抽样分析是以点带面、以偏概全的思维,而全量分析能反映出全部数据的客观事实。大数据能让我们清楚地看到抽样样本无法揭示的细节。
2.模糊思维
模糊思维,接受数据本身的纷繁复杂,不再追求准确性。现实中的数据本身存在异常、纰漏、疏忽,甚至是错误的。我们用全量数据进行分析,虽然在不精准的实际数据上得出的结论不会非常精准,但最接近客观事实。
大数据纷繁多样,优劣掺杂,增长迅速,实时变化,分布在全球很多服务器上。在如此海量实时的数据面前,追求绝对精准是没有必要的。大数据让我们适当忽略在微观层面对精确度的追求,更多关注宏观层面,以拥有更好的洞察力。
比如,买一条鲤鱼,会精确称量到“两”的单位,但如果买的是一条鲸鱼,就不会再精确到“两”了。
3.相关思维
相关思维,不再探求因果关系,转而关注事物的相关性。通过数据挖掘,我们能够看到数据的关联现象和事物的相关性,但不一定知道其因果关系。
大数据告诉我们“是什么”而不是“为什么”。基于海量数据的分析得到的结果,有时很难理清其中的逻辑,有些内在关系的基础我们至今仍未掌握,但是大数据让我们看到了很多以前不曾注意到的联系,掌握了以前无法理解的社会动态。
比如,燕子低飞要下雨,是古人通过长期观察得出的结论。古人肯定知道,不是因为燕子低飞才下雨,虽然不明其理,但是不妨碍未雨绸缪。
总之,我们要掌握大数据思维,并不是抛弃抽样思维、精准思维和相关思维,而是要突破思维局限,认真审视大数据时代的一切事物,从中发现宝藏。