2.3 移动大数据的挖掘与管理
前面已经对移动大数据的数据挖掘的一些基本概念做过简单的介绍,在这里主要针对怎样去挖掘与管理大数据做一番了解。
2.3.1 移动大数据的挖掘过程和方法
移动大数据环境下,数据挖掘是发现和萃取数据库知识的一个重要步骤,也是一类深层次的数据分析方法。具体来说,是指从海量数据中通过算法提取隐藏其中的信息和知识的过程。从这一说法中可以看出,其实现包含两个重要的元素:一是算法;二是过程。
从数据挖掘的算法来说,有多种算法,如C4.5算法、K-Means算法、支持向量机算法、Apriori算法、PageRank算法、最大期望算法等。
数据挖掘是围绕数据源而展开的数据信息探索过程,其具体算法模型如图2-22所示。
图2-22 数据挖掘算法模型
从数据挖掘的过程层面来说,包括三个阶段,即数据准备、数据挖掘、结果表示,如图2-23所示。
图2-23 移动大数据挖掘的一般过程
在移动大数据的挖掘过程中,总会涉及一些方法的应用,这些方法是多样化的,常用的有六种,分别为分类模式挖掘、关联确定挖掘、聚类分析挖掘、回归分析挖掘、特征分析挖掘和Web挖掘等。
(1)分类模式挖掘。分类模式挖掘是最常用的移动大数据挖掘方法,具体如图2-24所示。
图2-24 移动大数据的分类模式挖掘
(2)关联确定挖掘。关联确定挖掘是指找出隐藏的数据项之间的关系规则的挖掘方法,主要应用于客户关系管理中,其过程如图2-25所示。
图2-25 数据关联确定挖掘的客户关系管理应用过程
(3)聚类分析挖掘。聚类分析挖掘是一种极具探索性的数据挖掘方法,具体内容如图2-26所示。
图2-26 移动大数据的聚类分析挖掘
(4)回归分析挖掘。回归分析挖掘是一种确定多种变量间的定量关系的移动大数据挖掘方法,具体内容如图2-27所示。
图2-27 移动大数据的回归分析挖掘
另外,特征分析挖掘是通过数据个体来分析总体数据的特征的数据挖掘方法;而Web挖掘是对移动Web上的海量数据的数据挖掘方法,其也是应用于识别、分析、评价和管理危机的挖掘方法。
2.3.2 移动大数据的管理
移动大数据环境下,随着移动互联网应用的飞速发展,随之而来的是数据量的剧增,在这种发展情形下,对数据量进行有效管理已经迫在眉睫。关于数据管理,具体内容如图2-28所示。
图2-28 数据管理的具体内容
2.3.3 移动大数据的挖掘与管理案例
在现实生活中,大数据中数据信息的应用已经开始逐渐普及,移动大数据也是如此。有许多通过移动大数据的挖掘与管理来进行现实情况处理的案例出现,在这里通过它们来体验一下移动大数据的具体应用吧。
1.【案例】可口可乐:“昵称瓶”的数据捕捉
2013年夏天,宅男、天然呆、吃货、喵星人、爱走族、大咖、纯爷们、文艺青年、技术男、小萝莉、积极分子等22种流行语出现在了可口可乐的包装上,瞬间吸引了大家的关注,如图2-29所示。
图2-29 可口可乐“昵称瓶”
人们不禁要问:这些流行语是怎样选择和定位的呢?其实这还应归功于移动大数据的挖掘与管理,如图2-30所示。
图2-30 可口可乐“昵称瓶”流行语筛选
2.【案例】58同城:租房信息的数据推送
58同城是一个定位于本地社区的免费分类信息服务的网站,其着眼于帮助人们解决生活和工作中遇到的问题,如招聘、租房、二手物品交易等信息的发布都可以通过其旗下的APP来查看。
以租房为例,移动终端用户可以查看上面发布的出租房信息,而58同城能根据用户的搜索和浏览痕迹等数据信息进行数据挖掘与管理,适时地向用户推送合适的信息与服务。关于租房,其具体步骤如下。
步骤 01 进入58同城主界面,可以看到“房产”选项,点击进入“房产”界面,会显示各种房产信息,如图2-31所示。
图2-31 58同城“房产”选项界面
步骤 02 选择进入所要查看的房屋类别,点击“租房”选项,进入“租房”界面,如图2-32所示。
图2-32 “租房”界面
步骤 03 移动终端用户可以在“租房”界面上挑选合适的信息进行查看,还可以根据附加条件进行选择,如房子结构情况等,如图2-33所示。
图2-33 设置附加条件的“租房”界面
步骤 04 假如用户认为房源合适,可以点击进入查看房源详情,还可以通过屏幕下方的电话进行联系,如图2-34所示。
图2-34 房源信息详情
在移动大数据时代,58同城通过上述类似信息发布和用户登录,聚集了大量商品、服务和用户数据,通过对它们的挖掘与管理,掌握用户喜好和需求,从而为用户提供优质的服务体验,同时也为本地商家提供数据信息参考,如图2-35所示。
图2-35 58同城的移动大数据的挖掘与管理应用
以上两例都是基于移动大数据的挖掘与管理的数据信息应用。从中可以发现,移动大数据的挖掘与管理所产生的巨大作用,甚至能给一些行业带来深刻变革。