地球科学中的大数据分析与挖掘算法手册
上QQ阅读APP看书,第一时间看更新

1.1.7 地球科学应用案例

以一个简单的林火风险预测为例,从一幅遥感影像中可以提取到植被的覆盖度类型,从空间数据库中查取过去一年中该地区的降水量,由数字高程模型(Digital Elevation Model,DEM)提取该地区的坡度图,应用关联规则算法得出发生山火的概率[10]

首先,对已经得到的属性数据进行离散化处理,各属性的取值范围为植被覆盖度V[0,100]、坡度S[0,90]、降水量R[0,100]、山火发生概率F[1,10]。四维属性值的分割见表1-3~表1-6。

表1-3 植被覆盖度属性分割

表1-4 坡度属性分割

表1-5 降水量属性分割

表1-6 山火发生概率属性分割

为了将关联规则用于遥感图像数据这类量化数据,首先应该将量化数据离散化,即需将图像数据转化为事务数据库的形式,事务数据库一般由事务的标识符和事务项集组成,在遥感图像中,每一个像素都代表一个事务,表1-7为图像数据转化为事务数据库形式的示例。

表1-7 事务数据库形式

47855-00-041-1.jpg

假设最小支持度为50%,最小置信度为60%。经过属性分割的所有块将成为候选项集,分别计算它们在60 000次交易中出现的次数。表1-8为计算后的四维关联规则。

表1-8 四维关联规则

47855-00-042-1.jpg

从上述的例子来看,坡度高、降水量多容易发生山火;坡度低、降雨量低、植被覆盖率低的地区,发生山火的概率不是很大;对于植被覆盖率比较大、坡度大于35°、上一年平均降水量小于64 cm的地区,在空气干燥季节尤其要引起注意。