前言
随着物联网、互联网、云计算等技术的飞速发展,在各个领域出现了大规模的数据增长,信息社会已经进入了大数据时代。大数据主要有数据流和静态数据两种形式,智慧农业中各种传感器产生的数据流是农业大数据的主要来源。农业领域中的数据流来源众多,形式多样,处理复杂,很难有一种计算模式能涵盖不同的计算需求,因此,如何根据数据流的不同数据特征和计算特征,从多样性的计算问题和实际需求中提炼并建立高层抽象模型,是目前数据流研究亟待解决的问题。
本书围绕物联网追溯系统的研发及数据流处理过程中的聚类、追溯、预测与建模关键技术进行了研究,取得了一些成果,主要内容如下。
第 1 章,主要介绍了物联网的概念,以及中国农业物联网产业化发展现状,并阐述了国内外大数据的研究现状和热点。
第2章,主要介绍了基于高斯混合模型的数据流聚类算法Cumicro。使用高斯混合模型作为数据流中不确定数据的基本表示形式,更好地利用存储空间,完成对真实情况的逼近。该算法将时间直接作为数据属性,可直接查询某个时间维度的聚簇。实验证明,该算法在原始数据较密集时,与原有基于离散模型的聚类相比,该算法具有准确度上的优势。
第 3 章,主要介绍了基于不确定数据的数据流追溯方法,将不确定数据引入追溯系统中,搭建追溯模型,解决了数据流背景下无法对可追溯单元一一标识的混合过程进行表示的问题。利用不确定数据的基本表示和查询方法,解决了多源追溯问题,完成了数据流追溯模型中的一般查询、节点评价和单节点异常推断功能,并给出了多节点异常的求解方法。
第 4 章,主要介绍了基于时间粒度的自适应调整灰色二阶模型的数据流预测方法,通过实验得出以下结论:随着滑动窗口更新周期的增大,预测的成功率反而下降;随着采样频率的变大,预测成功率降低;随着未来数据窗口宽度的增加,预测的平均相对误差增大。但该方法对近期的数据预测比较准确,满足了系统的需求。
第 5 章,主要介绍了一个面向养殖环境的猪舍数据流采集与预测为一体的自动化控制系统,提出了在数据流背景下切换到数据视角,以数据为中心来开展业务研究,将时间和空间的事件信息以数据驱动为中心,明确地抽象到编程模型中,进行形式化的描述及一体化建模,打破了传统的建模方法仅局限于时间域内分析的局限性,考虑了计算过程和物理过程通过网络实时交互对系统行为所带来的影响。
第6章,主要介绍了物联网追溯系统的研发和软硬件配置环境,对本书的主要内容进行梳理和总结。
在本书撰写的过程中,中国农业大学孙瑞志教授给予了指导性意见,尹宝全博士、李勐博士、聂娟博士、邓雪峰博士、王雷雨硕士都给予了大量的支持和帮助,提出了很多宝贵意见,在此表示感谢。
由于作者水平有限,不当之处在所难免,恳请广大读者批评指正。
作者
2018年10月