1.5 组织结构
本书共六章,各章之间的组织结构如图1-2所示。
第 1 章为绪论。该章首先介绍了研究背景和意义,分析了大数据研究面临的挑战,在对本领域国内外研究现状综述和分析的基础上,介绍了主要研究内容及本书的组织结构。
图1-2 组织结构
第 2 章,基于高斯混合模型的数据流聚类方法。现有数据流聚类模型大多是基于离散型随机变量模型开展的,针对连续型随机变量模型的研究相对较少。已有针对连续型随机变量的聚类方法很难发现时间属性上的聚簇问题。本章研究基于高斯混合模型构建方法,设计一种占用存储空间较小,可以方便地表示数据的不确定性,将时间直接作为数据属性,直接查询某个时间维度的聚簇的通用数据流聚类算法(Cumicro),并通过实例验证了算法的有效性。
第 3 章,基于不确定数据的数据流追溯方法。先阐述了现有数据流追溯中面临的挑战,在此基础上提出了如何以较高效率去追踪不同数据源间和同一数据源内部数据的不确定性的来源和演化过程,这是当下要解决的首要问题,设计了基于不确定数据的数据流追溯模型架构,给出了单节点出错进行追溯的方法,以及多节点出错如何进行追溯的思路。
第 4 章,基于灰色二阶模型的数据流预测方法。首先介绍了目前对数据流预测的研究现状及存在的问题,并通过表格对已有的一些预测方法给出了比较。接着,引入了时间粒度概念,介绍了灰色预测模型,在此基础上,提出了数据流上的预测查询处理模型,并给出了数据流预测处理算法,最终实现了数据流的在线实时预测。
第 5 章,数据流采集系统的设计。在前面研究的基础上,设计了一个面向生猪养殖的集数据流采集与预测为一体的自动化控制系统。首先介绍了猪舍环境监测与控制系统的建立背景,接着介绍了现有监控系统及数据流模型研究现状,之后,针对传统的模型建模方法大多局限于时间域内的分析,没有考虑计算过程和物理过程通过网络实时交互对系统行为所带来的影响,扩展现有信息物理融合系统模型,给出了面向生猪养殖的集数据流采集与预测为一体的自动化控制系统建模的形式化描述,并将前面章节的研究应用于系统中,实现了对猪舍环境的监测。
第 6 章介绍物联网追溯系统研发相关内容,例如,养殖场信息管理系统、屠宰信息管理系统、追溯查询信息系统,并对本书的主要内容进行了梳理和总结。