2.2 利用模糊神经网络方法估算ET0
2.2.1 模糊神经网络方法
自适应模糊神经推理系统(adaptive neuro-fuzzy inference system,ANFIS),是模糊逻辑和神经网络的结合物,既有模糊逻辑适于表示人的定性或模糊的经验和知识的特点,又有神经网络自适应、自学习机制(J.Wesley Hines,1997;Jyh-Shing Roger Jang,1992)。根据Roger Jang(1992)提出的一阶Sugeno型模糊推理系统,可以用MATLAB软件的工具箱函数anfis构建一个模糊推理系统FIS。ANFIS的实质是使用神经网络中比较成熟的参数学习算法——反向传播算法或者是混合最小二乘估计的反向传播算法,对给定的一组输入/输出数据集进行学习来调整FIS中变量的隶属度函数的形状参数(闻新等,2002;吴晓莉等,2002)。
自适应模糊神经推理系统,为模糊建模的过程提供了一种从数据集中提取相应信息(模糊规则)的学习方法,所以ANFIS是一种基于已有数据的建模方法。而建立的模糊系统模型能否很好地模拟这些数据并能用于预报,就是检验算法和模型的标准。ANFIS建模的优点是能够用较少的初始条件,取得本来需要较多因素才能精确确定的结果。如用Penman-Monteith方法计算参照腾发量,就需要最高气温、最低气温、日照、风速、相对湿度以及当地地理位置参数等数据。图2.5是典型的一阶两输入/一输出ANFIS结构。
图2.5 一阶两输入/一输出ANFIS结构
根据大兴1995—2003年逐日各气象因子,与经Penman-Monteith方法计算的ET0的相关分析,发现日最高气温项(r=0.8166)与太阳辐射项(日照时数,r=0.6903)与其线相关度较高。同时,根据ANFIS的特点,随着输入项个数的增加,模糊规则将呈爆炸式增加,势必使系统训练和推理时间大幅度延长,不利于实际应用。而日常天气预报中的天气情况信息往往是由太阳辐射所决定,因此天气情况信息将按照太阳辐射进行解析。
因此,所构建的自适应模糊推理系统输入项就选取日常天气预报信息中的最高气温Tmax和天气情况(Weather)项,输出项是单输出的参照腾发量值。
2.2.2 输入输出项系统构建
为了将一般语言与模糊推理能够结合起来,分别将这5种情况(模糊程度)对应于阿拉伯数字1~5,以便在推理系统中进行模糊推理。表2.3是参照腾发量推理系统输入项两变量的模糊设置,其中最高气温项Tmax是大兴1995—2003年逐日数据进行分析和整理,得到基本特征和模糊设置。
表2.3 参照腾发量推理系统输入项模糊设置
输入项隶属度函数采用高斯(正态)分布函数。高斯分布是概率统计中最为常用的函数,它在模糊逻辑中也具有非常重要的地位。高斯型函数的形状由两个参数决定:方差σ和均值c,其中c决定了函数的中心点(峰值点)的位置,σ决定了函数曲线的舒展程度。高斯(正态)分布函数的数学表达式为
经过数据训练后模型定义的输入项最高气温和天气情况的隶属度函数见图2.6。
图2.6 训练后的推理系统输入变量的隶属度函数
本自适应模糊推理系统的输出项是ET0值。由1995—2003年间逐日气象数据,根据Penman-Monteith方法计算其参照腾发量ET0值作为模型训练输出值。由统计结果知,输出项的最大值为8.43mm/d,最小值为0.22mm/d。系统训练输出项采用线性输出。
图2.7 自适应模糊推理预测ET0系统
2.2.3 ANFIS模型结果分析
根据上述输入输出项的结构分析和相应专家知识,推理系统共产生5×5=25个模糊规则。图2.7是本模糊推理系统的结构和模糊规则曲面[图2.7(b)中天气情况的量值与表2.3中程度值相对应]。在模型训练时,对隶属度函数的类型进行了不同的尝试。选择Fuzzy Logic工具箱提供的三角函数trimf、钟形函数gbellmf、高斯函数gaussmf、高斯2型函数gauss2mf、s型函数smf等对已经构建好的模型进行训练。通过对训练过程和训练系统误差结果的观察对比,发现高斯函数作为隶属度函数最适合——训练速度快,约400个周期时误差达到最小并趋于稳定。
图2.8和图2.9分别是训练数据结果(Train-ET0)和检验数据结果(Test-ET0)与用Penman-Monteith公式计算结果(PM-ET0)的比较,其中(a)是平均值年内变化曲线,(b)是两者线性相关分析图。从模型训练结果的年内变化来看,从3—6月和9—11月,ANFIS-ET0与PM-ET0差异稍大(绝对误差AAE分别为0.6480和0.6353,相对误差ARE分别为16.67%和34.18%),12月至次年2月和7—8月的结果两者比较接近(AAE分别为0.1550和0.2863,ARE分别为16.03%和7.29%)。检验数据也有相似的年内变化趋势。出现这种系统偏差的原因,可能是在北京地区参照腾发量年内气象因素阶段影响差异。本预测系统选择的输入项是辐射和最高气温,两者在基础地温不同时对确定参照腾发量数值大小的影响是不同的;而系统推理的模糊规则以年为周期进行设计,是认为年内无差异的。因此造成这种2—5月总体偏小、8—11月总体偏大的预测结果。如果针对地区差异,年内分阶段进行系统设计,将可以减小这方面的误差。
图2.8 自适应模糊推理预测ET0系统模型训练结果
总体来说,相关分析结果显示,训练数据线性相关系数为0.904,检验结果为0.84(表2.4)。同时,从数据统计分析的t检验结果可见,训练数据和检验数据的t检验值分别达到119.4038和87.5347,远远大于t分布临界值2.576(α=0.01),表明两者相关性显著,可以认为是来自一个近似的总体样本。
图2.9 自适应模糊推理预测ET0系统模型检验结果
表2.4 模型训练与检验结果统计检验