3.3 水质恢复价值CVM评估中的有效性与可靠性
3.3.1 国外研究
美国国会1972年通过了《清洁水法案》,该法案是美国保护水质的框架性法律,为管理水污染物排放确立了基本的架构。其两个目标是“到1985年消除污染物对国家水体的排放”以及“到1983年7月1日时达到‘可渔猎’‘可游泳’的水质标准”。由于这两个目标当时并未达到,因此引起了批评者对环境治理投入所带来的收益能否弥补其成本的怀疑。在这一背景下,促进了CVM在水质改善所带来的社会价值、生态价值评估中的运用。欧盟2000年通过了《欧盟水框架指令》,其基本目标是到2015年各成员国水质至少达到“良好的生态状态”(Good Ecological Status)。为了全方位评估水污染治理的成本和收益,近10年来CVM在欧洲许多国家的应用蔚然成风。表3-2列举了国外涉及水污染(含河流、江、湖、近海)的研究案例。由于国外的CVM研究文献具有很强的政策导向性质,服务于环境治理项目的决策,因此,从研究重点来看,国外绝大多数文献并不局限于实施调查,报告结果,而是将注意力更多地集中在对结果的可靠性和有效性检验上。这与当前国内的研究形成了鲜明的对比。
表3-2 国外主要相关研究文献
注:PC表示支付卡,OE表示开放式,IB表示投标竞价,SB表示封闭式单边界,CR表示条件排序。
3.3.2 国内研究
现有文献在水质改善或流域生态补偿方面开展了大量富有成效的研究(见表3-3和表3-4)。但也存在一些不足之处,具体如下。
表3-3 国内主要相关研究文献(Ⅰ)
说明:(1)+*、-*分别表示影响程度在统计上显著,符号方向为正、负;√^*表示同时引入了平方项且统计显著;(2)DB表示封闭式双边界,SB表示封闭式单边界。
表3-4 国内主要相关研究文献(Ⅱ)
注:同表3-3
第一,福利计算与询价方法。
在福利计算上,国内研究主要采用WTP指标进行分析,少数有关生态补偿的研究也运用了WTA进行分析,并发现二者间存在较大差异(如徐大伟等,2012)。在测度指标上,现有文献绝大多数报告的是平均WTP。只有总体服从正态分布时,平均WTP才具有最小方差。但是,正态分布是允许出现负值的,而环境服务的WTP通常不会出现负值,尤其是采用开放式或支付卡式问卷时。此外,平均值受异常值的影响很大。
例如,少量愿意支付很高费用的受访者就可以把平均WTP提高若干个数量级。因此,平均值并非稳健的度量指标,更好的替代选择是中位数指标(蔡志坚等,2011;杜丽永等,2013)。
在询价方法上,开放式和支付卡式询价面临的共同问题是存在数据“扎堆”现象,即绝大多数受访者会集中选择少数几个投标点,如10元、20元、50元等,从而造成舍入误差(Rounding Errors)。从询价方法来看,国内文献主要集中采用的是支付卡式问卷,只有5篇文献采用了封闭式双边界询价方法(见表33和表34),这一点和国际研究趋势还有很大差距。大量使用支付卡式问卷的第一个原因是,支付卡式询价在计算上较为简单,只需简单的算术平均就可得到WTP,而封闭式询价尤其是双边界询价方法对统计分析的要求较高。进行简单平均计算所隐含的一个前提是,受访者所圈选的投标点是其真实WTP。理论上,投标点足够多的话,完全可以得到受访者的WTP分布函数。但是,支付卡所列出的投标点毕竟是有限的。Cameron和Huppert(1989)则提出了更为一般化的解释,他们认为,受访者所圈选的数值只是其WTP的下限,上限是在投标卡上紧邻着的较大数值。张志强等(2002)也指出,对支付卡进行简单的算术平均得到的估计结果可能是有偏的,更好的选择是运用参数模型进行估计。除了张志强等(2002)外,只有徐大伟等(2012)在运用支付卡式询价方法时同时报告了两种方法的估计结果。
大量采用支付卡式问卷的第二个原因是这类问卷较为直观,实施成本较低,而封闭式问卷对样本量的要求较高,调查成本也更高。
第二,抽样样本大小。
理论上,CVM调查的样本越大,其代表性越强,越能够降低一些非随机误差,研究结果也更为可靠。根据赵军和杨凯(2006)的建议,开放式问卷的样本量应保证在300份以上,封闭式问卷的样本量应大于400。600份样本可以保证将估计的WTP与真实WTP的误差控制在15%以内(崔卫华和郭玮,2013)。由于封闭式引导技术进行估值时依赖函数分布形式的选取,抽样太少则无法准确地拟合函数的分布特征,因此Arrow等(1993)更是建议封闭式问卷样本容量应在1000以上。从国内研究来看,在样本大小、样本的代表性问题上,绝大多数文献仅仅报告了其调查的结果,而并未就样本的人口统计特征与总体是否一致进行讨论。
第三,零响应问题。
微观经济学理论告诉我们,消费者对某些产品的偏好可能无差异。在CVM中,由于这类原因所造成的零响应我们称之为“真实零响应”。但是,并非所有的零响应者(不愿意支付的受访者)其背后动机都是偏好无差异。有的可能是出于策略性动机而拒绝支付(例如试图影响调查结果或政策的实施),我们称之为“抗议性响应”。从现有研究来看,只有少数几位学者对CVM中的零响应现象进行了进一步的区分,如张志强等(2002;2004)、徐忠民等(2003)以及赵军和杨凯(2005),更鲜有学者系统地分析零响应或抗议性响应对估值结果所造成的影响。
从现有文献的处理方法来看,采用支付卡式或开放式询价方法的研究主要是将零响应不加区分地剔除(如葛颜祥等,2009),或者是不加区分地全部保留(如徐大伟等,2012)。而运用封闭式询价方法的研究文献在处理零响应问题上几乎全部是将零响应者剔除(如徐忠民等,2003),这样一来,所估计出的WTP只是WTP大于零的这部分人群的WTP,由于忽视了偏好无差异的人群,因此无疑会造成高估。并且,零响应者的比例越大,高估的后果就越严重。
进一步地,在分析WTP的影响因素时,如果忽视WTP非负的事实而仍然采用普通最小二乘法估计,则必然会造成回归系数偏差。文献检索显示,国内的482篇CVM文献中,42篇运用或提到Tobit模型。而涉及水质改善的CVM文献中,只有徐大伟(2007)和杜丽永等(2011)注意到了这点。
第四,误用Spike模型。
这个问题是前一个问题的引申。实际上,绝大多数学者都意识到零响应问卷会影响到WTP的估值结果。国内文献经常提到的一种方法是运用Spike模型进行校正,这一方法可能最早是由赵军等(2005)引入的。赵军的处理方法是,首先估算出具有正支付意愿的受访者的平均WTP,然后将该数值乘以正支付意愿样本占全部样本的比例,得到最终的WTP估值。之后,有数十篇文献沿用了赵军等人的处理方法。
但遗憾的是,赵军等(2005)对Kriström(1997)所提出的Spike模型的运用却是错误的。如果Spike模型果真如赵军等(2005)所理解的那么简单,就断然不会被Kriström以“Spike模型在CVM中的运用”(Spike Models in Contingent Valuation)为题发表在农业经济类的国际顶尖期刊American Journal of Agricultural Economics上。并且,Spike模型主要用于分析封闭式问卷下的零响应问题,而不是赵军等(2005)所认为的那样“对开放式、支付卡式问卷同样适用”。实际上,Spike模型的核心思想是,通过构建统计模型将具有无差异的偏好的受访者信息也包含进来,目的是解决大量零支付数据“堆积“问题。有关Spike模型的具体运用,将在第四章展开详细讨论。
第五,有效性和可靠性检验。
有效性和可靠性检验所包含的内容非常丰富。总体上,国内学者大都讨论了理论有效性,例如较高的收入水平是否会带来更高的支付意愿,但只有少数学者讨论了有效性和可靠性检验的其他方面的内容。例如,徐中民等(2003)、张志强等(2004)讨论了询价方法的收敛有效性问题;张翼飞(2012)、张翼飞等(2013)分别讨论了范围有效性和时间可靠性问题;徐大伟等(2012)讨论了WTP/WTA差异问题。最近,国外学者在CVM的预测有效性问题方面提出了三类预防措施:事前措施、事后措施和时间措施(见许丽忠等,2012)。国内学者中,只有张明军等(2007)讨论了事后措施对WTP估值的影响。此外,针对熟悉程度偏差和支付工具偏差,国内尚缺乏系统性的研究文献。
第六,模型选取和指标选取。
理论上,采用开放式或支付卡式问卷,受访者的WTP不可能小于零。将受访者的支付意愿作为解释变量时,不可避免地会出现数据删失(Censored)。面对数据删失问题,经典最小二乘法的参数估计结果是有偏的。文献检索显示,只有徐大伟等(2007)、杜丽永等(2011)等少数学者采用Tobit模型探讨了数据删失问题。但是,他们所采用的传统Tobit模型无法将零支付和正支付区分开来。
顺便指出,部分文献在计量模型设定上也存在疏忽。例如,徐大伟等(2012)所选取的职业指标属于分类数据而非定序数据,分析职业背景是否会对WTP产生影响应该采用虚拟变量方法。
封闭式询价的估值结果和分布函数设定直接相关。现有文献大多采用的是Logit模型,缺乏和其他参数模型以及非参数模型的对比研究。