第三节 粮食主产区利益补偿机理的博弈分析
博弈论是研究理性的决策主体之间在利益相互制约的条件下如何选择策略与相应结局,使自己效用最大化的理论,也是研究理性的决策者之间的冲突及合作的理论。在粮食主产区利益补偿中,涉及中央政府、主产区政府、主销区政府、农户、农业龙头企业等多元主体,由于各主体的利益目标和行为取向不尽一致,因此,引入博弈论的动态博弈、重复博弈、进化博弈等博弈理论,对粮食主产区利益补偿各主体相互间的冲突与合作进行剖析,有助于我们更好地分析粮食主产区利益补偿的内在机理。由于政府与企业、企业与农户之间的博弈和政府与农户间的博弈有很多类似的地方,所以这里在分析粮食主产区利益补偿中各利益主体的利益目标和行为取向的基础上,着重分析中央政府与地方政府、粮食主产区与主销区、政府与农户间的利益博弈关系。
一 粮食主产区利益补偿中利益主体的利益目标及行为取向
利益主体是指任何可以影响所在组织目标的或被该目标影响的群体或个人,即具有自身利益愿望并能自主地采取行动实现其愿望的个人或由个人组成的群体或组织。粮食主产区利益补偿涉及中央政府、主产区政府、主销区政府、农户、农业龙头企业等多元主体,由于各主体的出发点、目标等均不尽相同,且在不同的环境及运行机制下,其参与利益分配的条件和感受也不尽相同。因此,全面剖析利益主体的背景条件、目标追求、行为特征、复杂的行为关系及其发生机理,对于揭示粮食主产区利益补偿中的利益博弈关系,有着重要的理论和现实意义。
(一)中央政府(国家)
作为粮食主产区利益补偿重要主体的中央政府,是管理全国事务的包括立法、行政和司法机关等全部在内的国家机构的总称。中央政府行为即指政府作为国家的代表所进行的一切活动,由于中央政府行为体现了国家意志,在特定市场经济关系中其完全代表了国家。在粮食主产区利益补偿中,鉴于国家(政府)及其利益目标的存在理由,中央政府的利益目标函数至少由政治利益、经济利益和历史使命构成。政治利益主要是保障国家粮食安全,维护社会稳定;经济利益主要指粮食产品本身是经济社会发展的基础,为农产品加工业提供原料,并可为出口创汇做贡献;历史使命主要是指通过对粮食主产区的利益补偿,获得经济社会的可持续发展,奠定经得起实践和历史检验的、足以彪炳史册的成就和建树。
因此,中央政府往往会为此而在粮食生产、流通、储备等方面实施宏观调控,其中就包括协调粮食产销区利益,从国家宏观层面推进对粮食主产区的利益补偿。当然,由于经济社会发展的阶段性以及思想认识上的不同,中央政府在粮食主产区利益补偿中也可能存在行为异化的情形,比如无视粮食产销利益的失衡,不但不对粮食主产区予以利益补偿,反而以各种“剪刀差”抽取粮食主产区的利益。这在我国二元结构的历史演进中,曾一度表现得尤为典型。
(二)地方政府
地方政府是国家为了管理需要,划分地区设置的地方行政单位,其形成和发展受到国家结构、政治制度、经济体制、文化传统等诸多因素的影响和制约,但也存在一些共同的特征,即地方政府的属性,决定了其价值判断往往是从地区利益最大化和政绩最大化考虑。在粮食主产区利益补偿中,地方政府的利益目标函数往往由经济利益、政治利益和政治忠诚三大因素决定,经济利益主要指区域经济发展(如产值规模、就业等)、财税增长等,政治利益主要指政绩考评、职务升迁等,政治忠诚主要指执行和完成上级粮食安全目标以及对区域持续发展和人民的负责等。
具体而言,地方政府的利益目标及行为取向又有主产区政府和主销区政府之别。对于主产区政府而言,既要推动区域经济发展,又要保护耕地和发展粮食生产,尤其是在现行政治体制下,对粮食生产、农民增收的要求,已成为主产区政府的重要努力方向,特别是耕地“红线”的硬约束,成为主产区政府的无形指挥棒。对于主销区政府而言,在加快经济发展的同时,如何保障本区域的粮食供给,是“米袋子”省长负责制的重要内容,因其更多的非农产业发展获得了更多的比较收益,这也构成主销区对主产区利益补偿的基本动力。但是,如果依靠这种自发补偿,是不稳定的,尤其是在国外粮食价格低于国内时,这种自发补偿便很容易在市场机制下发生异化。
(三)农户
农户是现阶段农业生产的主体,对农户而言,收入的最大化和生产的低风险便是其价值取向。当然,对农民是否具有理性,是学术界长期争论的一个话题。特别是农民的反常供给反应,常被认为是农民的“非理性”行为的典型体现,甚至是追求利润最大化的“经济人”假定,也曾一度被认为不适用于农民。1964年,舒尔茨在《改造传统农业》中对传统农业社会农民的愚昧、落后,对经济刺激不能做出正常反应,以及经济行为缺乏理性等应当对生产要素配置效率低下负主要责任的观点予以驳斥,利用社会学家对危地马拉的帕纳加萨尔和印度的塞纳普尔两个传统农业社会进行的详细调查资料,证明了传统农业中的农民并不愚昧,他们对市场价格的变动能够做出迅速而正确的反应,并且他们已经通过多年的摸索实践,使现有生产要素的配置达到了最优化。[5]
当然,农户的行为取向也受风俗习惯、思想观念、自身经历以及以往粮食危机的递延效应等因素的影响。由于传统农耕社会的长期影响,“耕读传家”等观念的根深蒂固,农民长期习惯于对耕地的依附,特别是当前仍然作为从事耕作主体的农民,他们或亲身经历或间接耳闻“三年自然灾害”,这种粮食危机对人们的心理影响会在代际延续,从而推动他们一直重视耕作粮食。当然,受比较收益持续偏低影响,粮食生产尤其是粮食增产积极性如何充分保护和调动、“未来谁来种粮”等,也是必须引起各级政府高度重视的问题。
(四)农业龙头企业
长期以来,农业龙头企业在推动农业农村发展方面发挥着重要的作用,其不仅有利于激发农村发展的活力,推进农业产业化、规模化、品牌化经营,促进农业增效、农民增收,而且有利于培养有市场意识和农业科技意识的新农民,并通过多方共赢,形成良性循环,在不脱离农业、不削弱农业的前提下,达到“产量不下降、质量有提升、安全有保证、效益有增加”的效果,从而打破长期形成的“粮食大县、工业小县、财政穷县”的怪圈,为传统农区发展提供源源不竭的动力。
当然,近年来,在资本下乡过程中,也出现过一些工商企业钻政策空子的现象,将本应发展农业的土地,以开发农业的名义用来搞房地产建设,比如建别墅、高尔夫球场等。选择从事“中间”经营的行为,也多出于建立稳定可靠的原材料基地的目的,其对农业生产最直接的可能负面影响,便是为了直接的加工或经营目的,放弃原本农作物自然生长所需要的利于土壤自我修复的轮种制度,改为过分依赖化肥和农药投入而长期生产某一种农产品。这种掠夺型的耕作方法,在造成成本上升的同时,也使得土壤劣化。更有甚者,将原材料基地逐渐或部分改变为加工车间或房地产用地,甚至使本应淘汰的工艺和产能也紧随资本下乡,带来污染转移。
更进一步的风险则是针对农民而言的,工商资本进入农业经营后,农民所面临的风险已不仅仅是农业本身的自然和市场的双重风险,还要加上工商资本的经营风险和道德风险。一方面,如果市场发生变化,公司经营发生变故,势必给农民留下大量难以处理的问题。国际金融危机曾造成农民工大规模被动返乡,就已说明只有农村才是他们的归宿,换言之,只有土地才是他们最根本的保障,而一旦这种保障没有有效的替代,便是大问题到来之时。另一方面,即便公司经营正常,能否形成正常合理的利益衔接机制,也是衡量工商资本道德风险的砝码。据调查,在农业产业化的违约事件中,龙头企业违约占70%,农户违约仅占30%,龙头企业违约率远高于农户。此外,近年来盛行的“蒜你狠”等热词,也是一些游资进入“三农”领域的直接信号。这种扰乱市场价格秩序的恶意炒作,不但无益于农业农村发展,而且加重了消费者负担,更是对农业农村资源的剥夺。如果此种操作再向农业生产、加工和食品供应等环节进一步渗透,后果更是不可想象。
二 中央政府与地方政府在利益补偿中的博弈分析
在粮食主产区利益补偿中,中央政府与地方政府的博弈关系可以用委托—代理模型来解释。一般而言,委托—代理模型须包括三个要件。
一是信息的非对称,即代理人因具体操办委托人交办事宜而拥有比委托人更多的隐藏知识(hidden knowledge)或隐藏信息(hidden information),使得代理人处于信息优势地位,而委托人处于信息劣势地位。[6]在粮食主产区利益补偿中,中央政府制定相关政策措施,通过平衡粮食产销区利益关系,推动产销区协作,实现粮食安全供给,地方政府负责粮食产销协作合同的履行。由于产销区政府对本地粮食供需情况及合同更为了解,中央政府显然不如地方政府了解情况,因此中央政府处于信息劣势,地方政府处于信息优势。产销区政府在中央政府的委托下履行产销协作合同,有助于中央政府粮食安全保障目标的实现;反之,则不利于中央政府的粮食安全目标的实现。
二是契约关系,即该契约规定委托人与代理人的责、权、利界限以及某一可立约指针(如利润指针)之间的函数关系。地方政府尤其是主产区政府的公共财政支出中,有相当一部分需要通过中央财政转移支付来实现,而中央政府拨给地方政府一定的资金完成粮食安全保障任务,就形成了契约关系。
三是利益结构,即委托人如何设计一个代理人能够接受的契约(激励机制),促使代理人采取适当行动,在代理人追求自身效益最大化的同时,最大限度地增进委托人的利益,也就是说,在这个框架中存在这样一个利益均衡:委托人的利益实现就是建立在自身利益最大化的基础上。[7]作为委托人的中央政府为了使粮食安全政策(主要是粮食协作合同履行)得以贯彻实施,将会提出很多的优惠政策以作为一种报酬机制,激励代理人尽心尽责,努力达到福利效用的最大化。作为代理人的地方政府据此选择自己的努力行为,以求得自身利益最大化。尽管委托人与代理人的目标函数是不一致的,但他们都是利益最大化的追求者,通过一种有效的激励约束机制的建立有可能实现各方利益的最大化。
在委托—代理模型中,中央政府和地方政府的博弈归根结底体现在地方政府是否严格执行中央的政策。因此,可以假设地方政府面临两种选择——“履约”和“违约”,而中央政府的选择为“查处”和“不查处”地方政府的违约行为。这样,可以建立中央与地方政府利益补偿静态博弈支付矩阵(见图2-3)。
图2-3 中央与地方政府利益补偿静态博弈支付矩阵
假设地方政府选择“履约”,获得的收益为R0;地方政府选择“违约”,如果中央政府不予查处,地方政府可获得收益R1(R0<R1);如果地方政府违约行为被查处,则地方政府被处罚的损失成本为G×P(G代表处罚标准,P代表被查处的概率)。对中央政府而言,如果地方政府违约,而中央政府又没有查处,则中央政府的收益为0;如果地方政府在中央政府不予监督的情况下选择履约,则中央政府的收益为V,在监督查处的情况下履约,则中央政府的收益为V-C(C代表查处成本)。从地方政府的期望收益看,中央政府惩罚标准(成本G×P)对地方政府选择有着决定性影响:
如果R1-G×P>R0,即地方政府因违约受到查处后的收益仍然大于履约时的收益,将出现纳什均衡(违约,查处),地方政府违约行为将持续泛滥。
如果R1-G×P<R0,即地方政府因违约受到查处后的收益低于履约时的收益,则不存在纯策略纳什均衡,存在混合策略纳什均衡。
如果R1-G×P=R0,即地方政府因违约受到查处后的收益等于履约时的收益,此时地方政府理论上没有违约动力,但是在追求GDP的政绩考核等因素推动下,地方政府仍有选择违约的驱动力。
因此,中央政府查处使地方政府收益损失(G×P)足够大,使R1-G×P<R0,则地方政府会严格履约。因此,为了保障粮食安全,可行的选择是对粮食生产行为给予足够奖励和扶持,即加大对粮食主产区的利益补偿力度。
三 粮食产销区之间在利益补偿中的博弈分析
粮食产销区都需要致力于发展经济,并将经济发展建立在粮食安全的基础上,两者都以理性决策追求个体经济利益最大化。由于粮食主产区在粮食生产上具有相对优势,粮食主销区在非粮产业上具有相对优势,但发展非粮产业比较效益更为突出,所以二者在利益补偿中具有涉及资源如何配置以及相互间是否分工合作的博弈关系。对此,可以假设P为主产区,S为主销区,主产区政府扶持粮食生产的财政投入为FP[8],其他用于经济发展和改善居民福利的财政投入为IP;主销区政府扶持粮食生产的财政投入为FS,其他用于经济发展和改善居民福利的财政投入为IS。假设产销区政府的效用函数也为柯布—道格拉斯函数形式,即:
ui(F,Ii)=FγIρi,其中,0<γ<1,0<ρ<1,γ+ρ≤1,F=FP+FS,i=P,S。
产销区政府面临的问题就是选择自己的最优战略(F*i,I*i),以最大化自身的效用,即:
maxui(F,Ii)=EγIρi
政府面临的约束条件为:
Fi+Ii≤Ri,其中,Ri为政府i的财政总收入。
构造拉格朗日函数:
Li=FγIρi+λ(Fi+Ii-Ri)
其中,λ是拉格朗日乘数,最优化的一阶条件为:
∂ui/∂F=γFγ-1Iρi+λ=0
∂ui/∂Ii=ρFγIρ-1i+λ=0
消去λ,并带入政府财政预算约束条件,则主产区P和主销区S政府的反应函数分别为:
则上式中主产区政府P的反应函数意味着,若主销区政府S在粮食生产上的投入每增加一个单位,主产区政府P将能在粮食生产投入上减少单位的投入。主销区政府S的反应函数可做类似的解释。
同时,由上式可得:
由于RP≤RS,所以FS≥0,但FP则需要进一步分析,根据上式可得:
当RP=RS时,则有FP=FS;当时,则有FP<FS;当时,则有FP≤0。这意味着当主产区和主销区经济发展水平和地方人均财政收入水平相当时,由产销区政府共同承担对粮食生产投入的扶持,且产销区政府的扶持力度也基本相当;当主产区经济发展水平和地方人均财政收入水平略低于主销区时,也由产销区政府共同承担对粮食生产投入的扶持,但主产区的扶持力度要小于主销区政府;当主产区经济发展水平和地方人均财政收入水平显著低于主销区时,则只有主销区政府扶持粮食生产,主产区政府则不扶持粮食生产。这反映了在没有中央政府调控及其他因素的制约下,单纯的产销区政府博弈的结果应是由主销区承担大部分或全部粮食生产投入的扶持任务,因此,粮食主产区利益补偿是产销区利益博弈的基本要求。要达到二者之间的最优战略(F*i,I*i),必须强化粮食主销区对粮食主产区的利益补偿。
四 政府与农户在利益补偿中的博弈分析
作为理性的“经济人”,农户的粮食生产投入取决于其对成本和收益的比较,因此,政府对农户的利益补偿与否及力度的大小,对农户粮食生产意愿有着直接的影响。假设在二者的博弈过程中,双方的行为都是一次性的,政府首先决定是否在保障粮食安全的同时,最大限度地重视对农户的利益补偿,而农户在观察到政府的行为之后,在种粮和不种粮间做出选择。这个假定是基于以下两方面的事实做出的:一是农户的思维定式现象比较严重,或认为农民种粮天经地义,有没有利益补偿都不能不种粮,或认为即便政府给予利益补偿,也较难改变务农种粮的处境,因此,即便政府在观察到了农户的行为之后重新做出充分重视农户利益的选择,农户在短期内也不会改变自己的选择;二是单个农户处于一个群体之中,群体成员之间存在相互认同、激励、学习和模仿的效应,这使得其他农户的看法对其有强化作用。假设政府和农户都是序贯理性的,并且理性和支付函数都是双方的共同知识。由此,该完全信息动态博弈可以用扩展式表示(见图2-4)。
图2-4 粮食主产区利益补偿中政府与农户行为博弈模型
其中,每一个支付向量的第一个数字表示政府的支付,第二个数字表示农户的支付。政府的收益是农户种粮积极性的函数,当农户积极种粮时,政府获得高收益RH;当农户消极种粮时,政府获得低收益RL。同时,政府只有两种成本类型,当它重视对农户的利益补偿时,支付高成本CH;当它不重视对农民的利益补偿时,支付低成本CL。农户因积极种粮或消极种粮分别支付高成本FH和低成本FL,而其收益由短期经济收益(政府补贴)和长期经济收益(种粮收益和加强农田保护的地租收益等)构成,因而相应地其收益可分为πH、πL、πh和πl,有πH>πL>πh>πl。可用逆向归纳法求解该博弈的子博弈精练纳什均衡。
首先,从第二阶段看,在现行补偿政策下,农户对未来的经济收益多持并不乐观的态度,认为粮食生产预期收益难以持续高位提升,不足以补偿积极种粮带来的额外成本支出,因此有πL-FL>πH-FH,πl-FL>πh-FH。无论政府是否选择重视对农户的利益补偿,农户选择消极种粮是其严格占优战略。
其次,从第二阶段看,政府知道博弈进入第二阶段后,农户将选择消极种粮,由于RL-CL>RL-CH,因此,政府将选择不重视对农户的利益补偿,使双方的支付为(RL-CL,πl-FL)。
因此,该博弈的子博弈精练纳什均衡为(不补偿,消极),该结果难以得到帕累托最优。这一低效均衡点形成的根源在于,政府与农户粮食生产目标的激励不相容。因此,必须通过引入可置信的承诺强化对农户的经济激励,提高其粮食生产的积极性,相关机制与配套政策的设计必须以充分尊重农户的利益为核心,对其所承受的损失和成本予以充分考虑,以实现其与政府粮食安全目标的激励兼容。
[1] 陈文科:《论农业大省》,《江汉论坛》2008年第3期,第5~13页。
[2] 需要说明的是,由于2011年粮食跨省调出量数据尚未出来,所以在本研究中,粮食净调出量采用的是匡算的办法测算的,具体计算方法是:区域粮食净调出量=区域粮食总产量-全国人均粮食消费量×区域人口总数,其中,全国人均粮食消费量=(总产量+净进口)/全国总人口。因此,这与目前的通行说法略有出入,即黑龙江、吉林、内蒙古、河南、安徽、江西6个省份为净调出省份。对此,需要加以辨别,因为这一说法是以2007年各省份粮食跨省调出量数据为依据的,尚未反映近几年的实践变化。而且,从本研究匡算的数据尤其是包括其他省份如宁夏、新疆的数据来看,与实际是基本符合的。
[3] 张正斌、段子渊:《从西北水资源高效利用看粮食生产基地的悄然崛起》,《中国水资源和粮食安全与现代农业发展》,科学出版社,2010。
[4] 资料来源于《国家粮食安全中长期规划纲要(2008~2020年)》。
[5] 马文杰:《中国粮食综合生产能力研究》,科学出版社,2010,第87~88页。
[6] 张维迎:《博弈论与信息经济学》,格致出版社、上海三联书店、上海人民出版社,2004,第235~236页。
[7] 高瑛:《基于粮食安全保障的我国粮食产销利益协调机制研究》,南京农业大学博士学位论文,2006,第90页。
[8] 为避免单纯比较产销区财政投入规模缺乏实质意义的问题,这里的财政投入等指标均为人均可比指标。