1.2 国内外研究现状
本书涉及交叉学科,与本课题相关的文献主要有四个方面:一是风险投资激励的研究现状;二是连续时间委托代理模型的研究现状;三是动态控制理论与连续时间风险投资模型的研究现状;四是基于连续时间的委托代理模型风险投资激励现状。
1.2.1 风险投资激励机制研究现状
处于信息劣势的VC需要设计机制来激励处于信息优势的EN,常用的理论就是委托代理理论,VC设计激励合约来激励EN方面的理论成果比较丰富。但这些理论都没有考虑时间问题,更多的是针对不同的融资结构。许多学者(徐玖平、陈书建,2004;贾铮、费方域,2012;桂仑、马国义,2003;徐细雄等,2011;赵炎,2007;张新立、王青建,2006;钱水土、侯波,2001;党兴华等,2007;应瑞瑶、赵永清,2004;顾婧、周宗放,2007;孙艳等,2011;郑君君、刘恒,2005;郑君君等,2005; Rosso, 2013, Grossman et al., 1986; Sahlman, 1990; Barry, 1994; Gompers et al., 1998; Shliefer et al., 1997; Litvak, 2009; Gompers et al., 2009; Hellman, 2002)研究了单个风险投资家和单个风险企业家构成的单阶段委托代理关系,但他们的研究主要考查的是单边道德风险。
另有学者(刘新民等,2010;郭文新等,2009;郭文新等,2010;吴斌等,2012; Repullo et al., 1998; Houben, 2002; Casamatta, 2003; Repullo et al., 2004; Sahlman, 1990; Hellman et al., 2000; Kaplan et al., 2004; Bebchuk et al., 2003; Detemple et al., 2001)从双边道德风险研究了单个风险投资家和单个风险企业家构成的单阶段委托代理关系。
在实践中,可能存在多个VC向一个EN投资,于是有的学者(Elitzur et al., 2001, 2003;郑君君等,2008)研究了多个风险投资家和单个风险企业家构成的委托代理关系。
上述研究都是从单阶段研究的VC和EN的激励机制,还有学者(Ramy et al., 2001;赵炎等,2003;张汉江等,2001;张矢的、魏东旭,2008;王声凑、曾勇,2011;王声凑、曾勇,2012)则研究了VC和EN构成的多阶段委托代理关系。
我们对风险投资中如何防范道德风险进行了评述,这些学者们研究的主题表现在:
第一,希望设计切实可行的激励机制(合约)来减少道德风险,希望EN朝着有利于VC的方向努力,采用协调机制使VC与EN实现利益共享、风险共担的投资方式等。
第二,希望考查EN过去的业绩、商誉或者本身的潜质。
第三,研究VC的动态努力,如金永红等(2003)以及张矢的、魏东旭(2008)等人的研究,而我们是把EN和VC的努力看成时间t的函数,研究了连续时间下的激励机制设计问题。
第四,这些学者对VC应该采用何种注资方式也进行了研究,还研究了EN的努力程度对企业价值的影响。但对EN是否应该注资、注资受哪些因素的影响却研究较少,例如,郑君君、刘恒(2008)认为VC为项目注入一定的资本金,可有效防范VC的草率投资行为,并能缩小投资者的代理成本。
1.2.2 连续时间委托代理模型的研究现状
在早期的研究中,Holmstrom和Milgrom(1987)、Schattler和Sung(1993)利用连续时间模型研究了激励合约,他们认为当代理人的效用函数为指数效用函数时,最优合约是产出的线性函数。之后,Phelan和Townsend(1991)设计了一种计算最优长期合同的时间离散方法。既然可以建立离散时间模型,那么同样可以建立连续时间的委托代理模型,连续时间解决方案和他们的离散时间的例子有很强的相似性,这意味着,最终的方法是以不同的方式看同一件事。他们的计算方法依赖于线性规划和多个迭代收敛到委托人的值函数。虽然他们的方法是相当灵活的,适用于广泛的设置,但是模型求解的难度远远超过了利用微分方程方法求解的难度。由于一般的离散时间模型是很难处理的,但关注一种特殊情况时,比如代理人有足够的耐心或者特别看重未来的收益,或者折扣率是0,或者贴现因子是1,那么激励效率就可以达到,如Radner(1985)和Fudenberg、Holmstrom和Milgrom(1990)等人的相关研究。Williams(2003)建立了一个连续时间的委托代理模型。Sannikov(2008)提出了一个通用的连续时间的委托代理模型,并使用偏微分方程和随机微分方程设计最优合同。由此产生的合同具有几个状态变量,但合同具有一般性,并没有详细探索最优契约。
最近,其他一些论文开始使用连续时间的方法。DeMarzo和Sannikov(2006)使用连续时间委托代理模型方法研究了最优契约。Biais、Mariotti、Plantin和Rochet(2006)的研究表明,DeMarzo和Sannikov(2006)合同中出现的离散时间模型的极限作为代理人的行动越来越频繁。Cvitanic、Wang和Zhang(2006)研究了代理人一次次获取支付的最优合约。Westerfield(2006)建立了连续时间模型,并使用代理的财富作为状态变量。Williams(2003)认为委托人与代理人签订委托合同的期限为一段时间,建立了跨期动态模型。关于这方面的研究还有其他相关文献(Abreu et al., 1986, 1990; Spear et al.,1987; Bolton et al., 2001; Cvitanic et al., 2006; Ou, 2003; Williams, 2005)。
与本书研究相关的是Sannikov(2008)的研究,Sannikov(2008)研究了一个隐藏行动、无状态变量的效用过程。虽然我们的研究结果与Sannikov(2008)有相似之处,但还是有差异的。Sannikov认为设计简单最优合约是更完美的。Williams(2003)的模型涵盖了更一般的结果,并展示了如何使用自己的方法来解决在特定条件下设计最佳合同的问题。Williams(2015)继续研究了隐藏行动和隐藏状态的连续时间动态道德风险模型,模型中采用了线性生产函数和指数效用函数,其显示解给出了扭曲激励原因是如何分配的。他还应用随机最大值原则求解模型,其求解思路是把代理人的优化问题的状态变量变成为委托人选择最优合同的状态变量,其结果表明固定的股权份额和固定的现金流支付能实现最优合约。
进一步,当代理人隐藏行动时,委托人必须依靠一个额外的状态变量:边际效用方面状态的“影子价格”。本书利用Zhou(1996)的控制理论得到了一些结果,这些结果类似于Werning(2002)、Abraham和Pavoni(2008)的离散时间动态道德风险问题。Williams(2003)证明了一阶方法事前有效性是具有一定的条件的,并且条件是相当严格的,因此在很多情况下,也要检查事后的执行(Abraham et al., 2008)。然而,即使在这种情况下,连续时间的方法在这里也可能有一定的计算优势,Williams(2003)发现通过求解一个偏微分方程就可得到最佳合同。
Miao和Rivera(2016)也在隐藏行动条件下研究了连续时间合约问题,认为委托人对项目的现金流有不确定的信念(概率)。满足代理人参与约束和激励约束时,委托人可以设计一个鲁棒合约来最大化期望效用,通过现金储备、债务和权益实现最优契约。
上述研究都是基于一个委托人和一个代理人构成的委托代理关系。Ashutosh(2016)研究了委托多代理道德风险的连续时间最优合约,利用博弈理论和随机最优控制方法求解出了最优合约,研究表明:随着代理人数量的增加,不断上升的效率抵消了道德风险。
1.2.3 动态控制理论与连续风险投资模型的研究现状
根据时间参数是连续的还是离散的,最优风险投资问题可分为离散时间模型和连续时间模型两类。连续时间情形下的风险投资问题的求解思路主要有两种:一是随机控制理论中的随机动态规划方法,二是鞅方法。如果市场是无摩擦的,则鞅方法很实用。然而当市场有摩擦时,鞅方法在很大程度上便难以发挥作用,故在有摩擦的市场模型的研究中,随机控制理论中的随机动态规划方法有着重要作用。根据动态规划原理,最优风险投资问题可最终被化为求解HJB方程的问题。
然而,众所周知,在经典框架下,HJB方程的可解性是一个难题。事实上,HJB方程是一个特殊的非线性偏微分方程。在通常古典解的概念下,方程未必有解,即使存在光滑解,唯一性也不一定满足。并且对于非线性方程,定义Sobolev弱解也是十分困难的。在20世纪80年代初期,Crandall和Lions(1983)、Crandall等(1992)引入了粘性解的概念。粘性解理论十分简洁,在粘性解的概念下,HJB方程的解的存在性和唯一性问题容易得到解决,对于非线性方程,不用构造特殊解也可以研究解的性质,而且经典解的许多结论也可以推广到粘性解。发展粘性解理论的主要动机可能是它与最优控制理论及微分对策的关联。众所周知,常微分方程和随机微分方程的最优控制理论、随机微分对策、动态规划原理等都指出价值函数应该具有相应的偏微分方程的解的特征。这些方程,在控制理论中被称为Bellman或HJB方程,在微分对策中则被称为Isaacs方程。
但是动态规划原理的证明需要比值函数所包含的更多的正则性,粘性解理论的机动性完全填补了这些正则性缺陷。这个基本理论事实使得确定性的微分对策理论大大简化,也为随机微分对策的建立奠定了数学基础。此外对于状态约束问题(至少在确定性问题)的执行成本或边界机制,有关边界条件的部分理论已经比较完善,Crandall和Lions(1992)已经证明了Pontryagin原则。而且,粘性解理论与数值分析和科学计算密切相关,因为它为进行收敛性分析提供了有效的工具,而且对于其他一般的边界条件,特别是经典的边界条件且在方程退化的情形下,给出了有效的分析方法。
因此,构建符合实际发展规律的连续时间风险投资模型并研究信息不对称条件下的最优风险投资问题,有着一定的理论价值和应用前景。
1.2.4 基于连续时间的委托代理模型风险投资激励现状
根据关于连续时间委托代理模型的综述,我们看到连续时间委托代理模型有重要的应用价值,因此用该理论和方法去研究风险投资激励问题,应该会得到非常有用的研究结果。
例如:赵黎明等(2016)利用微分对策理论研究了风险投资和风险企业的合作问题,并基于外部投资者视角将其合作过程抽象为“创业链商誉”,构建了一个微分对策动态模型,还运用汉密尔顿-雅可比-贝尔曼方程求出风险投资和风险企业在Nash非合作博弈、Stackelberg主从博弈及协同合作博弈条件下的最优策略,并对此三种博弈结构下的反馈均衡结果进行了比较。研究结果显示,协同合作博弈情形下的系统收益、参与双方的收益水平要优于Nash非合作博弈、Stackelberg主从博弈情形下的收益水平,而风险企业的激励因子是系统中的一种协调和激励机制,可以提高风投和企业以及整个系统的收益。Sung(1995)在连续时间下扩展了Holmstrom和Milgrom的模型,并证明了最优的合同仍然是线性的,再将该理论应用于公司的项目选择上。Giat和Subramanian(2013)建立了动态委托代理模型,利用该模型研究了支付参数、代理冲突和代理人隐性激励问题,并进一步研究了不可观察的行动如何影响最优合约及事后信念。在方法上,其采用离散时间近似方法解决连续时间合约问题,根据求解非线性常微分方程(ODE)得到了最优合同,然后利用非线性常微分方程(ODE)的性质,得出了一系列的长期合约。Giat和Subramanian(2013)研究得出的一些结果与经验证据一致,不对称信念、风险分担和逆向选择成本之间的相互作用可能导致代理人激励强度增加或减少时间路径(Timepaths)。Giat和Subramanian(2013)的研究结果还表明,纳入不完全公众信息和不对称信念可能会调和风险和激励之间的关系。Fazekas(2016)研究了当公司或项目的不确定性十分显著时,风险投资如何能够进入风险企业家的公司或项目。Fazekas(2016)通过实物期权方法研究了风险投资的独特风险,研究表明:VC通过使用金融工具和相关机制,可以从初创企业的灵活性和不确定性中获得优势,从不断的企业学习中挖掘企业价值增长的能力并从这些企业提供的机会中获利。吴孝灵等(2016)引入项目运营收益的相对补偿指数,设计了一种单期补偿契约;然后基于私人投资决策存在不同风险偏好的行为,借助“均值-方差”模型建立了私人投资的期望效用函数,并运用主从对策博弈(连续时间)分析了私人投资策略与政府补偿情景,从而通过情景建模来研究政府补偿契约的最优设计及应对策略。Ko等(2011)应用博弈期权构建了风险投资的最优决策模型。该模型强调了两种风险投资公司的竞争和投资策略所形成的市场结构对投资回报的期权选择,同时他们也研究了如何选择投资时机以避免任何潜在的竞争威胁,其目的是为VC公司的投资决策提供最佳预期阈值(Optimal Expected Threshold)。Lukas等(2016)提出了在不确定性条件下基于EN与VC的期权博弈风险投资动态模型,并分析了多阶段融资和技术不确定性等因素对最优风险投资合约的影响,他们采用了序贯非合作的复合期权定价方法。结果表明,不确定性越高,VC获得的股份越多,并越能防止风险项目失败,而重新谈判则可能导致企业控制权发生戏剧性的转变。Zhang等(2017)针对风险投资过程中发生重大突发事件时,传统定价模型给出的项目估值与真实项目价值偏差过大的问题,把风险投资过程视为执行价为企业投资额的实物期权,利用风险中性定价的方法建立了连续时间模型下带跳的不确定投资定价模型,并最终得到了项目估值的解析解。
上述研究都是基于完全理性的假设,曹麒麟、王文轲(2015)从风险投资决策者的有限理性出发,强调风险投资者的实际心理感受对风险投资决策的影响,根据高新技术项目的高风险、高收益性以及分阶段资金注入的特点,建立了基于有限理性和不同技术战略的实物期权风险投资动态决策模型。Giat等(2007)建立了动态的结构模型,定量评估了风险、不确定性和非对称信念的项目质量对风险投资的影响。他们的研究发现:企业家的乐观情绪能够减轻VC和EN之间的代理成本,显著提高VC的预期收益。同时项目价值和VC的预期收益均随着项目的瞬时风险的增加而增加,但其内在风险随之降低。
尽管连续时间委托代理模型较少用在风险投资中,但其理论比较成熟,一些学者利用连续时间委托代理模型研究了渠道决策,例如Jørgensen等(2000, 2001, 2003)、Guiomar和Taboubi(2015)、张建军等(2014)、张庶平(2013)等都做了相应研究。
尽管他们的研究考虑的是VC和EN的连续时间决策问题,但他们的研究是基于信息完全对称的,也就是说没有考虑信息不对称条件下的激励合约问题。
1.2.5 研究现状的一个简要总结
风险投资激励问题是一个重要问题,学者们做了很多研究,研究成果也十分丰富,主要体现在以下几个方面:
第一,从风险投资结构来看,学者们研究了一个VC和一个EN构成的简单风险投资的激励问题,但很少研究一个VC和多个EN构成的简单风险投资的激励问题,也很少研究多个VC和一个EN构成的简单风险投资的激励问题。
第二,从决策变量与时间的关系来看,大量的文献都是基于静态的决策,即决策变量与时间无关。但实践中,决策者的决策是随着时间的变化而变化的,因此需要考虑连续时间下的决策问题。
第三,从研究方法来看,利用静态委托代理模型方法和博弈论方法的较多,而利用连续时间委托代理模型的较少。
通过前面的简单评述可知,其他学者所留下的一些研究空白为我们提供了很好的研究空间,我们认为在连续时间下研究风险投资问题具有十分重要的现实意义和理论意义。