四、结果
下图1至5都以“森林图”的形式呈现实验结果,并为每一个检验样本的每一项检验标绘了点估计(Point Estimates)和置信区间(Confidence Intervals)。“森林图”的逻辑在于,它呈现了对单一假设的所有可以进行的检验的总体模式,并且估计出了该结果模式发生的概率可能性。虽然这些图的解释非常复杂[1],但在本文中,实验的结果却是相对明确的。每个图表底部的菱形表示出实验组和对照组的加权平均优势比(the Weighted Average Odds Ratio)。该优势比的计算很简单,就是通过实验组中的比例除以对照组中的比例得到的。在每项检验中,点估计值就是通过估计出来的优势比与1的距离来确定的。“森林图”中环绕着每一个点估计的“树”表示着每个点估计值的置信区间。当水平线与图中唯一的垂直线相交时就说明,95%的双尾置信区间(Two-tailed Confidence Interval)中包含1,表明实验组和对照组差异的点估计值不显著;图形底部菱形处的加权平均值也是同理。当没有“树”或者菱形触及中心垂直线,就表明该差异在统计上显著(p≤.05)。
图1 被害人接受的道歉
以两种测量标准针对假设一进行的测量结果与假设相一致(假设一:“与不涉及恢复性司法的传统司法程序相比,恢复性司法会谈更能产生成功的互动仪式,这种互动仪式能够在加害人与被害人之间培养社会连带关系,并重新确认他们共同的群体道德观”)。图1和图2表明,恢复性司法会谈更能显著地促使加害人向被害人道歉,而被害人也认可这种道歉的真诚性,这也对加害人遵守群体道德观作出了确认。
图2(被害人)接受的真诚道歉
道歉对于被害人修复因过往经历造成的情感伤害极为重要。[2]在每项实验中无论男女,被害人如果被分配到了实验组,其获得加害人道歉的可能性就大增。部分原因是被害人很少出庭。所有的案件都需要获得全部的许可之后才能纳入实验,而且所有进入法庭审理的案件都需要作出有罪答辩,对照组的被害人很少出现在法庭上,是因为他们并不被要求作为证人出庭,因此他们经常不会收到案件将要开庭审理的通知。此外,如果加害人是青少年,在堪培拉的庭审中被害人是禁止出庭的。所以几乎所有对照组的致歉行为都是在法庭之外进行的。
堪培拉和伦敦的实验存在差异。在伦敦实验的恢复性司法会谈中进行道歉(几乎100%)比堪培拉更为频繁。这也许可以解释为什么所有实验中被害人所感受到的宽恕感有差异(见图3)。此外,伦敦实验的所有恢复性司法会谈中,被害人都在会谈过程中收到道歉;而在堪培拉,一部分道歉则在会谈之外进行,会谈外道歉所占比例如下:财产犯罪实验(JPP)男性被害人中占8%,女性被害人中占的9%;暴力犯罪实验(JVC)男性被害人中占12%,女性被害人中则没有。
图3 宽恕(英国伦敦实验)
但是这些差异并没有强大到使贯穿八个点估计值分析的对假设的检验无效。图1所一直体现出来的伦敦实验中因道歉产生的较大的效果量(effect size)并不与图2中因真诚道歉产生的类似的效果量上的差异相匹配。因此,从互动仪式理论上看,堪培拉和伦敦实验的恢复性司法仪式都成功地产生了为被害人所认同的结果——成功地对群体道德观进行了再次的确认,这方面的效果是未进行恢复性司法程序的十倍至一百倍。
真诚道歉所体现的较大的优势比(图2所示)似乎与恢复性司法的过程联系到一起,而不是与道歉的具体方式相联系。不仅在两个地点进行的恢复性司法实验对于男性和女性来说都更能促成加害人对被害人的道歉,而且所有实验中的被害人普遍认为被随机分配参加恢复性司法会谈的加害人的道歉是真诚的。总体而言,两地实验组的女性被害人相对于男性被害人,对道歉的真诚性给予最高评价。伦敦实验的被害人与堪培拉实验的被害人相比,更倾向于认为加害人的道歉是真诚的,尽管在所有被害人中,伦敦抢劫犯罪实验(LOR)的男性被害人对加害人道歉真诚性的怀疑程度最高,而伦敦盗窃犯罪实验(LOB)的男性被害人怀疑程度最低。
然而,道歉的真诚性并不足以使被害人对加害人在很大程度上予以宽恕,这使得与支持假设二(假设二:“被随机分配参与恢复性司法会谈的被害人,与未被分配参与恢复性司法会谈的被害人相比,在未来更能显示出心理方面受益于恢复性司法程序”)的证据一致性较低。图3显示了伦敦实验在被害人宽恕方面支持假设二的唯一证据,与图1和图2所显示的很大的效果量相比,这一证据薄弱很多,而且一致性较低。从图3可以看出,加权平均值几乎没有显著性。在伦敦盗窃犯罪实验(而非抢劫犯罪实验)中,随机分配进入恢复性司法实验组的被害人与对照组的被害人相比,更容易宽恕加害人,这一点在女性被害人方面尤为显著(这一方面我们没有堪培拉实验的比较数据)。但是,与对照组的被害人相比,随机分配进行恢复性司法会谈并没有使实验组的被害人显著降低其对导致犯罪的自责程度,这一点在所有的八个检验中都是如此——恢复性司法会谈在这一方面的合计效果(summary effect)为零(见图4)。
图4 被害人的自责
图3仅包括伦敦实验中实验组和对照组的数据。在堪培拉的两个实验中,仅有实验组的被害人在回访中被问及关于宽恕的问题:“自会谈以来,对于加害人的感觉,您选择下列哪一项:很不能宽恕(very unforgiving);不能宽恕(unforgiving),既不宽恕也不不宽恕(neither forgiving nor unforgiving);宽恕(Forgiving);很能宽恕(very forgiving)。”结果表明,与伦敦参与恢复性司法的被害人相比,堪培拉实验中被提供过进行恢复性司法会谈机会的被害人(通过意向处理分析)所表现出来的宽恕程度要低很多。[3]在堪培拉实验中,被提供过进行恢复性司法会谈机会的男性和女性被害人中,对上述问题的回答是“宽恕”或“很能宽恕”所占比例如下:暴力犯罪实验(JVC)中,男性被害人为41%,女性被害人为40%;财产犯罪实验(JPP)中,男性被害人为28%,女性被害人为44%。平均来看,堪培拉实验中有38%的被害人选择宽恕,伦敦实验则高达75%。当我们再考虑到纳入伦敦实验的犯罪要比纳入堪培拉实验的犯罪严重得多时,伦敦实验被害人宽恕加害人的倾向要远超堪培拉这一结论就更令人震惊了。
假设二与图4所展示的证据关系更为密切,因为图4的证据直接与假设二相矛盾。由于加权平均数(weighted mean average)的位置正好在中心线上,在被害人的自责性上,并不因为所处的实验组、被害人的性别、所在的地点以及实验而体现出一致的差异。此项分析是以就自责的一段叙述表示“同意(agreed)”或者“非常同意(strongly agreed)”的被害人所占比例为基础开展的。
尽管根据我们的临床印象判断,被害人在从加害人处听闻该项犯罪只是偶然发生时都会安心很多,但是这些信息的效果似乎并未降低被害人的自责。因此,该结果变量的测量指标似乎并不支持恢复性司法与认知行为疗法(CBT)具有相似功效这一假设。虽然通过分析伦敦实验的早期数据所进行的比较显示,恢复性司法会谈对于减轻被害人创伤后应激综合症有清晰的效果[4],这种效果似乎并不依赖于被害人在初次回访时减轻引发犯罪的自责。
我们也可以在自责数据的解释方面,将对恢复性司法会谈的满意度这一问题排除掉。伦敦实验中分配到实验组的被害人中对恢复性司法会谈表示“满意(satisfied)”的占97%,远超堪培拉实验中的61%。同样,伦敦实验的被害人表示对“恢复性司法会谈结果满意(pleased with the outcome)”的占92%,同样远超堪培拉实验中的62%。但在这两个城市的实验中,参与恢复性司法并没有降低被害人的自责程度。
但是,在两个城市的实验中,建构效度(Construct Validity)可能最高的测量指标都为假设二提供了强有力的支持性证据。[5]如果被害人通过自愿遵守法律的程度,最好地展现了被害人自己对于共享的道德观的遵守,那么恢复性司法很明显促进这种遵守。如图5所示,被害人对于向加害人暴力报复的欲望通过随机分配进行恢复性司法会谈得以持续、大量地降低。在这个方面,我们在堪培拉实验和伦敦实验的回访中采用了不同的表述。堪培拉的表述是“如果有机会,你会报复伤害加害人”;伦敦的表述是“你现在希望从身体的伤害方面报复加害人”。在所有八个基于不同性别所进行的检验分析中,分配到恢复性司法实验组的被害人与对照组的被害人相比,更不可能对上述表述表示“同意(agreed)”或者“非常同意(strongly agree)”。尽管八个估值中只有一个统计上显著,但是点估计值的整体模式极不可能是偶然造成的。在不同实验和不同城市,正如I方检验(I-square test)[6]所显示的,对照组被害人暴力报复的欲望程度的本质差异[7]并未表明(各组之间)会产生交互效应(interaction effect),因为不管报复欲望的基线水平如何,效应量都很相似。
图5 被害人事后的报复欲望
[1] Sherman, L. W. & Strang, H.(2004). Verdicts or inventions? Interpreting results from randomized controlled experiments in criminology. American Behavioral Scientist 47,575—607.
[2] Strang, H.(2002). Repair or revenge:Victims and restorative justice. Oxford:Oxford University Press.
[3] 这里进行的意向处理分析,即针对的是被提供过参加恢复性司法会谈机会的被害人,而非最终参与了恢复性司法会谈的被害人,根据上文介绍,堪培拉实验中则有一些被害人被分配到实验组但最后却未能参加恢复性司法会谈的情况。——译者注
[4] Angel, C.(2004). Crime Victims Meet Their Offenders:Testing the Impact of Restorative Justice Conferences on Victims_ Post-Traumatic Stress Symptoms. Paper presented to the American Society of Criminology, Nashville, Tennessee,17.
[5] 建构效果,指的是某一方面的测量与其他变量相关的程度。——译者注
[6] I方检验是卡方检验(Chi square test)的一种变异形式,是一种测定实测值与理论值间符合抽样程度的统计方法。当发现两个数值存在差异时,确定该差异是随机抽样误差还是理论假设的问题而引起的。——译者注
[7] Sherman, L. W.(2006). Revenge may be sweet, but restorative justice can suppress the appetite. In S. Karstedt, H. Strang, & I. Loader(Eds.), Emotions, Crime and Justice:A Volume of the International Institute for the Sociology of Law, Onati, Spain. Oxford:Hart Publishing.