绪论
1.积极心理测评工具的特征、选择与评价
一、积极心理测评工具的特征
量表的标准化是量表编制中必需且重要的一环。也就是说,量表编制成稿之后经过标准化才算正式完成。编制后的量表能否投入使用,主要取决于其标准化特征和程度。
1.取样(sampling)
按传统的测验学理论,对测验或评定的解释是,以被测或被评者的所属群体为标准,在编制测验或量表无法测量这个群体中所有成员时,便只能取样,即以样本代表全体(汪向东,王希林,马弘,1999)。样本具有代表性才能保障测评工具具有较好的信度和效度。否则可能导致测评工具的信度和效度不高,导致结果解释存在偏差。提高样本的代表性,除了要求样本的数量达到要求之外,还应该注意所测评内容(如积极心理测评中的生活满意度、生命意义感、情绪智力等)的所有有关影响因素(如年龄、性别、文化程度、民族、生活地区等)。
心理测评常用的取样方法分简单随机抽样、整群抽样、分层比例抽样和机械抽样等。
(1)简单随机抽样:包括直接抽选法、抽签法、随机数字表法。
(2)整群抽样:先将总体分为多个群,然后随机抽取其中若干个群,对这些群内所有个体或单元均进行调查。
(3)分层比例抽样:先将总体中所有的单位按照某个标志分成若干类(组),然后在各个类中分别随机抽取样本。
(4)机械抽样:先将抽样总体单位按照一定顺序排队,根据总体单位数和样本单位数计算出抽选间隔(抽选距离),然后按照一定的间隔抽选样本单位。由于抽选间隔相等,所以也叫等距抽样。
不管用何方式,都要使样本有足够代表性。因此,在选择测量工具时必须注意编制此工具的样本代表性和所要评估的对象情况是否在样本内。只有受测者的情况在这些方面与标准样本相符,所测结果与标准样本才有可比性。
2.常模(norm)
常模是一种供比较用的标准量数,由标准化样本测试结果计算而来,其形式大致有如下几种。
(1)均数。某一受评者所得分数与标准化样本的平均数相比较时,便能确定其水平的高低。
(2)标准分。用标准分作常模,可提供更多的信息。标准分能说明受测者的评定成绩在标准化样本的成绩分布图上所在位置。许多评定量表采用这种常模可衍化出其他形式,如T分。
(3)百分位。将得分低的排列在下,得分高的在上,计算出样本分数的各百分位范围。如P25,说明样本中25%的得分在该受评者的得分之下(或至多和他的得分一样),另有75%人数的得分比他要好。以此类推。
(4)划界分。在积极心理测评工具中,特别是某些用于特殊人群的测评工具,由于其样本常常不是正态分布,不具备制定标准分常模的条件,而多采用划界分常模。划界分是指用一具体量数,对评定结果进行划界。
除上述常模形式外,还有其他性质的常模,例如年龄常模(按年龄分组建立、在儿童和老年人量表中常用),区域常模和各种疾病诊断常模,等等。从可比性来看,常模越特异越有效;从适应性来讲,则通用常模使用更方便。
3.信度(reliability)
信度是指测验或量表的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。信度分析的常用具体方法有重测信度、复本信度、分半信度、信度系数法四种(后两种可归为内部一致性信度)。
(1)重测信度(test-retest reliabilty):同一组受测者在两次不同时间作同一套量表评定,对两次结果作相关性检验,以评估量表结果的稳定性。重测信度所考查的误差来源是时间的变化所带来的随机影响。在评估重测信度时,必须注意重测间隔的时间。重测信度的时间间隔的选择存在两难问题:缩短两次测试的时间间隔,受测者较容易回忆出测试的题目;而延长两次测试的时间间隔,则受测者较容易受外部影响而变化(风笑天,2006)。一般情况而言,重测间隔在两周到6个月之间比较合适。
(2)分半信度(split-half reliability):将一套量表的各项目按奇、偶数号分成两半,对其评定结果进行相关性检验。
(3)同质性信度(inter-item consistency):所谓同质性信度是指评定量表内部所有项目间的一致性,这里讲的是分数的一致,而不是项目内容或形式的一致。量表内各项目分数相关越高,则量表项目就越同质。另外,分半相关法也是估计同质性信度的一种方法。
(4)评定者信度(inter-rater reliability):数名不同评定者采用同一套量表对相同受评者进行评定,对所得结果进行一致性检验,以评估评定量表评分的客观性。对心理测验而言,一般都采用客观性项目,且有一套相当标准化的评分程序,因此由评分引起的误差变异是可以忽略的。而评定量表相当多的是主观项目,且评定者在评分时或多或少掺杂主观判断成分,故评定者之间的评分误差变异难以避免。一般要求在成对的受过训练的评定者之间平均相关系数达到0.9以上,才认为评分是客观的。
除以上指标外,还有正复本相关、因素信度、测量标准误等信度检验方法。
4.效度(validity)
效度即有效性,指一个测量工具能够准确测查出所要测量的变量的程度。积极心理测评工具的效度检验方法与心理测验一样,分为三类,即内容效度(content-related validation)、效标效度(criterion-related validation)和结构效度(construct-related validation)。
(1)内容效度,又称表面效度,指量表项目反映所测量内容的程度。内容效度评估方法有专家判断法、统计分析法(评分者信度、复本信度、折半信度、再测法)和经验推测法(实验检验)。
(2)效标效度,是指一个量表对处于特定情境中的个体的行为进行预测的有效性,也就是对于我们所感兴趣的行为能够预测的程度。检验实证效度一般是将量表评定结果与某一标准行为(即效标)进行相关检查。如将个体的抑郁量表与抑郁症病人的临床典型症状、诊断性量表与临床诊断进行相关分析。如果二者相关程度(或一致性程度)高,则说明效标效度理想;反之认为效标效度不理想。
(3)结构效度,又称构想效度,反映编制的量表所依据理论的程度。如编制一个心理弹性量表,必定依据有关的心理弹性理论。同时,所编制的量表是否符合原来预计的理论框架,也可用结构效度来检验。
量表的效度研究,不管是在量表编制过程中,还是编制之后都要持续地进行,并且是一项长期的、永无止境的工作。量表的效度材料越丰富,对量表的功能认识就越全面。
5.方法的标准化
积极心理测评工具必须按一定的规则实施,其记分方法和方式、分级的标准、结果的换算也要按一定的规则进行,只有这样,评定结果才具有较高的真实性。
积极心理测评工具的标准化特征,并不是每个测评工具都要像标准化测验那样应全部具备,有的量表可能多一些,标准化程度要高一些;有的可能少些,标准化程度就不那么好。至于每个具体量表做了哪些标准化工作,如常模样本、施测方法、信度和效度资料,都应尽可能详细地在使用手册上说明。
二、积极心理测评工具的选择与评价标准
借鉴Riezen和Segal(1988)提出的一整套评价量表的原则,我们认为积极心理测评工具的选择与评价标准主要包括以下几个方面。
1.量表的功效
量表的功效是指所使用的量表能够全面、清晰地反映所要评定的内容特征和真实性的程度。有的量表可评定多个方面的特质,而另一些量表则只限于评定1~2种特质。有的量表适用于所有年龄和各种类型的人群,而另一些量表可能只限于某一年龄阶段或某一特殊人群。质量好的量表应该对项目描述具体、清晰,等级划分合理,定义明确,以反映出心理行为的细微变化。出现的频度或严重程度分极最好采用3~7级划分。量表应尽可能简短,又不损失必要的细节。
2.敏感性
敏感性是指选择的量表应该对所评定的内容敏感,即能测出受评者某种特质、行为或程度上的有意义的变化。量表的敏感性既与量表的项目数量和结果表达形式(如因子分)有关,又受量表的标准化程度和信度高低影响。此外,评定者的经验和使用量表的动机也影响量表的敏感性。
3.简便性
简便性是指所选择的量表应尽量简明、省时和方便实施。然而实际上,量表简短、省时就难以做到全面。使用者不加训练和采用非标准化方法就会降低量表的信度,影响结果的可靠性。几个量表同时配合使用,能弥补单一量表这方面的缺陷。
4.可分析性
使用量表的目的就是要对测评对象的特质、行为或现象作质与量的评价。一般而言,量表应具有其比较标准,或者是常模,或者是描述性标准。量表中单项分、因子分及总分都是常用分析指标,总分常反映受评者总的情况和变化;而单项分、因子分则是分析这些方面变化的主要指标。把单项分或因子分画成曲线或构成廓图,受评者的某方面心理特质、行为特征或社会背景情况等特点会更直观、清晰。
参考文献
1.汪向东,王希林,马弘,1999.心理卫生评定量表手册(增订版)[J].中国心理卫生杂志社.
2.风笑天,2006.社会研究方法(第一版).北京:高等教育出版社.
3. Riezen H. V. & Segal M, 1988. Comparative Evaluation of Rating Scales for Clinical Psychopharmacology[M]. Elsevier.