第2章 实验设计与准实验设计
2.1 复习笔记
一、实验设计
实验设计可以看做是安排实验各种条件的方法,实验设计的目的在于消除或减少误差以便达到实验的目的,即确定某些变量、找出事件的原因。
(一)实验设计类型
1.随机组设计
(1)随机组设计的程序
随机组设计(random groups design)属于组间设计,它把被试分为两组,随机组1和随机组2,其程序如表2-1所示:
表2-1随机组设计
(2)随机组设计的逻辑
①没有施加处理的随机组2通常叫做控制组,它代表着一种参考水平来决定实验处理是否有效。
②这种设计的前提是实验组与控制组在测验前各方面都一样,这样,如果两组在测验上有差别,逻辑上就可以归结为是实验处理造成的。
(3)扩展的随机组设计
在实践中要随机挑选两个等组并不容易,因此,在应用随机组设计时一方面要尽可能做到随机挑选被试,另一方面还可以应用如下扩展了的随机组设计:
随机组1:无处理→测验
随机组2:x数量的处理→测验
随机组3:2x数量的处理→测验
随机组4:3x数量的处理→测验
随机组5:4x数量的处理→测验
其中的x,2x,3x等代表自变量的不同水平,并不一定是整倍数的关系。
2.组内设计
(1)组内设计的程序
组内设计(within-groups design)又称重复测量设计,其基本思想是一个被试或一组被试按一种顺序完成各实验条件,而另一个被试或另一组被试在另一种顺序中进行实验,而且,被试必须随机地分配到不同的顺序上。
(2)组内设计的优缺点
①优点
a.组内设计中每一被试都以自己为对照条件。
b.组内设计比随机组设计对统计检验更为敏感。由于同一被试在几种实验任务中,或在同种任务的重复测量中的结果倾向于高度相关,因此显著性检验的标准差值就减少了,从而易于检测出较小的效应。
c.组内设计不需要事先对被试进行测验以在某一特点上平衡被试。
②缺点
一种实验条件下的操作将会影响另一种实验条件下的操作。因为组内设计的实验中每一被试轮流在各种实验条件下进行实验,因此会使自变量与“练习”或“疲劳”的因素混淆起来。
(3)消除缺点的方法
①随机地排出各实验条件下的顺序;
②采用抵消平衡的方法。抵消平衡被试接受实验条件(自变量)的顺序,使每种实验条件以各种顺序出现的机会相同,以达到平衡由重复测量所产生的无关变量对因变量的混淆作用。
(4)实验设计对因变量的影响
实验设计已成为影响因变量的自变量之一。例如,Challis和Brodbeck(1992)认为,实验设计是影响补笔测验中加工水平效应的一个重要因素,因而系统地进行了实验。结果表明,组内设计不存在加工水平效应,但随机组设计与组内设计存在加工水平效应。
3.随机区组设计
(1)随机区组设计的程序
随机区组设计(randomized-block design)要求首先对被试作测验,然后按成绩分组,再把实验条件随机分配给各组中的被试。
(2)随机区组设计的优缺点
①优点
a.随机区组设计中的每个被试只在一种实验条件下进行实验,因而避免了不同实验条件顺序的影响,因此,它具有组间设计的优点。
b.随机区组设计要求在一个区组中的被试在某一特点上是类似的,这样,对各个实验条件来说,被试基本上是类似的,这一点类似于组内设计,因此它又具有组内设计的优点。
②缺点
a.这种设计的价值依赖于实验前的预测验对正式实验的预测性,预测性愈高价值愈大。
b.这种设计的有效性还取决于实验条件的多少。3~4种实验条件采用随机区组设计比较恰当。
4.拉丁方设计
(1)拉丁方设计的程序
拉丁方设计(Latin Square design)的要求是,每种条件在横行的顺序中只出现一次,在纵列中也只出现一次。
(2)拉丁方设计的优点
使用了完善的抵消顺序效应的措施,因而同时能测量多种变量。
(3)安排拉丁方的方法
①当n为偶数
a.假设自变量有n个水平,那么,实验的第一种顺序就是:
1,2, n,3, n-1,4, n-2,5, n-3…
在这里,l代表第一种水平,依此类推。第二种顺序是依次在第一种顺序上加l,第三种顺序是依次在第二种顺序上加1,等等。而且,各顺序中遇到n时,改为1。
b.当n=4时,拉丁方的安排如下:
②当n为奇数
a.采用平衡方块设计(balanced square design),需要使用两个方阵,第二个方阵与第一个方阵正好相反。一般说来,第一个方阵是按偶数个变量水平时构建方阵的方法建起来的。
b.设A, B, C为三种实验条件,有关的平衡方块如下:
(二)交互作用:多于一个自变量的实验
1.多因素实验的优点
(1)做一项有三个自变量的实验比分别做三个实验的效率要高。
(2)做一项实验比分别做三项实验易于保持控制变量恒定。
(3)多因素实验能够得到交互作用,这样的的实验结果比从几个单独实验所概括的结果更有价值,更接近生活实际。
2.实验研究
(1)两因素实验
①实验程序
在某大学校园的咖啡店里,主试看到小桌子或是大桌子旁边坐着一个学生时,请求坐下并点来一份午饭。不久,主试离开桌子去买杯饮料。这时,假招待员(实验助手)把午饭扫走。当主试回来时,试图向这个学生借钱再买一份午饭。有时候,午饭不是由假招待员扫走,而是主试假装不小心弄掉在地上,然后向学生借钱。
②实验变量
a.自变量:桌子(大或小);处理午饭方式(扫走或掉地)。
b.因变量:被试愿意借多少钱给一位陌生人。
③实验结果
坐在大桌子边上的学生对午饭被扫走或是掉地都只愿意借出少量的钱;坐在小桌子边上的学生愿意借出较多的钱来帮助午饭被扫走的人。这个结果表现出了交互作用。
④交互作用(interaction)
一项实验中有两个或两个以上自变量,当一个自变量的效果在另外一个自变量的每一水平上不一样时,我们就说存在着交互作用。
(2)单因素实验
假设这项实验是两项单独的实验。
①第一项实验中,只有桌子的大小是唯一的自变量,而午饭总是被扫走。那么实验结果将会表明,坐在小桌子边上的人会借出较多的钱。但是从这个实验结果,研究者不能发现,要是午饭掉地,桌子的大小就不起什么作用。
②在第三项实验中,处理午饭的方法是自变量,桌子大小是控制变量。如果用大桌子做实验,不管午饭的“遭遇”怎样,人们只愿意借出大致相同数目的钱。从这个结果,研究者不能发现,如果用小桌子做实验,借钱数量是有差别的。
由此可见,分别做两个实验会丧失许多信息,而在一项实验中包括两个或多个自变量,会获得较多的信息。
(3)从这个社会心理学实验中补充三点:
①自变量至少是以两种水平存在的。
②当把实验结果作图表示时,只有一个自变量的实验,自变量用横坐标表示,因变量用纵坐标表示。如果实验包括两个以上的自变量,那么一个自变量用横坐标表示,其余自变量画在图上,因变量用纵坐标表示。
③交互作用反映在图中,表现为图中的线是交叉的。如果图中的线是平行的,就说明该实验不存在交互作用。
(三)因素设计及其数据处理
1.因素设计
(1)因素设计的定义
①因素设计(factorial design)是关于两个或多个变量(因素)的一种实验设计,它的特点是将实验中每一变量的各个水平都结合起来进行实验。
②因素设计的最简单形式就是实验中有两个自变量(因素),每个自变量各有两种水平,这就是2×2因素设计。
③不同因素按水平形成的各种组合叫做处理。各种处理的总数是各因素所包括的水平数的乘积。
(2)因素设计的因素数量
因素设计一般使用两个或三个因素,每个因素有2~6种水平,因素过多或水平过多都将使实验变得十分复杂而难以进行,并且即使进行实验,其结果也很难解释。
(3)因素设计的方式
①组间设计
对于2×2因素设计,有4种处理,如果每种处理使用8名被试,则可以采用像表2-2这样的分配方式。
表2-2 2×2因素设计(组间设计)
②组内设计
对于2×2因素设计,每个被试都需要进行四次实验。设J代表A1B1的实验条件,K代表A2B1, L代表A1B2, M代表A2B2,那么,可用拉丁方的方法排列实验顺序如下:
表2-3 2×2因素设计(组内设计)
可以看到,组内设计大大节省了被试数量。
③混合设计
对于2×2因素设计,设变量A用组内设计安排,变量B用组间设计安排,则可以采取表2-4这样的分配方式。
表2-4 2×2因素设计(混合设计)
2.因素设计的数据处理
(1)2×2因素设计(组间设计)的方差分析
①互助行为实验
a.自变量:需要借笔记的原因(缺乏记笔记的能力,没有用心听讲);需要借笔记的频率(经常需要借,偶尔需要借)。
b.因变量:助人行为频率。
c.实验按2×2因素设计(组间设计)进行,假设获得的数据经整理后如表2-5所示:
表2-5 数据的重组
②方差分析的公式
表2-6是进行方差分析计算的有关项目与公式,假设各小组的方差没有显著性差异。
表2-6 方差分析的项目与公式(组间设计)
I=2, J=2, K=10(表2.5中,每单元10个数据)
N=40(总共40个数据),
③方差分析的结果
把表2-5中的数据分别代人表2-6中各项目的公式,计算结果如表2-7。
F值的显著性水平表明:I间差别即频率的两种水平对互助行为的影响是有显著差异的;J间差别即原因的两种水平对互助行为的影响也是有显著差异的。在频率与原因之间不存在交互作用。
表2-7 方差分析组间设计的2×2的因素设计
(2)2×2因素设计(混合设计)的方差分析
①心境对学习影响的实验
a.自变量:心境(高兴,不快);故事情节(高兴,不快)。
b.自变量:对故事情节的回忆效果。
c.实验按2×2因素设计(混合设计)进行,心境是组间因素,故事情节是组内因素。假设获得的数据经整理后如表2-8所示:
表2-8 数据的重组
注:I=2, J=2, K=5, N=20(总共20个数据)。
②方差分析的公式
表2-9 方差分析的项目与公式(混合设计)
③方差分析的结果
把表2-8中的数据分别代入表2-9中各项目的公式,将计算结果列表如下:
表2-10 方差分析(混合设计的2×2因素设计)
F值的显著性水平表明:
a.不同心境之间(对高兴情节)的回忆差异显著,说明被试高兴时对高兴情节的记忆远远超过被试不快时对高兴情节的回忆。
b.不同心境间(对不快情节)的回忆差异显著,说明被试不快时对不快情节的记忆远远超过被试高兴时对不快情节的记忆。
c.不同情节之间(对高兴心境):被试高兴时对高兴情节的记忆显著好于对不快情节的记忆。
d.不同事件之间(对不快心境):被试不快时对不快情节的记忆显著好于对高兴情节的记忆。
e.情节和心境存在交互作用,被试的心境对记忆的影响依赖于要回忆的情节的性质。
(四)被试样本的大小
在单个实验中选用的被试样本大小可参考以下几种因素作决定。
1.某研究领域传统上使用多少被试。
2.计划使用什么样的统计分析。
3.如果预期在实验中变异会较大,或者认为将要发现的差别有特别重要的意义,就需要多一些被试。
4.在脑成像(fMRI)研究中,Firstone(1999)认为,7~12个被试的结果,宜用Conjunction analyses方法处理,而12~30个左右被试的结果,宜用Random-effect analyses方法处理。
(五)使用一个被试的实验
1.只使用一个被试的实验也是有意义的。有时候罕见的现象出现在一个人身上,对这些个案的详尽研究会给基本心理过程提供扎实可靠的资料。
2.1996年Klein通过对一名女大学生W.J.的个案研究得出结论:一个人的情景记忆与一个自我的人格表征是分离的。这样,单个被试的实验研究得出了关于人类的普遍的结论。
二、准实验设计和效度
(一)准实验设计
1.准实验设计的定义
在现场进行的实验研究中,被试不可能随机地分配到实验条件中,被试以非随机方式分配到实验处理上的设计,称为准实验设计(quasi-experimental design)。
2.准实验设计的分类
(1)不等组比较设计
①不等组比较设计(nonequivalent comparison—group design或selection cohort design)对两个或更多自然形成的被试组进行研究。
②这种设计最简单的例子是,对一个组经过实验处理以后测量它的因变量,然后与一个对照组的因变量相比较(黄一宁,1998;董奇,2004)。
(2)间歇时间序列设计
①间歇时间序列设计(interrupted time-eries design)是在实施实验处理前后的一段时间里对某种效应进行多次重复测验。
②由于这种设计缺乏控制组,所以无法剔除无关因素的干扰作用。为了克服这一弱点,可采用复合间歇时间系列设计,即在研究设计中增加一个没有接受实验处理的比较组,来替代控制组的部分功能(黄一宁,1998)。
这种设计的模式如下:
(3)交叉滞后组相关设计
①交叉滞后组相关设计(cross-lagged panel corelational design)要求在时间1对两个变量的关系作出测定和相关分析,再在时间2作相似测定和分析,求得同步相关rA1B1和rA2B2(见图2—10),rA1A2和rB1B2为稳定性相关,它们实际上是重测信度。
图2-10 交叉滞后组相关设计
②在同步相关稳定的情况下,如果rA1B2>rB1A2,可以认为,与B引起A相比较A是B的更强的原因;反之,B是A的更强的原因(王重呜,1990)。
③Eron等人应用交叉滞后组相关设计开展观看暴力电视节目是否导致犯罪行为的追踪研究(Eron, et al., 1972)。一个典型结果如图2-11所示。
图2-11 观察暴力电视与犯罪行为的追踪研究(Eron et al.,1972)
结果表明:喜欢看电视暴力的9岁男孩与其19岁时的攻击行为密切相关。
(二)效度问题
1.效度概述
(1)内部效度
在自变量与因变量之间证明有因果关系的联系,而且对实验结果的其它可能的解释均可排除,在这样的情况下这个实验被称为具有内部效度。
(2)外部效度
如果一个实验的结果可以推广、概括到其他的被试和其它的场合,那么,我们说它具有外部效度。
2.Anderson对效度的分类
Anderson(2001)认为效度包括过程效度(process validity)与结果效度(outcome validity)的区分,以及这两种效度的内部水平(internal level)和外部水平(external evel)的相互关系。
(1)过程效度与结果效度
①结果效度是应用研究的目标,关注的是行为变化本身。应用领域的研究者想要把在某一特定情景下获得的结果推广到更一般的场合。
②过程效度是基础研究的目标,关注的是表面结果背后的基本心理过程,通常是研究极为基本的心理过程以便概括为普遍规律。
③结果效度与过程效度各有两个水平:内部水平与外部水平。内部水平指研究在某具体情景设置下的有效性,外部水平指超出该具体设置的概括化。内部效度是外部效度的必要条件。
④内部结果效度(internal outcome validity)的评估始于统计显著性检验,达到统计显著性水平意味着特定设置下的研究结果是有效的;但外部结果效度(external outcome validity)的评估要求超越统计的推论。
⑤内部过程效度(internal process validity)与外部过程效度(external process validity)的评估都依赖超越统计的推论,这是因为过程效度本质上不是数据、事实本身,而在概念。
(2)过程效度与结果效度的不一致
①过程效度与结果效度这两个目标是不一致的,不可能两者兼得。
②为了追求结果效度,特定的情景设置需要接近真实生活,这样,得到研究结果才容易推广,外部结果效度才会好。
③追求过程效度要求使研究情景尽量简化、明确,以便排除其它心理过程造成的混淆。
2.2 课后习题详解
1.写出一项实验室研究的实验设计。
答:(1)实验目的
研究内隐自尊对不同任务类型自我妨碍的影响。
(2)实验假设
内隐自尊的主效应显著,高内隐自尊的练习次数显著多于低内隐自尊的练习次数;任务类型主效应显著,数理逻辑任务的练习次数显著多于言语理解任务的练习次数。内隐自尊与任务类型交互作用显著。进一步的简单效应检验结果表明,高内隐自尊在不同任务性质中自我妨碍无显著性差异,但是低内隐自尊水平在不同任务性质中自我妨碍的差异显著,内隐自尊水平越低,在言语理解类任务中出现越多的自我妨碍
(3)实验程序
实验采用2×2两因素混合设计,其中自变量A作为被试间变量,自变量B作为被试内变量。自变量A是内隐自尊,有两种水平:高内隐自尊、低内隐自尊。自变量B是任务类型,有两种水平:数理逻辑任务、言语理解任务。因变量是被试的自我妨碍水平,即被试在正式测试前练习的次数。研究首先从某大学中随机抽取40名大学生,通过内隐联想测验(Implicit Association Test,简称IAT)测试成绩,将被试分为高内隐自尊、低内隐自尊两组,各20人,然后每组都接受第二个自变量的数理逻辑任务、言语理解任务两种处理,不同任务类型的顺序在被试间平衡处理,实验顺序安排如表1所示。
表1 内隐自尊对不同任务类型自我妨碍影响的实验设计
(4)数据分析
首先对数据进行初步整理,得出每组被试的平均分和标准差。然后进行2×2重复测量结合非重复测量的方差分析
2.写出一项现场研究的准实验设计。
答:略。
3.举例说明交互作用的概念。
答:(1)交互作用的概念
一项实验中有两个或两个以上自变量,当一个自变量的效果在另外一个自变量的每一水平上不一样时,我们就说存在着(自变量的)交互作用。
(1)交互作用的研究案例
①实验程序
在某大学校园的咖啡店里,当主试看到小桌子(只供2个人用)或是大桌子(只供4人用)旁边坐着一个学生时,就有礼貌地询问能不能坐下,得到允许坐下后,主试点来一份午饭。不久,主试离开桌子去买杯饮料。
这时,一位装束同咖啡店招待员一样的主试的同伙来到桌边,问这个学生,留在桌上的午饭是否是他(她)的,就在学生解释吃午饭的人很快就会回来以前,假招待员已经把午饭扫走,扔进垃圾桶内。
当主试回来时,看见午饭没有了,就试图向这个学生借钱再买一份午饭。有时候,午饭不是由假招待员扫走,而是主试假装不小心弄掉在地上,然后向学生借钱。这样,这个实验的因变量就是,学生即被试愿意借多少钱给一位陌生人(主试)。
由上述实验情节可以想见,影响借钱数量的因素有两个。第一,学生所在桌子大小。第二,处理午饭的方式:午饭是被别人扫走还是自己弄掉的。
②实验结果
愿意借出较多的钱来帮助午饭被扫走的人只是坐在小桌子边上的学生;坐在大桌子边上的人对午饭被扫走或是掉地一视同仁,都只愿意借出少量的钱。
③交互作用的体现
处理午饭方式这一自变量的效果在另一自变量的不同水平上(桌子大或小)不一样。当午饭被扫走,桌子大小导致借钱数目不同。如果午饭掉地,桌子的大小就无关紧要。这就是自变量的交互作用。
4.举例说明什么是过程效度?什么是结果效度?内部效度与外部效度的关系?
答:(1)过程效度
过程效度是基础研究的目标,关注的是表面结果背后的基本心理过程,通常是研究极为基本的心理过程以便概括为普遍规律。例如,基于空间的注意或基于物体的注意的实验范式,分别对“空间”或“物体”作了严格的、清晰的规定。
(2)结果效度
结果效度是应用研究的目标,关注的是行为变化本身。例如,在预防交通事故的研究中,事故频率是关注的焦点。在学前教育的研究中,词汇量与社交技巧是关注的焦点;应用领域的研究者想要把在某一特定情景下获得的结果推广到更一般的场合。
(3)内部效度与外部效度的关系
结果效度与过程效度各有两个水平:内部水平与外部水平。内部水平指研究在某具体情景设置下的有效性,外部水平指超出该具体设置的概括化。
内部结果效度的评估始于统计显著性检验,达到统计显著性水平意味着特定设置下的研究结果是有效的,而不是随机产生的;但外部结果效度的评估要求超越统计的推论,例如,当把动物实验的结果推广到人类时,这一点是不言而喻的。
内部过程效度与外部过程效度的评估都依赖超越统计的推论,这是因为过程效度本质上不是数据、事实本身,而在概念。
5.用2×2因素设计(组间设计)设计一个实验,并写出该实验的实验程序(流程)。
答:(1)实验目的
研究正常阅读和快速条件下文章标记对文章主题通达的影响。
(2)实验假设
阅读速度和文章标记的主效应都显著,正常阅读比快速阅读更能促进主题信息的通达;文章有标记比无标记能更好地促进主题信息的通达。
(3)实验程序
实验采用2×2两因素组间设计。自变量A是阅读速度,有两个水平:正常阅读、快速阅读;自变量B是文章标记,也有两个水平:有标记、无标记。这样总共有四种实验处理:正常阅读有标记(A1B1)、正常阅读无标记(A1B2)、快速阅读有标记(A2B1)、快速阅读无标记(A2B2)。本研究的因变量是文章主题通达的成绩。首先从某普通中学高一学生中随机选取120名被试,随机分成四组,每组随机指定接受四种实验处理中的一种。
(3)数据分析
对原始数据进行整理,得出每种条件下被试因变量反应的平均分和标准差,然后进行2×2非重复测量方差分析。
6.利用表2-15的数据,写出方差分析的项目与公式并进行计算。
答:(1)方差分析的项目与公式为:
表2-16 方差分析的项目与公式(组间设计)
(2)将表2-15的数据整理得:
表2-17 数据的重组
(3)计算过程如下:
I=2, J=2, K=10(表2.15中,每单元10个数据)
N=40(总共40个数据),
把表2-17中的数据分别代人表2-16中各项目的公式:
①I之间自由度:I-1=2-1=1
I间和方:
I间均方:
I间F:
②J之间自由度:J-1=2-1=1
J间和方:
J间均方:
J间F:
③交互作用(I×J)自由度:(I-1)(J-1)=(2-1)(2-1)=1
I×J 的和方:
④误差自由度:U(K-1)=2×2×(10-1)=36
误差和方:
(即所有原始数据的平方和)-=494.6-487.64=7.2
误差均方:
⑤总计自由度:IJK-1=N-1=40-1=39
总合计方:
7.参考表2-2与表2-3,讨论Craik(1994)实验的优点。
答:参见本章复习笔记。
2.3 典型题(含考研真题)详解
一、单项选择题
1.在探讨性别与被试年龄(青年、中年、老年)对某品牌手机偏好影响的研究中,其实验设计为( )。[统考2014研]
A.2×3设计
B.1×3设计
C.2×2设计
D.3×3设计
【答案】A
【解析】该实验使用性别2(男,女)×年龄3(青年,中年,老年)设计。
2.下表所示为一个有四种实验处理的设计方案。该研究设计属于( )。[统考2014研]
A.匹配设计
B.ABBA设计
C.拉丁方设计
D.混合设计
【答案】C
【解析】拉丁方以表格的形式被概念化,其中行和列代表两个外部变量中的区组,然后将自变量的级别分配到表中各单元中。简单的说就是某一变量在其所处的任意行或任意列中,只出现一次。
3.在某研究设计中,用方便分组的方式,将被试分为一个实验组和一个控制组,对两组均进行了一次前测和后测。该设计是( )。[统考2014研]
A.交叉滞后设计
B.时间序列设计
C.相等时间样本设计
D.不相等对照组设计
【答案】D
【解析】不相等对照组设计的实验模式是具有一个实验组和一个控制组,对两组被试均进行前测和后测验,以便于对照比较。
4.有研究发现,正常被试和遗忘症患者自由回忆的正确率之间存在显著差异,但XX辨认之间不存在显著差异。据此可知实验存在( )。[统考2014研]
A.期望效应
B.练习效应
C.习惯效应
D.交互效应
【答案】D
【解析】交互作用指自变量之间的相互关系,即当一个自变量产生的效果在第二个自变量的每一水平上不一样时,就发生交互作用。A项,期望效应指被试的表现因为逐渐熟悉实验情境而有系统地提升。B项,习惯效应指被试的表现因为连续作业的疲劳而系统地下降。C项,习惯误差是指由于被试在长序列中有继续作同一种判断的倾向所引起的误差。
5.下列选项中,属于准实验设计的是( )。[统考2014研]
A.匹配组设计
B.被试间设计
C.被试内设计
D.交叉滞后组相关设计
【答案】D
【解析】准实验设计指未对自变量实施充分控制,但使用真正实验的某些方法搜集、整理以及统计分析数据的研究方法,交叉滞后组相关设计属于准实验设计。B项,被试间设计是指要求每个被试(组)只接受一个自变量水平的处理,对另一被试(组)进行另一种自变量水平处理的情况。C项,被试内设计是指每一个被试都接受自变量的所有水平处理的情况。
根据下列材料,回答6~8题。
为考察词的类型(靶子词、非靶子词)以及辨别条件(高辨别、低辨别)对双耳追随效果的影响,研究者将60名被试随机分为两组,每组30名,一组既接受靶子词-高辨别条件的处理,也接受靶子词-低辨别条件的处理;另一组既接受非靶子词-高辨别条件的处理,也接受非靶子词-低辨别条件的处理。
6.该实验设计是( )。[统考2013研]
A.被试间设计
B.被试内设计
C.混合设计
D.回归间断点设计
【答案】C
【解析】实验中两组不同被试接受两种类型的词(靶子词和非靶子词)的处理,是被试间设计(组间设计);所有被试接受两种不同辨别条件(高、低水平)的处理,属于被试内设计(组内设计)。在案例实验中既用组内设计又用组间设计叫做混合设计。
7.该实验中的辨别条件属于( )。[统考2013研]
A.被试间变量
B.被试内变量
C.额外变量
D.无关变量
【答案】B
【解析】实验中所有被试都接受两种不同辨别条件(高、低水平)的处理,属于被试内变量。
8.该实验存在的交互作用是( )。[统考2013研]
A.词的类型×辨别条件
B.靶子词×非靶子词
C.高辨别条件×低辨别条件
D.词的类型×辨别条件×追随效应
【答案】A
【解析】交互作用指的是两个因素在对方的不同水平上呈现出的效应存在差异,本实验研究为词的类型×辨别条件。
9.在实验研究中,排除法可用来控制额外变量,但也可能导致研究效度的降低。它可能降低的效度是( )。[统考2013研]
A.内部效度
B.外部效度
C.构思效度
D.统计结论效度
【答案】B
【解析】外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。而实验情景的过分人工化会使实验结果难以推广到其他现实情境中。
10.考察7、8、9岁三个年龄但女生对4种不同材料学习效果,其实验处理有( )。[统考2012研]
A.3种
B.4种
C.7种
D.12种
【答案】D
【解析】实验处理的自变量是年龄与材料,其中年龄为被试间变量,共3个水平,为7岁、8岁、9岁;材料为被试内变量,共4个水平。所以实验处理为3(三个年龄)x4(四种不同材料)=12种。
11.当实验出现了“霍桑效应”时,为了改进实验,后续研究应采取( )。[统考2012研]
A.双盲法
B.消除法
C.平衡法
D.对抗法
【答案】A
【解析】霍桑效应是指当被观察者知道自己成为被观察对象而改变行为倾向的反应。在心理学实验中,有效消除主试被试间不恰当的相互作用,保证实验内部效度的通用手段是双盲实验法。
12.一个实验有3组被试,方差分析的组内自由度为27,则该实验的被试总数为( )。[统考2011研]
A.24
B.28
C.30
D.81
【答案】C
【解析】根据已知条件,方差分析中,组别k=3,组内自由度df=k(n-1)=3*(n-1)=27,小组人数n=10,总人数N=3*10=30
13.在实验研究中,衡量自变量和因变量之间关系明确程度的指标是( )。[统考2009研]
A.统计结论效度
B.外部效度
C.构思效度
D.内部效度
【答案】D
【解析】内部效度是指因变量确实是由自变量所引起的,而不是由其他因素所导致的。是衡量自变量和因变量之间关系明确程度的指标。实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度。统计结论效度是对数据分析处理程序的效度检验,构思效度是指心理测验对某一理论概念或特质测量的程度。
14.在探讨人类对不同语义范畴类别(动物、工具)、不同危险性概念(高危险、低危险)进行加工是否存在差异的一项研究中,其实验设计应是( )。[统考2009研]
A.二因素设计
B.四因素设计
C.二水平设计
D.四水平设计
【答案】A
【解析】该研究设计中有两个自变量(语义范畴类别和危险性概念),因此属于二因素的实验设计。
根据下表所示的实验设计方案(A、B为两个自变量,S为被试),回答15~17题。
15.这种设计是( )。[统考2009研]
A.ABBA设计
B.被试间设计
C.被试内设计
D.混合设计
【答案】D
【解析】该设计中不同的被试分别接受A因素的两个水平的处理,属于被试间设计,而每个被试都接受B因素三个水平的处理,属于被试内设计,因此该设计方案是混合设计。
16.该实验设计方案中的实验处理数为( )。[统考2009研]
A.3
B.4
C.5
D.6
【答案】D
【解析】A因素有两个水平,B因素有三个水平,结合起来组成6个实验处理。
17.若该设计的交互作用显著,则应进一步做的统计分析为( )。[统考2009研]
A.主效应检验
B.相关分析
C.简单主效应检验
D.回归分析
【答案】C
【解析】在多因素的方差分析统计中,如果交互作用显著,则需要进一步进行简单效应分析。
18.在一项研究情绪的实验中,要求A组被试在前后两次情绪测试之间观看恐怖电影,要求B组被试在前后两次情绪测试之间休息,则A组被试通常被看做是( )。[统考2008研]
A.后测控制组设计的控制组
B.后测控制组设计的实验组
C.前测—后测控制组设计的实验组
D.前测—后测控制组设计的控制组
【答案】C
【解析】这一实验是考察观看恐怖电影对个体情绪的影响,A组为实验组,B组为控制组。A组、B组均进行了两次情绪测验,因此,属于前测—后测控制组设计。这种实验设计中,实验组在接受实验处理前接受了一次前测,为分析实验处理的效应,提供了基线水平,同时设立了不接受实验处理的控制组,一定程度上控制了历史、成熟和统计回归等无关因素。
19.在一个3×3的实验设计中,存在的交互作用有( )。[统考2008研]
A.1个
B.3个
C.6个
D.9个
【答案】A
【解析】3×3实验设计表示实验中共有两个因素,每个因素有三个水平,共有9种实验处理,在多因素实验中,交互作用的个数=2n-n-1,其中n为实验所包含的因素数,因此,这个实验设计中存在的交互作用为22-2-1=1个。
根据下述材料,回答8~10题。
国外某一实验探讨了青年与老年被试阅读自然科学类与社会科学类文章的阅读速度是否存在差异,结果表明:阅读速度受材料类型和年龄因素的影响,青年被试阅读自然科学类文章的速度较快,老年被试阅读社会科学类文章的速度较快。
20.该实验设计是一个( )。[统考2008研]
A.二因素设计
B.四因素设计
C.二水平设计
D.四水平设计
【答案】A
【解析】这个实验设计中,共包含两个自变量:年龄、材料类型,因此,属于二因素设计。
21.如采用被试内设计,最容易产生的效应是( )。[统考2008研]
A.霍桑效应
B.实验者效应
C.练习效应
D.安慰剂效应
【答案】C
【解析】被试内设计的特点是每一个被试都接受所有的实验处理,因此,最容易产生练习效应。
22.能够推断出“青年被试阅读自然科学类文章的速度较快,老年被试阅读社会科学类文章的速度较快”这一结论的统计依据是( )。[统考2008研]
A.材料类型和年龄的主效应均显著
B.材料类型和年龄的交互作用显著
C.材料类型和年龄的交互作用不显著
D.材料类型、年龄和阅读速度的交互作用显著
【答案】B
【解析】“青年被试阅读自然科学类文章的速度较快,老年被试阅读社会科学类文章的速度较快”,表明材料类型和年龄的交互作用显著,年龄对阅读速度的影响依赖于材料类型。
23.在一个2×2的完全随机设计中,若每种处理使用6名被试,整个实验设计需使用的被试数是( )。[统考2007研]
A.6
B.12
C.18
D.24
【答案】D
【解析】完全随机设计指的是每一个被试只参与一种实验处理。本题为2×2的完全随机设计,其实验处理有4个,每种处理需要6名被试,因此整个实验设计所需被试为24名。故本题的正确答案是D。
24.在2×3的实验设计中,研究的因素有( )。[统考2007研]
A.2个
B.3个
C.5个
D.6个
【答案】A
【解析】2×3代表的是本实验设计中有两个因素,其中第一个因素有两个水平,第二个因素有3个水平,整个实验有6种实验处理。故本题的正确答案是A。
25.如果不同的实验条件之间有相互干扰,最好采用( )。
A.组内设计
B.组间设计
C.拉丁方设计
D.混合设计
【答案】B
【解析】组间设计的特点是每一个被试只接受自变量的一个水平,因此,不会受到不同实验条件之间的相互干扰。而组内设计由于每一个被试接受自变量的所有水平,因此,会受到不同实验条件之间的相互干扰。
26.随着时间的流逝,被试内部结构发生改变,而影响了实验结果的真实性。这是指( )。
A.历史
B.选择
C.成熟
D.亡失
【答案】C
【解析】随着时间流逝,被试内部结构发生的变化属于成熟因素对实验结果的影响。选择指由于被试的选择的偏差所导致的对实验结果的影响,历史是指在实验过程中,与实验变量同时发生的事件对实验结果的影响。亡失是指在较长时间的实验周期中,由于被试退出实验或死亡对实验结果造成的影响,在发展心理学的纵向研究中经常发生被试的亡失。
二、多项选择题
1.所罗门四组设计的特点有( )。[统考2012研]
A.可检验前测验处理的效应
B.将“有无前测程序”这一变量引入实验设计中
C.可采用被试内设计的方差分析检验所有主效应
D.可检验“前—后测效应”与“实验处理”之间是否有交互作用
【答案】ABD
【解析】所罗门四组实验设计也叫“重叠实验设计”,是把后测设计和前测后测设计结合起来的一种实验设计,分别有两个实验组和两个控制组。除了具有单因素完全随机后测设计、单因素完全随机前测后测设计的优点外,所罗门四组实验设计对实验处理的效果进行了两次检验,既可以确认实验处理的效果,还可以检验测验与实验处理的交互作用。
2.平衡技术是控制额外变量的方法之一。常用的平衡技术有( )。[统考2008研]
A.匹配法
B.拉丁方设计
C.双盲法
D.ABBA法
【答案】BD
3.多自变量实验是指在一个实验中包含两个或两个以上的自变量的实验,它之所以被广泛采用,是因为它具有哪些优点( )。
A.效率高
B.实验控制较好
C.实验操作更简易
D.可以获得交互作用
【答案】AD
4.评价实验设计的标准是( )。
A.能够恰当地解决所欲解决的问题
B.恰当地控制实验中的无关变量
C.使实验结果有很高的可靠性(又称效度)
D.实验所用的仪器先进
【答案】ABC
5.在大多数实验室实验中,都会将灯光、噪音等作为( )。
A.自变量
B.因变量
C.额外变量
D.控制变量
【答案】CD
【解析】在大多数实验室实验中,灯光、噪音、温度等环境变量,通常作为控制变量和额外变量在实验中保持恒定。
6.多因素设计的主要特点是( )。
A.可以观察因素之间的相互作用
B.揭示不同因素之间的内在联系
C.获得更生态化的实验结果
D.实验设计与实施相对复杂
【答案】ABCD
三、简答题
1.简述心理实验过程的主要流程。[统考2014研]
答:心理实验过程的流程主要有:
(1)课题选择与文献查阅;
(2)提出问题与研究假设;
(3)实验设计与实施;
(4)数据处理与统计分析;
(5)研究报告的撰写。
2.某研究者假设:海马与复杂思维加工有关,与简单思维加工无关。该研究者随机选出20只白鼠平均分成两组,切除它们的海马,让第一组学习简单迷宫,第二组学习复杂迷宫。第一组经过10次学习就出现完全正确的情况,第二组在学习30次后才出现完全正确的情况。研究者据此认为最初的假设成立。请找出该设计中存在的问题,并完善原有的实验设计。[统考2007研]
答:(1)该设计中存在问题。任何白鼠学习复杂迷宫所需要的次数都要比学习简单迷宫多,实验结果可能与是否切除海马无关,用不切除海马的白鼠为被试可能会得到相同的结果。原设计使用了两个独立变量:任务难度和有、无海马,但只改变了其中—个独立变量,只说明了任务难度对学习的影响。要研究海马对思维加工的影响,应将海马体情况作为自变量,包括海马体完好和切除两个水平。
(2)完善的方案。加入海马完整的白鼠作为控制组,成为2×2实验设计:一个因素是海马情况,包括完好和切除两个水平,另一因素是迷宫的难度,包括简单和复杂两个水平。如下表:
研究海马情况和任务难度的交互作用,以及海马因素在简单任务和复杂任务两个水平上的单纯主效应。如果海马单纯主效应在简单任务水平上不显著而在复杂任务水平上显著,则能说明海马与复杂思维加工有关,与简单思维加工无关。
3.在准实验研究中可以得到因果关系的结论吗?为什么?举例说明。
答:(1)在准实验研究中不能得到因果关系的结论。
(2)在准实验研究中不能得到因果关系结论的原因。
①准实验设计中,只能选择某个特征(自变量)不同的被试,然后将这些在该自变量不同水平的被试行为加以比较。典型的准实验常用被试变量作为自变量,因为对于大多数天生的被试变量(年龄、性别、种族、种群)、社会引起的被试属性(社会阶层、宗教或居住区)、疾病以及与疾病有关的被试因素(肢体残缺、智力残疾、脑外伤、灾难后果)而言,只能选择而不是改变。
②但是,只是选择了在这个被试变量上有差异的被试,很难保证他们在其他相关变量上是相等的。即准实验中实验者的自由度是比较小的,对额外变量的控制也是较弱的。这使得被试变量的效用会和无法排除的额外变量的效用相混淆。因此,通过准实验得到的结果便不能像真正的实验结果那样可以安全地、毫无闪失地归因于自变量,而所得出的只能是自变量和结果变量之间的相关。
因此,在准实验研究中,可以认为变量之间是相关的,但不能认为一个变量的变化导致或引起了另一变量的变化。即准实验本质上是一种相关研究。严密控制、逻辑精巧的实验研究是获得因果关系的惟一有效途径。
(3)在教育改革过程中对新教材、新教法的试用过程,以及在医学的疗效评估中,经常使用的不等组前后测设计就是典型的准实验设计。举例如下:
①例如,研究者想研究不同的教材处理方法对学生学习成绩的影响。实验前,选择的教学班是两个现成班级,不可能因为实验而将两个班拆散后再随机分组,所以研究者只能随机将其中一个班作为实验组,另一个班作为控制组。依照准实验设计的模式,前测成绩是两个班(实验组和控制组)的小学升入初中的考试成绩和他们第一学期的期末考试成绩,这两个成绩作为两个班开始比较的基础。实验组实行的处理是对教材逻辑顺序的调整和增加教学过程的启发性,控制组使用传统的教学内容编排及教法。后测成绩来源于对两班学生实施的同一测验的测验分数。这就构成了一个不等组前测后测设计的准实验研究。
②再例如,某医疗研究机构研制了一种治疗儿童多动症的药物,为了试验此种药物是否真的有效,研究人员筛选了20名多动症儿童参加试验。为了试验的实施,他们编制了甲、乙两套学习材料,这两套材料经检验在难度等方面相当,以分别用于前测和后测。为了更可靠地进行比较,他们选取了年龄相近的某个年级一个班的学生(30人)作为对照组。实验分三个阶段进行:第一阶段是实验组和控制组均使用甲套材料进行前测,即均在同样长的时间里学习材料甲,然后检测学习成绩;第二阶段,多动症儿童接受药物治疗,而控制组不接受;第三阶段是两个组儿童各自都学习材料乙并进行学习效果的测试,这是后测。这也是一个不等组前后测设计的准实验研究。
从以上两个例子可以看出,在准实验设计中,被试不是被随机分配到各个实验条件中的,所以在控制个体差异产生的无关变量上,没有实验设计严格,可能会产生选择与成熟的交互作用或前后测的交互作用等;因而准实验研究不能得出因果关系的结论。
四、分析论述题
1.人们发现,大脑两半球对情绪性信息的加工是不对称的,在脑功能指标上存在着偏侧化现象,有两种理论对此加以解释:半球优势假说认为,只有右半球负责对情绪的加工;效价假说认为,不同效价的情绪是由不同的大脑半球进行加工的,右半球主要加工消极情绪,左半球主要加工积极情绪。
(1)请设计一个混合实验检验这两种假说,并简要说明需要控制哪些主要额外变量。
(2)什么样的实验结果支持半球优势假设说?
(3)什么样的实验结果支持效价假说?[统考2013研]
答:(1)被试选取:正常人被试,在利手性,性别,年龄,教育程度等方面匹配。
实验材料:情绪图片,(情绪效价分别为正性和负性,以及中性刺激作为填充材料。每种类型的图片数量相同)。
实验程序:将被试分为两组,其中一组被试观看负性情绪刺激,另外一组被试观看正性情绪刺激。同时进行fMRI扫描。
实验设计:自变量为:大脑半球(左半球,右半球)×刺激类型(正效价,负效价)。
因变量为:被试的左右半脑的激活情况。
需要控制的额外变量:
①被试的性别、左右利手性。两种条件下被试的男女人数相同,并且全部为右手利。
②被试的年龄。可以将年龄作为一个协变量,通过协方差分析的方法排除年龄的影响。
③被试的疲劳和厌倦等情绪。在实验刺激中插入部分中性刺激,采用随机化的方法呈现材料刺激。
数据分析:获得被试在正性刺激条件和负性刺激条件下的左右半球激活程度(中性刺激条件下的数据不进入数据分析)。然后进行两因素混合设计方差分析。
(2)如果对于两组被试,右半球的激活都显著高于左半球的激活,说明无论情绪刺激的效果如何,都是主要由右半球负责加工,这就支持了半球优势假说。
(3)如果对于负性情绪组,右半球的激活显著高于左半球,对于正性情绪组,左半球的激活显著高于右半球,说明不同效价的情绪是由不同的大脑半球分别进行加工的。该结果就支持了效价假说。
2.请阅读下列两段材料,回答后面的问题:
研究一:为研究家庭经济环境对儿童语言发展的影响,研究者随机选择了某市家庭经济收入高、低不同的两组儿童各50名,在控制了除经济收入外的其他重要的额外变量后,测量了这两组儿童分别在1岁和2岁时的语言发展水平。结果发现:两组儿童在1岁时不存在语言发展上的差异,但在2岁时差异显著,表现为来自高收入家庭的儿童比来自低收入家庭的儿童拥有明显的语言优势。据此结果,该研究推论,良好的家庭经济环境会促进儿童语言的发展。
研究二:在某些国家或地区,呈现伪证是警察审问嫌疑人获取口供的常用方法之一。为了证明其可靠性,研究者设计了一个2(高、低易感性)x2(有、无目击者)的完全随机实验。其中,易感性“高、低”是指被试分别以快、慢两种速度输入字母,目击者“有、无”是指主试r4伙报告“看见”或“没看见”被试是否敲击了“空格”键。因变量指标是被试顺从、内化和虚构的人数比例。“顺从”是指被迫承认敲击了“空格”键,“内化”是向别人叙述自己敲击了“空格”键,“虚构”是指向主试承认自己敲击了“空格”键。结果发现,被试有69%表现出顺从,28%表现出内化,9%表现出虚构,经检验差异显著。尤其是在高易感性和有目击者条件下,被试最有可能表现出顺从和虚构。这表明,呈现伪证能够使人们更易接受被指控的结果。该研究据此推论,警察审问时通过呈现伪证引出的供词并不可靠。
(1)这两项研究各自存在哪些不足?请说明理由,并分别给出改进的建议。
(2)试根据研究评价标准,分析这两项研究所存在问题的性质,并阐述它们之间的关系。[统考2012研]
答:(1)两项研究的不足、理由及改进建议:
①第一项研究的问题是年龄自变量变化范围过窄,选取的被试变量过于单一,只有两组被试即研究一岁儿童和两岁儿童并进行比较,代表性不够,不能揭示儿童语言发展是否与环境有关,其结论不能推广。因为儿童语言是处于不断发展之中,本研究只选取了1岁和2岁这两个阅读早期的年龄段,缺少年龄更大的不同家庭经济环境儿童的数据支持,两组儿童在年龄段上的差异并不表明在语言发展的其他年龄段也存在差异。后续研究可以进行追踪或者添加更多年龄段儿童的数据,如进一步测试这两组儿童在3、4、5、6岁年龄段(或更高年龄段)的语言发展水平,从而进行研究比较,得出更具说服力的结论。
②第二项研究的问题是研究结论外推的有效性。实验中的被试产生的是对无意识疏忽性行为的内化,并不能确认他们会对真实审问情境中的明确犯罪意图也产生内化。需要在接近真实的审问情境中检验被试对明确的犯罪意图指责产生内化的可能性。
(2)两项研究所存在的问题的性质及关系:
①第一项研究的问题属于研究的内部效度问题,指实验中的自变量与因变量之间因果关系的明确程度,研究一出现选择的交互作用问题(或者不同年龄段的成熟与语言测验之间的交互作用问题)。第二项研究属于研究的外部效度问题,表明生态学效度存在问题,指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。
②内部效度是外部效度的前提,没有好的内部效度,也就谈不上外部效度。但是,内部效度高并不能保证外部效度一定高。
3.表1和表2、表3和表4是针对同一问题采用两种不同的实验设计所获得的模拟实验研究结果。请据此回答下列问题:
(1)分别指出这两种实验各自属于何种设计类型,每种设计各自使用了多少被试。
(2)针对研究问题,根据实验设计一的统计分析结果,能得出什么结论?实验设计二与实验设计一的结论是否相同?如果不同,能得出什么结论?
(3)这两种设计中哪一种更适宜考察本研究的问题?请具体说明理由。[统考2008研]
实验设计一
表1 不同教学方法下不同类型学生的学习成绩
表2 方差分析结果
实验设计二
表3 不同教学方法下不同类型学生的学习成绩
表4 方差分析结果
答:(1)实验设计一为2×2被试间设计,被试为24人。
实验设计二为2×2混合设计,其中,学生类型为被试间变量,教学方法为被试内变量。被试为12人。
(2)根据实验设计一的结果,能得出如下结论:
①教学方法的主效应显著,启发式教学方法的成绩显著高于讲授式;
②学生类型的主效应不显著;
③教学方法和学生类型之间的交互作用显著,即教学方法对不同类型学生的学习成绩产生了不同的影响;与讲授式教学方法相比,启发式教学方法对学困生成绩的提高作用更大。
实验设计二与实验设计一的结论相同。
(3)比较说明
①比较而言,被试间设计的方案能更好地回答研究问题;
②虽然混合设计所需的被试量较少,且混合设计将教学方法作为被试内变量,能更好地控制来自不同个体间的差异,但当实验过程中容易产生累积效应或练习效应时,则被试内实验设计无法适用。本实验如果将教学方法作为被试内变量则会产生累积效应或练习效应,因此,包含被试内设计在内的混合设计不能回答该研究所探讨的问题,选择被试间设计更佳。
4.某研发机构开发了一套适合于5岁幼儿阅读能力训练的游戏产品,欲通过比较该产品使用三个月前后幼儿阅读能力的变化,以确定其有效性。请针对该目的提出具体实验设计方案,说明理由;并对预期的实验数据给出具体统计分析方法。[统考2007研]
答:根据题意,考虑到5岁儿童的阅读能力及其发展速度有一定的个体差异,而且在实验中,往往只能做到随机分配被试,很难做到随机取样,同时考虑到实验的目的主要是考察使用游戏产品前后儿童阅读能力的变化,所以在实验设计中使用前后测设计。前测的练习效应和成熟等影响可以通过设计控制组进行平衡。
(1)具体设计方法
①第一种实验设计方案。采用随机实验组控制组前测后测设计。该设计的自变量为是否接受游戏产品训练,因变量是幼儿的阅读能力,额外变量包括被试选取、历史成熟、实验组控制组学习内容是否相同等。由题意,通过前测可以获得所抽取样本的最初水平,再与后测结果进行比较,以分析实验处理的效应。同时,为了控制历史、成熟、测验等额外变量,增加了控制组。为了降低实验组和控制组被试之间的选择偏差,采取了随机分派被试的方法。
②第二种实验设计方案。同样采取前测后测方法,只是分配被试的方法不同。除了随机分派之外,还可以利用匹配法进行分配被试。因变量、自变量、额外变量同上。前测后测可以控制较有效的控制历史、成熟的因素,匹配的方法选择被试也较有效的控制了被试选取中产生的误差。
(2)实验方法的选择原理
真实验设计的本质特征在于对影响内部效度的无关变量采取严格的控制并有效地操纵研究变量。实验设计中综合采取随机取样、前测和控制组等手段。
①随机分配被试是保证实验组和控制祖被试特征相同的有效手段,因为它排除了被试取样偏差导致的系统误差。
②实验设计中还常采取匹配方法,即将在各个与实验相关的因素上相近或相同的被试匹配成对,随机分配到实验组和控制组。这种方法在一定程度上保证了两组被试的相等性。但实际上配对的因素的数量是有限的,不可能保证被试的所有相关因素都相同,而且这种方法比较烦琐,因而不如随机取样方法运用得广泛。
③在实验程序安排中,前测和控制组用于消除或平衡无关变量的干扰。实际上由于采用随机取样,使得前测的意义有所降低,因为前测也可能引起一定的练习效应。一般情况下,如果采用随机原则选取和分配被试,是否需要前测要视具体实验而定。
(3)具体统计分析方法
①t检验
统计思路:
y 2-y1=d表示接受游戏产品训练的实验组前后阅读能力变化;
y '2-y'1=d’代表未接受产品训练的控制组或者匹配组前后阅读能力的变化;
d-d’就表示接受游戏产品训练引起的阅读能力变化即产品的有效性。
具体统计检验:
分别进行实验组前、后测(y2与y1)相关样本t检验,控制组或匹配组前、后测(y'2与y'1)相关样本t检验,后测的实验组、控制组(y2与y'2)独立样本t检验,或者后测的实验组、匹配组(y2与y'2)相关样本t检验。
t检验公式为(和分别代表相比较的两组的平均数)
为两样本平均数差数分布的标准误,相关样本和独立样本的计算方法不同。由于研究中,两总体都是正态分布,两总体方差都未知,当通过随机分配被试时,的计算公式为:,代表实验组的方差,代表控制组的方差。当通过匹配方法分派被试时,公式为:其中,
d为实验组与匹配组中每一项之间的差异,为差异的平均数。
当前测y1与y'1没有差异时,可直接比较后测y2与y'2,也可以比较d与d',如果二者有差异则代表产品有效。若y1与y'1有差异时,只能进行d与d’的比较,如果二者有差异则代表产品是有效的。
②方差分析
t检验的这种思路面临很多争论。比较一致的是采用协方差分析或重复测量方差分析。
统计思路:
协方差分析又称共变数分析,是将回归分析与方差分析结合起来使用的一种分析方法。在这种分析中,先将前测成绩作为协变量,建立因变量随自变量变化的回归方程,利用回归方程把因变量的变化中受前测成绩的影响扣除掉,从而能够较合理地比较在实验组和控制组下,经过回归分析手段修正以后的因变量的总体均数之间是否有显著性差异,这就是协方差分析的基本思想。
重复测量方差分析是把前后测作为一个组内变量,即重复测量,包括前测和后测,组别作为组间变量,包括实验组和控制组。方差分析的基本思路就是把各样本得到的原始观察值的总差异分解成组间差异和组内差异两部分,计算它们的相对大小:组间差异与组内差异的比值越大,说明各组平均数的差异就越明显。在计算中,以F检验来推断多个平均数差异的显著性。
方差分析公式及方差分析表:
协方差分析公式:
F=MS组校正/MS E
其中MS组校正是指通过建立回归方程将前测的影响扣除后各组成绩的均方。
对协方差分析的预测结果的解释:
如果协方差分析结果发现组别差异显著,即在控制了前测成绩的影响后,实验组的后测成绩显著好于控制组或匹配组,那么就表明该游戏产品对5岁儿童阅读能力的提高作用显著。
重复测量的方差分析公式和方差分析表:
公式如下:
MS组=SS组/df组
MS测=SS测/df测
F=MS组/MSE 1
F=MS测/MSE2
对方差分析的预期结果做出解释:如果重复测量的方差分析结果发现组别主效应显著,实验组的成绩好于控制组或匹配组;测量与组别交互作用显著,通过交互作用图及分析发现控制组或匹配组的前后测成绩变化不大,而实验组前后测成绩变化幅度大,差异显著。那么结果就表明该游戏产品对5岁儿童的阅读能力的提高作用显著。