1.8 心理学研究的5种类型_津巴多普通心理学（第8版）-QQ阅读男生玄幻网

上QQ阅读APP看书，第一时间看更新

1.8 心理学研究的5种类型

学习目标：

分析实施心理学研究的5种方法。

比起轶事或者伪科学，科学方法让观点有了更大的可信度。在科学方法中，研究人员可以通过几种具体的方法收集客观数据。每一种方法都有其独特的优点，也有其局限性。开展好的研究的一个关键步骤就是选择到最适合这些特定假设及资源的方法。

1.8.1 实验

像理论这个词一样，实验（experiment）一词在科学领域中也有非常具体的含义。在日常用法中，实验可以指任何类型的正式或非正式检验；与之相反，在科学领域，该词仅指在严格控制的条件下收集信息的一套特定程序。由于实验是经过精心设计的，它是我们将在这里讨论的研究方法中唯一能够可靠地确定因果关系的方法。因此，如果一个假设的表述中出现了因果关系——就像我们提出的糖会导致孩子亢奋——那么实验就是最好的选择。让我们一起看看我们关于糖的研究是如何确定原因和结果的。

在最基本的实验设计中，研究人员只改变一个因素（被称为变量），并保持实验的所有其他条件恒定——对所有被试都一样。

科学家称这个变量为自变量（independent variable），因为它独立于研究中的其他变量。在我们关于糖的研究中，我们假设糖导致亢奋，所以糖/无糖是我们的自变量。通过让一些孩子摄入糖，让另一些孩子摄入糖的替代品，且保持所有其他条件不变，我们就是在操纵自变量了。因为实验中其他各个方面都保持恒定，所以我们可以说，自变量就是我们观察到的任何实验效应的原因。

因变量（dependent variable）则是结果变量，或者说是我们假设的实验效应。换句话说，我们观察到的任何实验效应都取决于我们引入的自变量。在我们关于糖的实验中，因变量是孩子的活跃水平。如果我们后来观察到摄入糖的那组孩子更活跃，我们便可以确定是糖导致了亢奋，因为这是两组之间唯一的区别。

在进一步讨论之前，我们应该澄清用于区分被试的另外两个重要术语。

接受研究人员感兴趣的处理（在我们的研究中，是高糖饮料）被称为处于实验条件下。接受实验条件处理的个体组成了实验组（experimental group）。
同时，处于对照条件下的个体组成了控制组（control group），他们不会接受特殊处理。（在我们的研究中，控制组将获得含有人造甜味剂的饮料。）因此，控制组的作用是作为和实验组比较的标准。

随机分配让各组均等

让孩子（或他们的父母）根据自己的喜好来决定分组，这是划分被试的一个简单方法。可问题是，允许孩子喝含糖饮料的父母和不允许孩子喝含糖饮料的父母之间可能会有一些差别。比如，允许孩子喝含糖饮料的父母在规则方面可能更宽松，这可能导致他们的孩子在玩耍时更吵闹——我们的实验结果会被混淆。类似地，我们也不能把所有女孩放在一组，而把所有男孩放在另一组。为什么不能？因为对糖的生理反应可能存在性别差异。此外，某一种性别可能比另一种性别更擅长控制自己的反应。这些事先存在的分歧可能会影响我们的实验结果。

最好的解决办法是随机分配（random assignment），将被试完全随机地分配到各组。一种方法是按字母顺序列出孩子们的名字，然后交替分配到实验组和控制组中去。通过随机分配，两组之间事先存在的差异达到了最小。这就确保了任何活跃水平的差异都可以归因于糖，而不是其他因素（比如，性别或父母教养方式）。

实验确定因果关系

实验方法是确定因果关系的黄金标准。它通过分离出研究人员感兴趣的变量（自变量），同时保持所有其他实验条件不变来确定因果关系。通过随机分配来最小化实验组和控制组先前存在的差异，因此我们可以更确信地将结果（因变量）的差异归因于自变量的影响，而非其他因素。

既然实验是找出因果关系的有力方法，我们为什么还需要其他方法呢？一方面，并不是所有的假设都旨在寻找因果关系——有些只是想描述特定的群体，比如，确定哪些性格特质在心理学系学生中是常见的。

另一方面，伦理方面的考虑也会阻止我们进行某些类型的实验研究，特别是那些可能对被试造成潜在伤害的实验研究。那么，在这种情况下，下列其中一种研究方法就是一个更好的或更实际的选择。

1.8.2 相关研究

除了上述考虑因素之外，还有另一个因素影响着研究人员对方法的选择：出于现实或伦理上的考虑，有时科学家无法充分地控制情境，他们不能实施真正的实验。比如，你想测试这样一个假设，儿童摄入含铅油漆会增加其出现学习障碍的风险。（含铅油漆在老房子里很常见，特别是在城市低收入家庭的住房中。）但你不能开展实验，因为实验需要你操纵自变量——在这个例子里意味着把有毒物质（铅）暴露给一群孩子。显然，这一做法是有害的和不道德的。

幸运的是，你可以找到绕开这一问题的方法——但代价是放弃对一些研究条件的控制。解决方案是采取相关研究（correlational study）。在相关研究中，你实际上是在寻找一个在现实世界中已经偶然发生了的“自然实验”。因此，在关于含铅油漆的影响的相关研究中，你可以寻找一组已经接触过含铅油漆的儿童。然后，将他们与另一组没有接触过含铅油漆的儿童进行比较。作为进一步的控制，你应该试着将两组儿童进行匹配，使他们在每一个可以想到的方面（如年龄、家庭收入和性别）都保持一致——除了他们是否接触过含铅油漆。

相关研究的一大缺陷是，你永远无法确定每组之间是否完全具有可比性，因为你没有随机地将人们分配到实验组，也没有操纵自变量。事实上，每个组都可能在一些重要的变量上存在差异（如获得的医疗保健或营养状况），而这些变量可能会被你忽略。因此，即使你发现接触含铅油漆的儿童中有更多的人存在学习障碍，你也不能肯定地得出结论：接触含铅油漆会导致儿童出现学习障碍。你最多只能说接触含铅油漆与学习障碍之间存在相关性。不过，这一结果依然有用，因为它缩小了对学习障碍的关联因素的搜索范围。此外，一系列可靠的相关性发现有时能为实验研究铺平道路。媒体报道的很多研究发现很可能来自相关研究，而不是实验研究，所以让我们近距离看看这些发现意味着什么，以及我们应如何准确地解读它们。

三种相关关系（见图1-6）

1. 如果两个变量呈现出向同一方向变化的模式（随着一个变量的增大，另一个变量也增大），我们称之为正相关。例如，在我们的假设中，我们预测了一种正相关关系，即接触含铅油漆的儿童有更高的学习障碍风险。

2. 但当一个变量减小，而另一个变量增大时，这叫作负相关。你可能会发现大学生的饮酒量与他们的平均绩点（GPA）之间存在负相关关系（随着大学生饮酒量的增加，他们的平均绩点下降）。

3. 最后，如果变量之间完全没有关系，这就是零相关。例如，身高和GPA之间就是这种关系。

研究人员通常将相关程度表示为一个数字，低至-1.0（表示强负相关），高至正数+1.0（表示强正相关）。重要的是，我们要注意，相关性即使是负的，也可以表示强烈的相关关系。（请注意，教授们经常会出关于这个知识点的考题！）假设我们发现焦虑和学习时间之间的相关性为-0.7。也就是说，这是一个负相关，表明更强的焦虑与更少的学习时间相关。尽管这是一个负相关，但显示了比美国高考（SAT）成绩与GPA之间+0.4的正相关更强的关系。

图1-6 三种类型的相关关系

注：图1-6展示了三种主要的相关类型，包括27个人的数据点。（A）SAT成绩与GPA呈正相关；（B）每周饮酒量与GPA呈负相关；（C）身高与GPA没有相关性。

思考两个你认为在你的生活中相关的变量。描述你认为它们是怎样相关的，并说出你预测的相关性是正相关还是负相关。

解释相关性发现

批判性思维中最常见的错误之一是，将相关性发现曲解为因果性发现。例如，几年前，研究发现儿童的自尊与他们的学业表现之间存在正相关关系。这是否意味着高自尊会使孩子们在学校表现得更好？这可不一定——得出上述结论就是因为犯了批判性思维的错误！虽然这一观念与我们关于自尊益处的“常识”相符，但如果我们没有进行实验研究、没有操纵自变量（自尊）、没有把学生随机分配到实验组和控制组，我们就不能确定它们的因果关系。科学家们通常这样描述这条一般原理：相关关系不一定意味着因果关系。

所以，为了避免这个重要的批判性思维错误，对于任何相关性发现，你一定要想到如下三种可能的解释（见图1-7）。

A导致B。如果“A”指的是前面提到的第一个变量（自尊），“B”指的是第二个变量（成绩），那么这一解释承认自尊可能确实影响了学生的学习成绩。但这只是其中一种可能性。
B导致A。第二种可能性是学习成绩影响了自尊——换句话说，我们最初关于因果关系的假设顺序反了。你想一想，有没有可能是在学校表现好的学生由此有了更高的自尊？如果真是这样，那么学习成绩（而不是自尊）就是这种相关性的驱动力。
C导致A和B。在考虑相关性发现时，我们还必须认识到这里存在第三种可能性：如果另一个变量（C）——在研究中没有测量的变量——实际上是所观察到的关系背后的驱动力，那会怎样？在这个例子中，什么可能会影响一个学生的学习成绩和自尊？也许更多的亲子时光能帮助孩子提高学习成绩，也能提高孩子的自尊心。在此种情况下，我们会错误地假定成绩和自尊是有因果关系的——事实上，这只是表象，因为我们没注意到二者的真实原因。

图1-7 解释相关性结果的三种方式

注：（1）变量A（自尊）与变量B（学习成绩）呈正相关（相关）。自尊水平越高的学生学习成绩也越好。

（2）这一相关性的一个可能的解释是A导致B——在这种情况下，高自尊帮助学生在学校取得更好的成绩。

（3）这一相关性的第二个可能的解释是B导致A——在这种情况下，在学校取得更好的成绩会提高学生的自尊水平。

（4）第三种可能的解释是，第三个变量（我们称之为C变量）——在研究中未被测量的变量——可能是A和B之间的关系的真正原因。在这种情况下，自控力是一个可能的C变量。换句话说，自控力可能既会帮助孩子提高学习成绩，也会提高孩子的自尊水平。

因此，在相关性研究中必须将这三种解释考虑齐全，因为在没有实验研究的情况下是无法确定因果关系的。

重要的是要记住，假若我们没有真正实施一个实验，对原因的猜测就仅仅只是猜测——而且具有潜在的危害。我们在此探讨的例子有力地说明了这种危害：在相关研究展现了自尊与成绩之间的关系后，人们错误地认为高自尊能提高学生的成绩，美国向提高学生自尊的教师培训项目投入了数百万美元。起作用了吗？没有。相反，后续的实验研究却发现，成绩好是高自尊的原因之一，这一结果为前文中B导致A的解释提供了支持。而且，事实证明，自控力（在本案例中，是变量C的一个例子）既能提高自尊，也能提高学习成绩（Baumeister et al.，2003）。即使是训练有素的研究人员和立法者，在被“常识”干扰时，他们对研究的解释也会犯错误。

写一写

解释相关性

思考以下场景：一篇新闻报道写道，睡眠时间越长的人越有创造力。

用学到的三种方法解释这一相关性的发现，写出解释这一发现的所有方式（用A、B、C的格式）。

1.8.3 问卷调查

学生更喜欢哪种学习方式：听讲、自行阅读材料，还是参与亲自动手的实践活动？如果你想知道这个问题的答案，你不需要做实验或开展相关研究。你可以简单地通过问卷调查（survey）来询问学生们喜欢什么，问卷调查是确定人们的态度、偏好或其他特征的一种受欢迎且有效的方法。

问卷调查的方法被民意调查专家和营销顾问（以及许多心理学和社会学的研究人员）广泛使用，他们通常会让人们回答一组事先准备好的问题。问卷调查法的最大优点在于能够相对快速和廉价地收集大量被调查者的数据，例如，进行网上问卷调查。不过这种容易获得很多人数据的方式，也成了问卷调查的最大缺点：它容易受到各种偏见的影响。

在开展一项问卷调查或解释其结果时，有哪些常见的偏见呢？社会期望偏差是指被调查者以符合社会期望或政治正确的方式回答问题的倾向（Schwarz，1999）。其他偏差（见表1-3）可能来自如下三个方面。

问题的措辞（是否清晰？它们是否使用了带有情绪色彩的词汇来引出某种特定类型的回答？）
样本（被调查者在多大程度上代表了一般人群？）
调查条件（调查是匿名的吗？被调查者接受调查的环境是否会给他们的回答带来偏差？）

避免这些偏差后，问卷调查将会非常有用——但这也只适用于可以通过调查对假设进行合理研究的情况。例如，通过询问家长是否注意到他们的孩子在吃糖后变亢奋，来研究糖对孩子活跃程度的影响，这一方法可以揭示家长对糖和亢奋的看法——但这些看法并没有通过实证检验我们感兴趣的关系。因此，它不是解决我们本章思考题的合适选择。

1.8.4 自然观察

珍妮·古道尔（Jane Goodall）的经典研究表明，黑猩猩具有复杂的、制造工具的文化，她的研究基于在自然丛林里对黑猩猩的观察。同样，当心理学研究人员想知道人在自然环境中的行为时（相比于实验室的人为条件），他们会采用同样的方法——自然观察（naturalistic observation）。这一方法适合研究育儿实践、购物习惯或人们在公共场合里如何调情。所以我们也就可以在诸如家、购物中心、餐厅，或者荒郊野外等各种地方进行自然观察。

珍妮·古道尔在她对野外黑猩猩行为的开创性研究中使用了自然观察法。

表1-3 调查偏差的常见类型及校正方法

你可能猜到了，自然观察不像实验那样在控制条件下执行，因为研究人员仅观察和记录行为，而不是操纵环境。然而，最好的自然观察会遵循一个经过深思熟虑的计划。因此，通过使用系统的观察和数据收集流程，以及通过对观察者进行悉心培训，我们可以最大限度地减少预期偏差等问题。

自然观察的优点在于，你看到的行为都是自然发生的，这就能揭示出实验环境中无法发现的真相。在某些情况下，利用自然环境也比试图在实验室中重建环境的性价比更高。自然观察的缺点包括两方面，一是缺乏对环境的控制，从而无法得到因果关系的结论；二是一个设计良好的自然观察研究既费时又费钱。

1.8.5 个案研究

如果让你研究是什么塑造了喜剧演员斯蒂芬·科尔伯特（Stephen Colbert）的幽默感，你会用什么方法？你无法实施任何类型的实证研究（empirical research），因为（无论好坏）你只有一个斯蒂芬·科尔伯特。在这种情况下，研究人员必须依靠个案研究（case study），这是一种独特的研究方法，它只深入关注一个或几个人，这些人通常都存在着某些罕见的问题或非凡的才能。例如，霍华德·加德纳（Howard Gardner，1993）在他的《大师的创造力》（Creating Minds）一书中，运用个案研究的方法探究了几位创造力非凡的人的思维过程，这几个人包括爱因斯坦、毕加索和弗洛伊德。为发展精神障碍相关理论而进行个案研究的治疗师有时称这种方法为临床方法。不管怎么命名，它的缺点就在于它的主观性、小样本量以及缺乏对可能影响被研究个体的变量的控制。这些局限性严重制约了研究人员得出可以推广或自信地应用于其他人的结论的能力。当然，个案研究有时会为我们提供用其他方法无法获得的有价值的信息。