1.7 科学方法的4个步骤
学习目标:
解读对一个想法进行科学检验所需的4个基本步骤。
对任何想法进行科学检验都需要遵循4个基本步骤。我们可以将这4个步骤应用于探究糖使儿童亢奋的问题(见图1-5)。基本上所有的科学家都遵循相同的步骤,无论他们从事的是心理学、生物学、化学、天文学,还是其他任何科学研究工作。因此,让这些领域具有科学性的是方法,而非它们的主题。
图1-5 科学方法的4个步骤
1.7.1 提出假设
首先需要一个具体的可检验的想法或预测,它们也被称为假设(hypothesis)。这个术语的字面意思是“小理论”,因为它通常只代表一个更宏大的理论解释中的一部分。比如,某个假设预测内向的人容易被外向的人吸引,这个假设可能是整合所有浪漫吸引构成要素理论的一部分。假设还可能只是激发我们好奇心的一个有趣的观点,就像我们研究糖对儿童的影响一样。
为了可检验,假设必须具有潜在的可证伪性,也就是说,必须用一种可证明其正确或错误的方式来表述。让我们用下述假设来说明如何进行检验:糖让孩子变得亢奋。我们可以通过让孩子吃糖,然后观察他们的活跃水平来检验这一假设。如果我们发现孩子的活跃水平没有增加,那么这个假设就被证伪了。如果我们仅陈述一个价值判断,比如,糖对孩子“有害”,这条假设就无法被证伪。科学不以做出价值判断为目的,也无法回答不能进行实证检验的问题。表1-2列出了一些科学方法无法解答的问题。
表1-2 科学方法无法解答的问题
注:科学方法不适用于回答这些不能实施客观、实证检验的问题。
虽然科学有助于我们理解这些问题,但问题的答案最终要通过逻辑、信仰、立法、共识或其他科学方法以外的方式来寻找。
之后,科学家必须清晰地思考如何检验所提出的假设。他们需要用具体的术语定义研究的每个方面,这些术语被称为操作性定义(operational definitions)。以下就是我们这项研究的操作性定义。
- “孩子”的操作性定义。我们无法对世界上所有的孩子进行检验。因此,我们对“孩子”的操作性定义可能是附近小学三年级某个班的所有学生。
- “糖”的操作性定义。类似地,我们可以将我们所说的“糖”定义为软饮料中的含糖量。例如,如果我们决定使用七喜作为糖的来源,那么“糖”的操作性定义就是一罐七喜中的38克糖。(我们需要使用不含咖啡因的饮料,如七喜,以避免咖啡因对儿童行为可能产生的混淆影响。)
- 亢奋的操作性定义。这就比较复杂了。假设我们专门训练了一批观察者,他们会在下面这个5点量表上对每个孩子的行为进行评分。
那么,如果我们在研究中给一些孩子喝含糖饮料,给其他孩子喝含人造甜味剂的同种饮料,我们可以将“亢奋”操作性地定义为,含糖饮料组的平均活跃程度的评分显著更高。
掌握了假设和操作性定义,我们就已经向科学研究迈出第一步了。接下来,让我们来检验我们的假设。(像占星术或算命这样的伪科学的最大失败之处就在于,它们无法真正采取这一步骤来检验自身的主张。)
写一写
提出假设
思考一个你想得到回答的心理学问题。
提出一个可证伪的假设。列出每个变量的操作性定义(比如,假设的元素)。
1.7.2 收集客观数据
我们的实证研究从这里开始。从字面上看,实证意味着“基于经验的”——与完全基于希望、权威、信念或者“常识”的推测形成鲜明对比。然而,如果我们错误地将某个人的经验归类为“实证的”,那么这个术语的字面定义可能就是有误导性的。无论一个人的经验多有说服力,它仍然只是轶事或口头证词,需要在科学研究的受控条件下接受检验。正如我们在本章前面部分的“批判性思维”一节中所探讨的那样,假设一个人的经验也适用于其他人是危险的。
实证地研究问题意味着仔细地、系统地收集证据,我们需要采用几种被证明可行的方法中的某一种,在下一节我们将深入探讨这些方法。设计这类方法是为了避免我们的预期、偏见和歧视所导致的错误结论。实证研究的优点在于我们可以更有信心地将获取的数据(data)应用或推广到更多人身上。
1.7.3 分析结果
在收集完数据之后,我们会用一些数学或统计公式来分析数据。如果你讨厌数学,也不用担心:对统计过程的详细解释已经超出了本书的范畴——事实上,接受高等心理学教育的学生会修习关于统计方法的全部课程!然而,在我们的实验中,统计分析相对简单且直接,因为我们只想知道摄入含糖饮料的孩子的评分是否高于摄入无糖饮料的孩子。如果“是”,我们就可以宣布我们的假设得到了支持。如果“不是”,我们就否定这一假设。无论是哪种结果,我们都会获得一些知识。
1.7.4 发表、评论并重复实验结果
科学方法的最后一步,是把完成的研究结果公布出来,接受科学界的审查和评论,你可以通过在专业期刊上发表论文、在专业会议上做报告,或者把研究内容写成一本书来完成这最后一步。之后研究人员需要等待评论者的回应。
如果同行认为这项研究有趣且很重要——尤其是当它挑战了其他研究或一个被广泛认可的理论——那么评论者可能会寻找你研究设计中的缺陷:主试是否恰当地选取了被试?统计分析是否正确?是否有其他因素也能导致这一结果?或者,他们可能会重复这项研究来对它进行检验。为了对实验进行重复检验(replicate),他们会自己重新做一遍,看看是否能得到相同结果。
事实上,我们所进行的糖对孩子影响的研究是马克·沃尔雷奇和他的同事们(Mark Wolraich et al.,1995)之前所做研究的简化复制。他们的研究持续了3周,比较了一组高糖饮食的孩子和另一组低糖饮食(含人造甜味剂)的孩子。与坊间流传的智慧相反,研究人员发现两组孩子在行为和认知(心理)功能上没有差异。因此,如果我们的研究发现了“高糖”效应,那么它就与沃尔雷奇的发现相矛盾,最后它会受到仔细的审查和批评。
论文在正式发表前还要进行专家评审,以毙掉那些在设计或实施上有缺陷的研究。期刊编辑和图书出版商(包括本书的出版商)通常会征求专业审稿人的意见。一般情况下,作者会收到有益的、即使有时是令人痛苦的修改建议。只有当一个假设扫清了这些障碍,编辑们才会予以出版付印,学者们才会将它暂定为科学的“真理”。
但我们要强调的是,科学发现永远是暂定的。只要它们还没被推翻,它们就永远要面对来自新研究的威胁,或是需要一个新的解释,或是把以前的研究成果送到学术垃圾里。因此,沃尔雷奇关于糖的研究结果最终也可能会被更好、更权威的知识所取代(尽管在本书撰写时还没被推翻)。显然,科学方法并不是一个完美的系统,但它却是迄今为止检验关于自然界的各种观点的最好方法。因此,它是人类最伟大的智力成果之一。