回归分析(修订本)(社会学教材教参方法系列)
上QQ阅读APP看书,第一时间看更新

3章 一元线性回归

“回归”这一概念是19世纪80年代由英国统计学家弗朗西斯·高尔顿(Francis Galton)在研究父代身高与子代身高之间的关系时提出来的。他发现在同一族群中,子代的平均身高介于其父代的身高和族群的平均身高之间。具体而言,高个子父亲的儿子的身高有低于其父亲身高的趋势,而矮个子父亲的儿子的身高则有高于其父亲的趋势。也就是说,子代的身高有向族群平均身高“回归”的趋势。这就是统计学上“回归”的最初含义。

如今,回归已经成为社会科学定量研究方法中最基本、应用最广泛的一种数据分析技术。它既可以用于探索和检验自变量与因变量之间的因果关系,也可以基于自变量的取值变化来预测因变量的取值,还可以用于描述自变量和因变量之间的关系。很多看上去不像是回归的量化方法(比如分组分析),其实也可以用回归来表示。在现实生活中,影响某一现象的因素往往是错综复杂的。由于社会科学研究不可能像自然科学研究那样采用实验的方式来进行,为了弄清和解释事物变化的真实原因与规律,就必须借助一些事后的数据处理方法来控制干扰因素。而回归的优点恰恰就在于它可以通过统计操作手段来对干扰因素加以控制,从而帮助我们发现自变量和因变量之间的净关系。这一章里,我们将先从理解“回归”这一概念入手,随后讨论只有一个因变量和一个自变量的一元线性回归模型(或称作简单回归),并给出实际的研究案例。