Python金融数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

4.3.1 变量间的关系

在讲解回归分析算法前,我们需要了解变量间的关系。

1.函数关系

变量间的函数关系是一一对应的确定关系。设有两个变量x和y,当变量x取某个数值时,x依据确定的关系(f)取相应的y值,则y是x的函数,记为y=f(x),x称为自变量,y称为因变量。例子:圆面积S与半径之间的关系可表示为S=πR2

2.相关关系

变量间的相关关系不能用函数关系精确表达。一个变量的取值不能由另一个(某一些)变量唯一确定。当变量x取某个值时,变量y的取值可能有几个。各观测点分布在直线的周围。例子:父亲身高x与子女身高y之间的关系。

3.回归分析与相关分析的区别

·在相关分析中,变量x和变量y是平等的地位;在回归分析中,变量y处在被x解释的地位。

·相关分析中所涉及的变量都是随机变量;在回归分析中,因变量是随机变量,自变量可以是随机变量,也可以是非随机的确定变量。

·相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响程度,还可以由回归方程进行预测和控制。