数据挖掘与数据分析:基于R语言
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.6 R语言中的因子

R语言中的因子主要用于对数据进行分组,可以记录数据中的类别名称及类别数目,如人的性别可以分为男性和女性,考试成绩可以分为优、良、差等。因子型变量内的所有非重复值,被称为因子水平(levels)。在R语言中一般用factor()函数创建因子型变量。

直接输出因子型变量myfactor会得到以下结果:

其中的levels即为因子型变量内的所有非重复值。我们还可以利用summary()函数对因子型变量myfactor进行统计,结果如下:

调用class()函数可获取myfactor变量的类型为因子型变量:

调用as.character()函数可以将myfactor转为字符型变量:

调用as.integer()函数可以将myfactor转为数值型变量: