R语言与数据挖掘
上QQ阅读APP看书,第一时间看更新

第1章 R语言的安装与使用

R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Laboratory)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具。它是面向对象的一种编程语言,是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。它具有下列优势:

(1)作为一个免费的统计软件,R可运行于多种平台之上,包括Windows、UNIX、MacOS和Linux。

(2)R可以轻松地从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件,乃至专门的数据仓库。它同样可以将数据输出并写入这些系统中。

(3)R具有较高的开放性,不仅提供功能丰富的内置函数供用户调用,也允许用户编写自定义函数来扩充功能。

(4)R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能。

R是一个体系庞大的应用软件,主要包括核心的R标准包和各专业领域的其他包。R在数据分析、数据挖掘领域具有特别优势,本书针对数据分析和挖掘相关的内容采用原理加实战的方式来对R相关函数进行介绍。本章主要简单介绍R软件的安装及升级、一些数据分析和挖掘相关的包以及常用函数的使用。在后续的章节中,首先介绍R中的数据对象及数据结构,然后选取R中常用的数据管理函数及绘图函数进行演示,最后介绍在数据挖掘中经常用到的几种类型的挖掘建模的函数,读者可以通过本书提供的R相关实例切实感受R在数据挖掘方面的强大功能。