SAS编程演义
上QQ阅读APP看书,第一时间看更新

1.2 选择一厢情愿

如果我们只是想“放一枪”就走人,断定以后几乎再也不会“拿枪”了,那么可能用SPSS会更合适我们;如果我们想做一个专业“枪手”,那就应该选择更专业一点儿的武器。

古语有言曰:“工欲善其事,必先利其器”,诚然,一个合适的统计分析工具可以让我们的统计分析工作事半功倍,而一个蹩脚的统计分析工具则有可能浪费我们大量宝贵的时间和资源。目前的统计分析软件,主要分两大类:一类基于图形用户界面(Graphical User Interface,GUI)(如SPSS);另一类基于命令行界面(Command Line Interface,CLI)(如SAS、R及Stata)。GUI和CLI两种形式各有优劣,GUI通过点击菜单完成数据处理和统计分析,对于非统计人员来说,操作简单容易,但其可重复性差,也不便留痕和记录,此外,菜单式的界面能容纳的统计过程和选项有限,无法快速跟进学科的发展;CLI则通过命令行或者编程语言完成数据处理和统计分析工作,作业过程灵活,对于自动化和重复性作业有明显优势,适合统计专业人员,更重要是非常契合现在越来流行的“可重复性研究”(Reproducible Research)的理念。

SAS软件作为老牌的统计软件,能够称霸统计界,且至今仍然独立运营,实属罕见。在大数据时代,SAS软件也在与时俱进,开发了很多适应大数据处理的功能和产品,如SAS网格计算(SAS®Grid Computing)、库内计算(SAS®In-Database)和内存计算(SAS® In-Memory Analytics),等等。虽然SAS的安装文件庞大,安装过程也较为费劲,但是这些一劳永逸的付出会让我们在后期觉得这是值得的,至于我们所担心的昂贵的费用问题,那就交给财大气粗的雇主吧。如果没有有钱的雇主,那就用大学版(SAS University Edition)吧,如果连大学版也懒得安装,还可以尝试免费的云端统计分析平台SODA(SAS® On Demand for Academics)。反正作为程序员和统计师,不必为软件费用埋单的问题担忧。此外,如果希望进入生物医药领域,特别是临床试验领域,那必需赶紧倒腾SAS,越早越好。

当然,如果你已经习惯了其他CLI的统计软件,笔者也不是非要苦口婆心的来劝你改用SAS,这不是本书的目的。但是,若果你要用或者正在用SAS,那本书所讨论的一些内容,可能正是你不愿错过的。