上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3 数据分析工具软件
严格来讲,任何做数据处理的软件都可以被称为数据分析工具软件,例如,Excel可以做很多统计工作,Tableau等BI软件支持不同维度的数据探索。本节讨论的数据分析工具软件指的是可以进行统计分析或机器学习的软件。
不同工具软件侧重点不同,适合的场景也不同。数据分析工具选择,需要综合考虑各种应用场景,比如,使用者的技能要求、算法包(包括处理算法、可视化和报告输出等)的丰富程度、运行环境(例如是否能在单机上运行)、开发调试的便捷性(包括软件本身和社区内容)、处理性能(例如可以处理的数据集大小)等。基于这样的差异,不同类型组织使用的数据分析工具也不同。Rexer Analytics在2017年对在企业、咨询、学术、政府与公共机构等4个领域做了调查[7] ,结果如图1-10所示,在所有领域,开源软件R和Python的使用频度都很高,在企业和咨询行业,SQL和Tableau等工具也是常用的软件。在学术界,MATLAB作为工程分析软件,使用频度也非常高。Forrester Research在2017年调研[8] 指出IBM SPSS、SAS、KNIME、RapidMiner是行业分析产品的领军者。
图1-10 Rexer Analytics在2017年对数据分析软件使用的调研结果
下面按照开发和运行方式,从脚本语言软件、图形化桌面软件、云端分析软件三个类别介绍一下常见的数据分析工具软件。