前言
随着大数据、云计算、人工智能、区块链和移动互联网的发展,大数据价值作为智慧数据的基础得到广泛应用。原始的数据是杂乱无章的,数据只有通过合适的数据工具处理,实现数据的标准化、特征化才能被机器所利用。机器通过大量的数据让自己变得更智慧。未来已来,人类已经进入大数据与人工智能的时代,智能机器将帮助人类从繁重的劳动中解放出来。
时代在改变,以金融为例,从金融1.0到现在金融4.0的智慧银行时代,线上业务得到了快速发展,打破了地域限制,这也是移动互联网、大数据、人工智能等发展的结晶。
本书结合作者多年的大数据实践经验编写而成。让初学者知道如何入门,跟着案例理解数据价值。大数据挖掘价值的洞察需要合适的工具,SAS作为业界公认的大数据挖掘工具得到广泛应用。结合实例开发应用案例学习更能深刻理解SAS语言、大数据分析、大数据挖掘,而不是一开始就把大家带入统计领域。
通过本书的实例讲解让大家真正开卷有益,让初学者快速入门,让有基础者深入提高,让有经验者提高效率。理论与实践互相结合,相得益彰。
本书重点对SAS的核心模块BASE SAS(SAS所有产品的基础模块)、SAS/ACCESS TO PC FILES(用于读取和生成多种格式的文件模块)、SAS/ACCESS(该模块提供SAS软件访问各类数据库的接口)、数据分析和SAS/EM(企业数据挖掘模块)进行详细讲解,并结合ORACLE关系数据库进行讲解。对各类数据文件用SAS读取进行了详细的讲解并对每一类型文件都结合了实例分析,以此来帮助读者理解SAS读取各类数据文件的方法。通过实例来学习和研究SAS与数据库互相结合的奥妙,更能深入理解SAS在实际中的应用价值。
全书共13章,第1、2章主要讲解SAS的发展历史、功能模块和SAS编程语言。通过与实际应用案例相结合的方式对编程语言进行详细讲解,并辅以程序注释使初学者更易于理解语句含义。
第3~5章主要讲解SAS的各类函数、数据步和过程步的处理。每一个函数理论后都配以实际开发应用案例,力求达到理论与实践的紧密结合。其中,会利用单独一节通过实际案例的方式对SAS自定义函数进行细致讲解。数据步处理重点讲解了数据步对各类文件的处理和根据业务需求通过函数处理变量的应用方法。过程步讲解了过程的语法、基本语句和实际调用。
第6~9章主要讲解了SQL过程、ODS输出控制把分析结果存储到各类型格式的文件、宏过程和数据文件装载与数据集整理,并且以关系数据库ORACLE为例进行了SAS与数据库结合应用的讲解。
第10~13章主要讲解了SAS系统的常用过程、统计分析应用、数据挖掘、编程效率优化的方法和经典程序综合应用与分析。
本书将作者工作中大量的实践案例与初学者学习过程中遇到的困惑相结合,通过对每个理论知识后实践案例程序详细解读的方式,力求通俗易懂地将SAS各模块和应用方法进行有针对性、实战化的介绍与分享,以帮助读者深刻领会和掌握SAS数据处理、统计分析和数据挖掘等的方法,培养读者解决商业问题的能力。
本书具有以下特点。
◆SAS编程语言语法详细、实例丰富、添加程序解读和详细注释。
◆通过案例讲解SAS 9.4实际应用。
◆专门讲解SAS对各类文件处理和SAS与ORACLE数据库结合应用。
◆对SAS各知识点通过编程效率优化和经典程序综合运用案例把理论与实际应用结合讲解。
本书中每一部分的讲解都引入实际开发应用案例来进行说明和注释,把理论和实践结合起来,让读者在探索中进行思考。
本书的编写过程中,得到了同事、出版社和家人的大力支持,在此深表感谢。由于编者水平有限,书中难免存在不妥与疏漏之处,欢迎广大读者批评指正,以便于以后修订。
编者