前言
为什么要写本书
近些年来,智能风控技术在金融风险管理中的应用越来越广泛。智能风控利用金融大数据、机器学习、深度学习、强化学习、时序数据分析、异常检测、社交网络分析、图深度学习、知识图谱、自然语言处理、文本挖掘等智能分析建模技术,以及分布式计算、实时流式计算、实时决策引擎、设备行为分析等数据工程技术,赋能金融风控管理,极大地提升了风险决策的准确性和效率。而评分卡模型作为智能风控技术的基础部分,以其良好的可解释性和稳定性广泛应用于金融领域。系统地掌握评分卡建模技术是很有必要的,既有助于直接进行量化建模,为金融风控提供决策支持,又有助于加深对风险建模的理解和认识,提升风险建模能力。
十多年前我初入金融风控领域,便是从评分卡建模开始上手的,至今一直从事风险量化建模、风控策略设计、风险解决方案相关工作。在早期做评分卡建模时,我对评分卡没有太深刻的认识。正所谓“无知者无畏”,我认为评分卡建模是很简单的事情。随着工作经验的不断积累,我逐渐尝试从更高层面分析和建模:1)从宏观建模全生命周期流程及全面风控体系的角度构建模型;2)开始深入探究和思考建模的技术细节;3)更加重视从业务角度(而非纯技术角度)思考建模问题。此外,我开始更深刻地理解评分卡建模技术的精妙之处,并对建模技术进行了系统性的思考、梳理和总结,也正是因为有了系统性的思考和总结,才有了本书的初稿。
近几年我经常参加智能风控和数据分析的线下交流活动,也曾受邀作为讲师为金融机构做内部风控培训,了解到很多风险建模人员都对评分卡建模缺乏深刻的理解。市面上已有的介绍评分卡建模技术的图书或者侧重理论介绍,实战内容很少,或者过于聚焦零散的技术片段和细枝末节,不够系统。不少朋友希望能有一本全面系统地介绍建模全流程和方法的图书,并能兼顾业务和技术,本书就是在此背景下完成的。
我曾在FICO和Accenture任职十余年,熟悉银行传统风控体系的思想、方法、技术和工具,近几年我又在国内领先的金融科技公司负责智能风控解决方案、风险策略设计和风险建模技术的创新研究,深刻体会到,在理解金融风险业务本质特征的基础上,既能继承传统金融风控核心技术,又能在人工智能背景下创新智能风控技术,实现“传统风控+智能风控”双引擎驱动,对从事金融风控的人员而言是很有必要的。在本书策划编辑杨福川的邀请下,我基于这些工作经验以及对智能风控的理解写了本书,供广大已从事或拟从事智能风控工作的读者参考,以期促进行业交流和人才技能提升。
读者对象
本书主要面向以下读者:
- 在金融机构(特别是商业银行、信用卡中心、持牌消费金融机构等)从事风险量化建模、风险数据分析、风控业务策略设计的人员;
- 在金融科技公司、互联网公司等科技类公司从事风险量化建模、风险数据分析、风控业务策略设计的人员;
- 对智能风控技术感兴趣的其他人员;
- 智能风控相关专业的在校学生。
本书特色
- 注重实战,代码丰富:本书基于作者十余年风险建模和风控策略经验,对评分卡建模技术进行了系统的梳理和总结,所介绍的内容都是实际风险建模工作中能用到的。另外还给出了丰富的Python代码示例,具有较强的实践性。
- 结构清晰,逻辑严谨:本书不仅包括模型本身的设计、开发、验证,还包括模型的工程部署、监控和优化,按建模方法论的流程对建模的各环节依次进行介绍。
- 新视角、新观点、新思考:本书在部分技术点上提出了一些新看法和新观点,特别是我对模型的系统化思考、对拒绝推断的理解、对业务需求的理解等方面,以期抛砖引玉,引起更广泛的交流和探讨。
- 融入最新建模技术:评分卡建模是相对传统的建模技术,我结合当前机器学习领域热点技术,介绍了特征工程、高维机器学习等最新技术。
如何阅读本书
本书内容分为6个部分。
第1章介绍评分卡入门知识,包括评分卡模型的概念和定义、评分卡建模全流程、对模型的评价等,以概念性内容介绍为主,帮助读者初步了解评分卡的基本概念。
第2章介绍零售信贷业务基础知识,包括银行零售信贷领域产品特征、业务流程,以及信用风险概念、欺诈风险概念,帮助读者理解评分卡的应用场景和要解决的业务问题。
第3~11章介绍评分卡建模全流程,是全书核心内容,覆盖业务需求理解、数据理解、特征工程、模型设计、模型开发、模型验证、模型部署、模型监控、模型优化等模型全生命周期的各个环节。该部分以技术介绍为主,帮助读者系统地掌握模型需求、设计、开发、测试、部署和应用全流程技术。
第12~14章介绍评分卡建模关键问题,包括拒绝推断问题、可解释性问题,以及模型开发过程中诸如分布不均衡、模型性能下降等常见问题及应对方案。
第15章介绍高维机器学习,讨论了当前业界除评分卡外使用频率较高的高维机器学习技术,并重点介绍了XGBoost和LightGBM模型。
第16章介绍风险策略应用,以贷前自动化审批场景为例,介绍了基于风险评分的自动化审批策略构建方法,帮助读者理解评分卡模型在风险策略设计中的应用。
本书是量化建模方法论的系统性总结和介绍,无论是对于已经从事评分卡建模多年的“老兵”,还是刚入行或即将入行的“新手”,都具有较好的参考价值。本书既可以作为系统性介绍评分卡建模技术的教科书,带领读者进行系统学习,也可以作为案头工具书,供读者在工作过程中随时查阅和参考。
勘误和支持
由于作者的水平有限,加之撰写时间仓促,书中难免会出现一些错误、疏漏或者不准确的地方,欢迎各位读者和专家批评指正。可以通过如下方式与作者交流或获得支持。
- 本书专属代码托管GitHub:https://github.com/jackzhang83/ScoreCard。
- 知乎:https://www.zhihu.com/people/boypet。
致谢
本书内容基于我十余年风险建模和风控策略经验。首先要感谢领我进门的前辈,既包括我工作过的公司的领导、技术专家和业务专家,也包括在我参与过的20余个大中型银行项目实施过程中与我深入交流的行方领导和业务专家。
特别感谢上海交通大学上海高级金融学院李祥林(David X. Li)教授、乐信集团首席风控官乔杨先生和同盾科技副总裁余旭鑫博士百忙之中抽出时间为本书作序。李祥林教授是信用风险特别是信用衍生品估值定价领域的知名学者和行业领先实践者,其基于Copula的信用衍生品定价原理在行业得到广泛应用。乔杨先生曾在Discover和京东数科工作多年,他撰写的《数据化风控》是风控建模从业者必读参考书。余旭鑫博士很重视咨询的专业性和价值,对于模型风险有独到见解,是国内模型风险管理(MRM)的积极倡导者。
其次感谢来自智能风控和数据分析行业交流圈的朋友。我一直推崇“三人行,必有吾师”之训,非常乐于参与或组织行业交流,也有幸认识了许多业内同行,在交流过程中思想的碰撞对我有很大启发。
感谢机械工业出版社华章公司的策划编辑杨福川,他在近一年的时间中不断地鼓励我,并对本书的写作提出了一些建设性的意见。感谢本书责任编辑韩蕊,她认真审校了全书,并提出了不少中肯的建议。
最后感谢我的妻子邢梦娟和我的女儿。写作需要牺牲不少陪伴家人的时间,她们非常理解和支持我;写作是一个既享受又折磨人的过程,她们给予我不少鼓励和督促。
张伟(笔名:上善若愚)
2021年11月