数据化风控:信用评分建模教程
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第三节 样本期间、好坏客户定义

要想确定信用评分模型开发所需的数据期间长度,一般会从最新资料的留存时点开始推算,并利用账龄分析(Vintage Analysis)观察目标客户的违约成熟期长度,借此设定表现期间的长度。以开发信用卡行为评分为例,假使我们观察到正常客户一般在12个月后转坏比例趋于稳定,则其表现期间为12个月。

资料期间的区段及定义将在以后的章节中详细说明,在此需特别提醒读者:开发申请评分模型所需观察期间为搜集各月份申请案件,而行为评分模型所需观察期间,则是先确定资料快照(Snapshot)作为观察时点,其观察期间则是指该时间点过去N个月内的行为表现。图2-1分别以12个月的长度作为观察期间与表现期间,若是行为评分,则是以观察时点2001年12月31日过去12个月的行为表现作为自变量来源;若是申请评分,则是以2001年1月至2001年12月即过去12个月的申请,分别对应12个月的表现时点。例如,2001年1月的申请,其表现时点对应为2002年1月31日。

图2-1 样本期间

一、观察时点(Observation Point)

观察时点是指评分卡项目中,所需样本选取的时间点。该时点下的客户信息即是评分模型用来评价客户的信用水平及预测客户未来是否发生违约的重要参考。不过要注意的是,必须将观察期间内符合政策拒绝条件与排除条件的样本排除在开发样本外。

二、观察期间(Observation Period)

观察期间是指开发样本过去的信用状况与缴款记录,该期间,样本的相关信息都是开发信用评分模型的重要参考,也是组成模型的基本架构。

三、表现时点(Outcome Point)

表现时点是开发单位最终判断选取样本属于好坏客户,或是无法决定客户的时间点。

四、表现期间(Outcome Period)

表现期间是指开发样本与本行往来的信用状况,以供模型开发单位于表现时点判断样本的好坏属性,客户发生违约的情况会经过一段时间而趋于稳定成熟,所以,表现期间的长度至少需要与成熟期一致甚至更长才行。

所有合格的开发样本均由其绩效表现决定。可能的表现表现共有3类:好(Good)、坏(Bad)和不确定(Indeterminate),任一开发样本皆需依序检视其表现期间是否符合好坏件定义指标(G/B Indicator),继而判定其表现表现。

信用风险评分模型样本的绩效表现一般主要是依据其账户延滞状况决定的。然而,由于产品特性的不同,不同产品可能有不同的坏件定义,代表着不同的延滞程度。例如,担保型贷款产品的客户在前期延滞期间还款的概率仍然很高,因此,在坏件定义上,采取的延滞程度标准往往比无担保产品宽松(一般而言,有担保常用120天,无担保则用90天)。

为了判定绩效表现,最初,会以产品延滞严重程度下定义,而后再由表2-1所示的滚动率分析来观察样本属性在经过一段时间后,是否会产生偏移变化,并以此决定好(Good)、坏(Bad)或不确定(Indeterminate)的定义(见表2-2)。

滚动率分析的二维分析表可以协助分析人员了解样本属性在不同时间内好坏比例的变化,借此观察样本的好坏定义指针是否需要进行调整。表2-1滚动率二维分析的纵轴为初始观察12个月的表现表现,横轴则是继续再观察6个月后的表现表现。以第一列Gb Ind 12为B01的数据来说明,385件案例中经过6个月的表现表现100%仍是维持在B01的状态,显示其由坏转好的比例为0,可以确切认定其为坏(Bad)。然而,随着GB Ind 12的延滞程度趋缓,好坏区分会越来越难界定。例如,I16的305件案例中,有42件在6个月后会落入B01至B13的状态,转坏比例是13.77%。对于I16的客户究竟是列为好(Good)、坏(Bad)还是不确定(Indeterminate),则要视产品人员对此比例的容忍程度而定。

表2-1 滚动率二维分析表

表2-2 好坏件定义指标(G/B Indicator)