第三章
征信大数据探索
随着互联网技术的发展,大数据越来越受到关注,其应用逐步渗透到多个行业,也给征信行业带来了发展机遇。征信是现代金融体系的基础设施,征信的业务都是围绕着数据展开,所以大数据和征信有着天然的联系。利用大数据创新征信业务,对于拓宽征信市场的广度和宽度十分有益。但是,征信市场的发展,主流征信业务仍然占据主导地位,需要继续推广传统的征信产品在各领域的广泛应用。在美国等征信市场发达的国家,信用报告和信用评分的应用已经非常成熟,成为信贷风险管理各环节必不可少的参考。在我国,央行征信中心负责建设、运行和维护的金融信用信息基础数据库,近年来在信息采集、产品和服务方面成绩显著,接入系统的金融机构几千家,信贷信息的覆盖面已经相当高,服务渠道方面也推出了互联网服务。在产品创新方面,除了基本的信用报告产品外,目前个人信用报告数字解读、关联关系分析等多种产品已经在商业银行应用,金融信用信息基础数据库在促进信贷市场发展、提升金融机构信贷风险管理水平方面发挥了重要作用。
为了充分发挥征信大数据的作用,需要保持开放的心态,积极探索各类非传统的信用信息、大数据信用评分模型的应用。区别于主流的基于回归模型的信用评分模型,大数据信用评估更多地通过建立神经网络、决策树、随机森林、机器学习等模型,对于可获取的借款人的各类信息(公安户籍、学历学籍、水电煤缴费等公共政务信息,消费记录、出行、住宿、房产、车辆、职业等信息,以及互联网购物、转账、支付、人脉圈、行为习惯等)进行加工,针对不同的数据源找出各自最有效的算法,将多个弱关联特征变量组合成为一个强关联特征变量进入模型,力图开发出准确、稳定、普遍适用性和易理解的大数据信用评估模型。但就目前业界的研究和实践结果来看,传统信用数据仍然是最有用、不可比拟,非传统的信用数据的价值还需要在未来实践中逐步挖掘、评估,在模型开发过程中要特别注意数据的准确性、模型的公平性等问题。
总之,将征信大数据与大数据技术有机融合,可以在数据源、信用评估方法、应用途径等方面探索一些新的业务模式,进一步创新征信产品和服务的多样性。