信用评估中的特征选择方法研究
特征(变量)选择是信用评估中常用的一种数据降维技术,然而传统的基于相关性的特征选择方法(CFS)在计算变量间相关系数时,本质上是一种线性分析方法,无法有效处理非线性关系的数据,导致不能准确估计变量间相关性的大小.本文在分析CFS方法的基础上,引入Gebelein最大相关系数(GMC),提出了一种非线性相关性特征选择方法——基于Gebelein最大相关性特征选择方法(GCFS).在此基础上,结合支持向量机(SVM)技术,构建了GCFS-SVM评估模型.该模型能有效地识别变量间的非线性相关关系,更真实估计变量间相关系数大小,从而筛选出最优变量子集,最终提高模型评估预测能力.为验证本文所提方法的效果,通过对两个公开的信用数据集的实证研究,结果表明:与其他方法相比,本文提出的GCFS方法能显著改善信用评估模型预测性能,提高模型判别能力,本研究成果也为信用评估模型的构建提供了一种新的思路和有益的参考.
信用评估、特征选择、GMC、支持向量机
33
F224.9(经济计算、经济数学方法)
广东省哲社科十一五规划项目;中央高校基本科研业务费专项
2016-01-21(万方平台首次上网日期,不代表论文的发表时间)
142-155