10.3772/j.issn.1000-0135.2011.06.012
基于信息熵的改进型支持向量机客户流失预测模型应用研究
客户流失数据是一类的非平衡数据集,如何有效地对其进行分类学习,其关键是要提高少数类(流失客户)的识别率,少数类是相对多数类而言的一类特殊的子样本,其错分的代价非常高,因此,有效地减少少数类的错分率是一个亟待解决的问题.本文在Veropoulous提出的采用不同惩罚因子数的支持向量机算法基础上,利用样本自身信息熵值来确定不同的惩罚因子,使模型更加倾向于提高少数类的识别精度,并在电信客户流失数据这一非平衡数据集中进行了验证,结果表明该方法较其他方法对流失客户(少数类)的识别率有很大的提高,具有很强的实际应用意义.
支持向量机、不平衡数据、信息熵、分类预测、客户流失
30
TP3;F62
:博士点基金,网格环境下复杂决策问题的协同求解与支持系统研究200803590007;国家自然科学基金重大研究项目90718037;国家自然科学基金重点研究项目70631003
2011-08-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
643-648