仿EM的多变量缺失数据填补算法及其在信用评估中的应用
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.16381/j.cnki.issn1003-207x.2019.03.002

仿EM的多变量缺失数据填补算法及其在信用评估中的应用

引用
数据缺失会显著降低信用评估模型的准确性和可用性,尤其是多变量同时有数据缺失时.本文针对模型应用阶段的多变量数据缺失问题,提出了一种新的数据填补算法.该算法由两阶段构成:准备阶段和数据填补阶段.在准备阶段,算法基于朴素贝叶斯方法以初始数据集进行训练,对每个可能缺失的变量构建起相应的单变量预测估计模型;而数据填补阶段则借鉴了EM算法的思想,利用前期的单变量预测估计模型,对给定的多变量数据缺失样本进行交替迭代,逐步填补更新.理论证明,该算法具有单调收敛性.以人人贷数据集和UCI提供的德国和澳大利亚两个信用评估基准数据集为例,将其与众数填补法、EM填补法进行性能对比实验,结果表明本文方法的数据还原性能和填补后信用评估准确性都明显更优.这为解决信用评估时的数据多变量缺失问题提供了一种更好的处理方法.

EM算法、信用评估、数据缺失、数据挖掘

27

F830.91(金融、银行)

国家自然科学基金重点资助项目71431008;国家自然科学基金应急项目71850012;教育部人文社会科学研究规划基金资助项目18YJAZH038

2019-05-16(万方平台首次上网日期,不代表论文的发表时间)

共9页

11-19

相关文献
评论
暂无封面信息
查看本期封面目录

中国管理科学

1003-207X

11-2835/G3

27

2019,27(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn