10.16208/j.issn1000-7024.2016.03.016
含缺失属性值的问题数据检测与修复
为更加准确地对问题数据进行检测及修复,针对存在属性值缺失的情况,提出综合利用数据质量规则与 Fellegi‐Holt方法进行数据质量检查的策略。针对不同的检测需求,分别设计以问题数据定位和问题数据修复为目标的检测算法,提出相应算法以解决问题数据的修复以及缺失数据的填充问题。分别利用实例数据与生成数据进行实验,实验结果表明,该方法对问题数据进行检测的召回率和准确率有明显优势,两种检测策略在进行问题数据检测时的效率也有较大差异。
属性值缺失、数据规则、Fellegi-Holt、数据修复、数据填充
37
TP311(计算技术、计算机技术)
国家自然科学基金项目61371196;中国博士后科学基金特别基金项目201003797
2016-04-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
643-649