10.3969/j.issn.1006-9348.2018.10.089
面向大数据的多维数据缺失特征填补仿真研究
现有的数据缺失填补方法,通常只考虑数据间某种特征的关联性,且忽略了数据的填补顺序对数据填补准确性的影响.为此,提出一种基于数据多维相似度的数据缺失特征填补方法.通过计算缺失数据与另一已知数据的多维相似度,进一步计算缺失数据的加权值,来检验缺失数据与其对应的临界点的相似度融合情况;利用贝叶斯联合概率计算缺失数据间不同填补顺序的置信度,结合缺失数据与其临界点的相似度融合情况,选择最优置信度确定数据的填补顺序;采用KNN数据填补算法结合多维相似度计算缺失数据值,按顺序依次进行数据填补.仿真证明,所提方法可以更准确的计算缺失数据值,所需计算时间更短,同时对填补顺序进行计算,提高了数据填补的准确率,填补结果更接近原始数据.
大数据、多维数据特征、数据缺失
35
TP391(计算技术、计算机技术)
2018-12-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
432-435