10.3969/j.issn.1006-9348.2019.02.078
大数据分析下劣质用户数据动态清理方法仿真
在大数据分析下对劣质用户数据进行动态清理时,对提高数据的准确率具有重要意义.进行劣质用户数据的动态清理时,需对数据集的关联因子进行计算,确定数据集的限定阈值.针对传统方法主要根据数据的变量进行清理,导致清理效果差、准确率低的问题,提出基于SVM方法的劣质用户数据动态清理方法.根据劣质用户的输出数据,分析劣质用户数据处于不同数据集时的空间矩阵,利用数据清理因子和数据清理频率对数据集在不同子空间中的距离进行计算,并区分数据集的关联因子,确定关联因子与限定阈值之间的关系,建立清理模型,并利用劣质用户的离散数据计算数据的均值和方差,通过求得结果分析数据的置信区间,并计算数据的置信边界,获得数据的分类函数,实现对劣质用户数据的动态清理.仿真结果表明,提出方法在对劣质用户数据进行动态清理时,具有较好的清理效果和较高的准确率.
大数据分析、劣质用户数据、动态清理、方法
36
TP274(自动化技术及设备)
河北省教育厅高等学校科学研究计划项目作为第一资助Z2018209;中央高校基本科研业务费青年教师资助计划项目作为第二资助项Z2018209
2019-04-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
362-366