10.3969/j.issn.1006-9348.2016.10.099
网络环境中不完整数据挖掘方法研究与仿真
传统的挖掘算法,对网络存储中的数据特征分类缺乏精确性,存在不完整数据挖掘误差大的问题.提出采用基于决策树的网络存储中的不完整数据挖掘方法.先对网络存储数据源进行预处理,形成决策树训练集,获取网络存储中每个数据属性的信息增益率,在对网络存储中数据的分支属性进行选择,得到各个数据类型的样本数量及样本权重及空间相似度,对网络存储中的不完整数据的可用性进行判断,预测网络存储中的不完整数据中未知属性的值,实现对网络存储中的不完整数据挖掘.仿真结果表明,采用改进的挖掘算法相比传统的挖掘算法提高了挖掘精确度和分类精确度,降低了误差率,间缩短了挖掘时,提高了挖掘效率,具有一定的优越性.
网络存储、不完整数据、数据挖掘
33
TP315(计算技术、计算机技术)
2016-12-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
454-457