10.3969/j.issn.1672-9870.2017.01.027
基于MapReduce编程模型的改进KNN分类算法研究
采用一种属性约简算法,将待分类的数据样本进行两次约简处理--初次决策表属性约简和基于核属性值的二次约简.通过属性约简方法来删除数据集中的冗余数据,进而提高KNN算法的分类精度.在此基础上应用MapReduce并行编程模型,在Hadoop集群环境上实现并行化分类计算实验.实验结果表明,改进后的算法在集群环境下执行的效率得到很大提升,能够高效处理实验数据.实验执行的加速比也有明显提高.
KNN、属性约简、MapReduce编程模型、Hadoop
40
TP391(计算技术、计算机技术)
吉林省科技发展计划重点科技攻关项目20150204036GX
2017-04-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
110-114