10.19335/j.cnki.2095-6649.2021.4.028
基于分布式KNN分类器的大数据分类处理方法设计
大数据时代的到来在一定程度上加剧了数据量的赋存,为此提出一种基于分布式KNN分类器的大数据分类处理方法.引进分布式KNN分类器,对大数据回归任务进行聚类处理,使用KNN算法对未知项进行检索,以欧几里德距离作为度量的标准,导出欧几里德距离计算结果,完成对任务的聚类.同时,整合MR框架,定义一个value处理键,将待分类的样本数据进行Map映射处理,规范大数据分类处理流程,当样本数据集合与中间key具备直接关联时,执行分类处理行为,完成对大数据分类处理方法的设计.在此基础上,设计对比实验证明设计的基于分布式KNN分类器的大数据分类处理方法,具有更高的处理效率.
分布式KNN分类器;大数据;分类处理方法;聚类处理
11
TP391(计算技术、计算机技术)
2021-12-15(万方平台首次上网日期,不代表论文的发表时间)
共2页
72-73