10.3969/j.issn.1001-3695.2014.05.013
用于大数据分类的KNN算法研究
针对KNN算法在处理大数据时的两个不足对其进行了研究,提出多层差分KNN算法。算法对已知样本根据类域进行分层,既避免了传统改进算法中剪辑样本带来的判别误差,又大大降低了无效的计算量;同时在最后一层采用差分的方法进行决策,而不是直接根据最近邻进行分类,大大提高了分类的准确性。实验结果表明,该算法在对样本容量大、涉及邻域多的大数据样本进行分类时能取得较好的分类效果。
大数据、KNN、差分多层
31
TP391;TP301.6(计算技术、计算机技术)
国家科技支撑计划;国家自然科学基金;江苏大学项目
2014-05-06(万方平台首次上网日期,不代表论文的发表时间)
共4页
1342-1344,1373