10.3969/j.issn.1001-7119.2014.06.074
高维数据下基于云平台的随机森林算法的研究与实现
随机森林算法在数据挖掘领域中得到了广泛的应用,该算法通过构建多个不同的决策树可以获得更高的分类结果。但是,随着数据规模的增大,人们开始接触到各大规模的数据以及更高维度的数据属性。传统的随机森林构建算法不能有效、快速地处理海量高维数据,严重影响了数据的分类效率,从而影响预测效率。本文针对高维、海量数据下随机森林构建算法,改进并提高了该算法的效率,提出了基于云计算平台的随机森林构建算法。该算法可以快速的完成数据分类预测,并通过实验结果进一步展示了该算法的效率以及可扩展性。
高维数据、海量数据、云平台、随机森林、决策树
TP393(计算技术、计算机技术)
江苏省现代教育技术研究2012年度课题2012-R-21903。
2014-07-09(万方平台首次上网日期,不代表论文的发表时间)
共3页
222-224