基于Kmeans++聚类的朴素贝叶斯集成方法研究
朴素贝叶斯方法简单、计算高效、精确度高,且具有坚实的理论基础,得到了广泛应用.文中针对差异性是集成学习的关键条件,提出了基于Kmeans++聚类技术来提高朴素贝叶斯分类器集成差异性的方法,从而提升了朴素贝叶斯的泛化性能.首先,通过训练样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用Kmeans++算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出.利用UCI标准数据集对该方法进行验证,结果表明该方法的泛化性能得到了较大的提升.
朴素贝叶斯、差异性、Kmeans++聚类、集成学习
46
TP391(计算技术、计算机技术)
国家自然科学基金51604038
2019-07-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
439-441,451