10.3969/j.issn.1006-2475.2013.09.007
基于AdaBoost的不完整数据的信息熵分类算法
目前,针对不完整数据的集成分类算法没有考虑缺失属性之间的差异,在衡量各个子分类器的权值时仅仅考虑了数据集的大小以及包含属性的多少,并没有考虑各个数据子集之间属性的差异度.本文利用信息熵对各个子数据集的重要程度进行量化,进而评估从该数据集构建出的分类器的权值,使得在最终的加权投票过程更加公平,最终结果更加准确.使用基于multi-class AdaBoost的集成分类算法,以BP算法为基础分类器,对来自UCI的数据集进行实验,实验结果表明该算法在一定程度上提高了不完整数据的分类精度.
multi-class AdaBoost、信息熵、不完整数据、集成分类
TP181(自动化基础理论)
2013-10-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
31-34