融合改进二元萤火虫算法和互补性测度的集成剪枝方法
差异性和平均精度是提高分类器集成性能的两个重要指标.增加差异性势必会降低平均精度,增大平均精度一定会减小差异性.故在差异性和平均精度之间存在一个平衡状态,使得集成性能最优.为了寻找该平衡状态,该文提出融合改进二元萤火虫算法和互补性测度的集成剪枝方法.首先,采用bootstrap抽样方法独立训练出多个基分类器,构建原始基分类器池.其次,采用互补性测度对原始基分类器池进行预剪枝.接着,通过改进萤火虫的移动方式和搜索过程,引入重新初始化机制和跳跃行为,提出改进二元萤火虫算法.最后,采用改进二元萤火虫算法对预剪枝后的基分类器,进行进一步剪枝,选择出集成性能最优的基分类器子集合.在5个UCI数据集上的实验结果表明,较其他方法,使用较少的基分类器,获得了更优的集成性能,具有良好的有效性和显著性.
萤火虫算法、互补性测度、集成剪枝
40
TP391(计算技术、计算机技术)
国家自然科学基金91546108,71271071,71490725,71301041;国家重点研发计划2016YFF0202604;过程优化与智能决策教育部重点实验室开放课题
2018-11-28(万方平台首次上网日期,不代表论文的发表时间)
共9页
1643-1651