基于反向标定合成数据的改进集成算法

引用

摘要：

面对获得的数据量越来越多,需要处理的数据类型也不尽相同,因此就需要寻找一种具有较好泛化性能和较高分类精度的算法.该文提出一种通过借用反向扩充训练数据样本对输入数据类型的不敏感性和径向基函数网络模型快速学习的能力来进行集成的混合算法.采用渐进P值作为受试者特征曲线下面积与0.5判断冗余特征的标准,将反向标定合成的新数据对分类器进行训练,通过比较训练误差的变化来决定新分类器的添加,最终以绝大多数投票方法对所有的分类器进行决策融合.最后以UCI数据为实验,结果表明该算法可以较好地适应于不同数据类型,得到比其它集成算法更高的分类精度.

关键词：集成算法、径向基函数神经网络、反向扩充训练数据样本、投票法、ROC曲线

所属期刊栏目：33

分类号：TP274(自动化技术及设备)

资助基金：国家科技支撑计划2006BAB14B05资助课题

在线出版日期：2011-10-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1475-1480

英文信息展示

期刊专题