DOI：10.3969/j.issn.1000-3428.2014.09.050

基于样本抽样和权重调整的SWA-Adaboost算法

引用

摘要：

根据分类算法是依据样本区分度进行分类的原理，提出增加样本属性以提高样本区分度的方法，在样本预处理阶段对所有样本增加一个属性值dmin以加强样本之间的区分度。针对原始Adaboost算法在抽样阶段由于抽样不均而导致对某些类训练不足的问题，采用均衡抽样方法，保证在抽样阶段所抽取的不同类样本的数量比例不变。针对原始算法样本权重增长过快的问题，给出新的权重调整策略，引入样本错分计数量count( n)，有效地抑制样本权重增长速度。给出一种改进的Adaboost算法，即SWA-Adaboost算法，并采用美国加州大学机器学习UCI数据库中6种数据集的数据对改进算法与原始算法进行实验对比，结果证明，改进算法SWA-Adaboost在泛化性能上优于Adaboost算法，泛化误差平均降低9．54%。

关键词：样本预处理、均衡抽样、权重调整、泛化性能、类中心最小距离、样本区分度

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金资助项目51275030。

在线出版日期：2014-09-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：248-251,256

英文信息展示

期刊专题