基于主动学习和半监督学习的多类图像分类

引用

摘要：

多数图像分类算法需要大量的训练样本对分类器模型进行训练.在实际应用中,对大量样本进行标注非常枯燥、耗时.对于一些特殊图像,如合成孔径雷达(Synthetic aperture radar,SAR)图像,对其内容判读非常困难,因此能够获得的标注样本数量非常有限.本文将基于最优标号和次优标号(Best vs second-best,BvSB)的主动学习和带约束条件的自学习(Constrained self-training,CST)引入到基于支持向量机(Support vector machine,SVM)分类器的图像分类算法中,提出了一种新的图像分类方法.通过BvSB主动学习去挖掘那些对当前分类器模型最有价值的样本进行人工标注,并借助CST半监督学习进一步利用样本集中大量的未标注样本,使得在花费较不标注代价情况下,能够获得良好的分类性能.将新方法与随机样本选择、基于熵的不确定性采样主动学习算法以及BvSB主动学习方法进行了性能比较.对3个光学图像集及1个SAR图像集分类问题的实验结果显示,新方法能够有效地减少分类器训练时所需的人工标注样本的数量,并获得较高的准确率和较好的鲁棒性.

关键词：主动学习、半监督学习、支持向量机、图像分类

所属期刊栏目：37

分类号：TP391.41(计算技术、计算机技术)

资助基金：国家高技术研究发展计划863计划2007AA12Z155;国家自然科学基金40901207;测绘遥感信息工程国家重点实验室专项科研经费;中央高校基本科研业务费专项资金资助

在线出版日期：2012-01-11（万方平台首次上网日期，不代表论文的发表时间）

页码：954-962

英文信息展示

期刊专题