DOI：10.11834/jig.20150210

主动学习的多标签图像在线分类

引用

摘要：

目的在多标签有监督学习框架中,构建具有较强泛化性能的分类器需要大量已标注训练样本,而实际应用中已标注样本少且获取代价十分昂贵.针对多标签图像分类中已标注样本数量不足和分类器再学习效率低的问题,提出一种结合主动学习的多标签图像在线分类算法.方法基于min-max理论,采用查询最具代表性和最具信息量的样本挑选策略主动地选择待标注样本,且基于KKT (Karush-Kuhn-Tucker)条件在线地更新多标签图像分类器.结果在4个公开的数据集上,采用4种多标签分类评价指标对本文算法进行评估.实验结果表明,本文采用的样本挑选方法比随机挑选样本方法和基于间隔的采样方法均占据明显优势;当分类器达到相同或相近的分类准确度时,利用本文的样本挑选策略选择的待标注样本数目要明显少于采用随机挑选样本方法和基于间隔的采样方法所需查询的样本数.结论本文算法一方面可以减少获取已标注样本所需的人工标注代价;另一方面也避免了传统的分类器重新训练时利用所有数据所产生的学习效率低下的问题,达到了当新数据到来时可实时更新分类器的目的.

关键词：多标签分类、主动学习、在线学习、min-max理论

所属期刊栏目：20

分类号：TP37(计算技术、计算机技术)

资助基金：国家自然科学基金项目61272214,61173104

在线出版日期：2015-04-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：237-244

英文信息展示

期刊专题