主动学习的多标签图像在线分类
目的 在多标签有监督学习框架中,构建具有较强泛化性能的分类器需要大量已标注训练样本,而实际应用中已标注样本少且获取代价十分昂贵.针对多标签图像分类中已标注样本数量不足和分类器再学习效率低的问题,提出一种结合主动学习的多标签图像在线分类算法.方法 基于min-max理论,采用查询最具代表性和最具信息量的样本挑选策略主动地选择待标注样本,且基于KKT (Karush-Kuhn-Tucker)条件在线地更新多标签图像分类器.结果 在4个公开的数据集上,采用4种多标签分类评价指标对本文算法进行评估.实验结果表明,本文采用的样本挑选方法比随机挑选样本方法和基于间隔的采样方法均占据明显优势;当分类器达到相同或相近的分类准确度时,利用本文的样本挑选策略选择的待标注样本数目要明显少于采用随机挑选样本方法和基于间隔的采样方法所需查询的样本数.结论 本文算法一方面可以减少获取已标注样本所需的人工标注代价;另一方面也避免了传统的分类器重新训练时利用所有数据所产生的学习效率低下的问题,达到了当新数据到来时可实时更新分类器的目的.
多标签分类、主动学习、在线学习、min-max理论
20
TP37(计算技术、计算机技术)
国家自然科学基金项目61272214,61173104
2015-04-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
237-244