10.11772/j.issn.1001-9081.2019010129
伪标签置信选择的半监督集成学习视频语义检测
在视频语义检测中,有标记样本不足会严重影响检测的性能,而且伪标签样本中的噪声也会导致集成学习基分类器性能提升不足.为此,提出一种伪标签置信选择的半监督集成学习算法.首先,在三个不同的特征空间上训练出三个基分类器,得到基分类器的标签矢量;然后,引入加权融合样本所属某个类别的最大概率与次大概率的误差和样本所属某个类别的最大概率与样本所属其他各类别的平均概率的误差,作为基分类器的标签置信度,并融合标签矢量和标签置信度得到样本的伪标签和集成置信度;接着,选择集成置信度高的样本加入到有标签的样本集,迭代训练基分类器;最后,采用训练好的基分类器集成协作检测视频语义概念.该算法在实验数据集UCF11上的平均准确率到达了83.48%,与Co-KNN-SVM算法相比,平均准确率提高了3.48个百分点.该算法选择的伪标签能体现样本所属类别与其他类别的总体差异性,又能体现所属类别的唯一性,可减少利用伪标签样本的风险,有效提高视频语义概念检测的准确率.
视频语义概念检测、半监督、集成学习、伪标签、置信度
39
TP391.41(计算技术、计算机技术)
国家自然科学基金资助项目61672268;江苏省重点研发计划项目1721190141
2019-09-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
2204-2209