10.3969/j.issn.1673-4785.201305033
基于 Tri-training 的半监督多标记学习算法
传统的多标记学习是监督意义下的学习,它要求获得完整的类别标记。但是当数据规模较大且类别数目较多时,获得完整类别标记的训练样本集是非常困难的。因而,在半监督协同训练思想的框架下,提出了基于Tri-training的半监督多标记学习算法( SMLT)。在学习阶段,SMLT引入一个虚拟类标记,然后针对每一对类别标记,利用协同训练机制Tri-training算法训练得到对应的分类器;在预测阶段,给定一个新的样本,将其代入上述所得的分类器中,根据类别标记得票数的多少将多标记学习问题转化为标记排序问题,并将虚拟类标记的得票数作为阈值对标记排序结果进行划分。在UCI中4个常用的多标记数据集上的对比实验表明,SMLT算法在4个评价指标上的性能大多优于其他对比算法,验证了该算法的有效性。
多标记学习、半监督学习、Tri-training
TP181(自动化基础理论)
国家“973”计划前期研究专项2011CB311805;山西省科技攻关计划资助项目20110321027-01;山西省科技基础条件平台建设项目2012091002-0101.
2013-12-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
439-445