基于 Tri-training 的半监督多标记学习算法

引用

摘要：

传统的多标记学习是监督意义下的学习，它要求获得完整的类别标记。但是当数据规模较大且类别数目较多时，获得完整类别标记的训练样本集是非常困难的。因而，在半监督协同训练思想的框架下，提出了基于Tri-training的半监督多标记学习算法（ SMLT）。在学习阶段，SMLT引入一个虚拟类标记，然后针对每一对类别标记，利用协同训练机制Tri-training算法训练得到对应的分类器；在预测阶段，给定一个新的样本，将其代入上述所得的分类器中，根据类别标记得票数的多少将多标记学习问题转化为标记排序问题，并将虚拟类标记的得票数作为阈值对标记排序结果进行划分。在UCI中4个常用的多标记数据集上的对比实验表明，SMLT算法在4个评价指标上的性能大多优于其他对比算法，验证了该算法的有效性。

关键词：多标记学习、半监督学习、Tri-training

分类号：TP181(自动化基础理论)

资助基金：国家“973”计划前期研究专项2011CB311805；山西省科技攻关计划资助项目20110321027-01；山西省科技基础条件平台建设项目2012091002-0101．

在线出版日期：2013-12-04（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：439-445

英文信息展示

期刊专题