一种新型多标记懒惰学习算法

引用

摘要：

在多标记学习框架下,每个样本由单个实例进行表示并同时对应于多个概念标记.已有的多标记懒惰学习算法并未充分考察样本多个标记之间的相关性,因此其泛化性能将会受到一定程度的不利影响.针对上述问题,提出一种新型多标记懒惰学习算法 IMLLA.该算法首先找出测试样本在训练集中与各个概念类对应的近邻样本,然后基于近邻样本的多标记信息构造一个标记计数向量,并提交给已训练的线性分类器进行预测.由于IMLLA 在对每个概念类进行预测时利用了蕴含于其他概念类中的信息,因而充分考察了样本多个标记之间的相关性.在人工数据集以及真实世界数据集上的实验表明,IMLLA 算法的性能显著优于常用的多标记学习算法.

关键词：机器学习、多标记学习、懒惰学习、功能基因组学、图像分类

所属期刊栏目：49

分类号：TP181(自动化基础理论)

资助基金：国家自然科学基金项目60805022,61175049;高等学校博士学科点专项科研基金新教师基金项目200802941009;东南大学优秀青年教师科学研究资助基金

在线出版日期：2013-01-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：2271-2282

英文信息展示

期刊专题