一种基于支持向量机的主动度量学习算法

引用

摘要：

度量学习是机器学习领域的重要研究内容.度量结果的优劣会直接影响后续机器学习算法的性能.目前大多度量学习的研究工作都是在有监督环境下进行的.然而,实际应用中往往存在大量数据没有标记或需要付出昂贵代价才能获得标记的问题.针对这一问题,提出一种适用于半监督环境的基于支持向量机的主动度量学习算法(ASVM2 L).首先,从待学习无标记样本中随机选择少量样本交予专家标注,再利用这些样本训练支持向量机度量学习器;然后,根据度量学习结果,采用不同K近邻分类器对剩余未标记样本进行分类评估,选择表决差异最大的样本交予专家标注,再加入训练集重新进行度量学习;重复执行上述步骤至满足终止条件,以保证在有限的标记样本子集下能获得最佳的度量学习矩阵.在标准数据集上的对比实验验证了所提ASVM2 L算法能在不影响分类精度的前提下,利用最少的标记样本获得更多的标记信息,因而具有更好的度量性能.

关键词：度量学习、支持向量机度量学习、半监督学习、主动学习、采样策略

所属期刊栏目：49

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金;中央高校基本科研业务费专项基金;中央高校基本科研业务费专项基金

在线出版日期：2022-06-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：113-118

英文信息展示

期刊专题