DOI：10.11772/j.issn.1001-9081.2019010075

结合主动学习和密度峰值聚类的协同训练算法

引用

摘要：

针对协同训练算法对模糊度高的样本容易标记错误导致分类器精度降低和协同训练在迭代时选择加入的无标记样本隐含有用信息不够的问题,提出了一种结合主动学习和密度峰值聚类的协同训练算法.在每次迭代之前,先选择模糊度高的无标记样本主动标记后加入有标记样本集,然后利用密度峰值聚类对无标记样本聚类得到每个无标记样本的密度和相对距离.迭代时选择具有较高密度和相对距离较远的无标记样本交由朴素贝叶斯(NB)分类,反复上述过程直到满足终止条件.利用主动学习标记模糊度高的样本能够改善分类器误标记识别问题,利用密度峰值聚类能够选择出较好表现数据空间结构的样本.在UCI的8个数据集和Kaggle的pima数据集上的实验表明,与SSLNBCA算法相比,所提算法的准确率最高提升6.7个百分点,平均提升1.46个百分点.

关键词：协同训练、主动学习、密度峰值、朴素贝叶斯、视图

所属期刊栏目：39

分类号：TP181(自动化基础理论)

资助基金：重庆市自然科学基金资助项目cstc2014jcyjA40011;重庆市教委科技项目KJ1400513;重庆师范大学科研项目YKC17001,YKC19018

在线出版日期：2019-09-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：2297-2301

英文信息展示

期刊专题