DOI：10.3969/j.issn.1001-3695.2013.06.030

基于主动学习策略的半监督聚类算法研究

引用

摘要：

提出一种选择最富信息数据并予以标记的基于主动学习策略的半监督聚类算法.首先,采用传统K-均值聚类算法对数据集进行粗聚类；其次,根据粗聚类结果计算出每个数据隶属于每个类簇的隶属度,筛选出满足最大与次大隶属度差值小于阈值的候选数据,并从中选择差值较小的数据作为最富信息的数据进行标记；最后,将候选数据集合中未标记数据分组到与每类已被标记数据平均距离最小的类簇中.实验表明,提出的主动学习策略能够很好地学习到最富信息数据,基于该学习策略的半监督聚类算法在测试不同数据集时均获得了较高的准确率.

关键词：K-均值算法、主动学习策略、半监督学习、聚类

所属期刊栏目：30

分类号：TP181;TP301.6(自动化基础理论)

资助基金：吉林省教育厅"十二五"科学技术研究项目2011-8;吉林省科技发展计划项目20050703-1

在线出版日期：2013-08-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：1718-1720

英文信息展示

期刊专题