DOI：10.11992/tis.201603046

一种基于少量标签的改进迁移模糊聚类

引用

摘要：

传统聚类算法难以利用已有的历史信息，尤其是数据被污染的情况下聚类结果不理想；半监督聚类常用于数据中有部分标签的情况。在源数据有少量标签的情况下，提出半监督混合C均值聚类算法（ SS?FPCM）；基于迁移学习框架，针对负迁移问题对算法进行修正，提出了防止负迁移的半监督迁移算法（ TSS?FPCM）；最后，为了充分借鉴源数据的信息，利用“代表点”来代替源数据类信息，融入算法中再次迁移得到改善的半监督迁移算法（ ITSS?FPCM）。实验表明，3个算法能够有效的利用源数据提高聚类性能。 SS?FPCM与TSS?FPCM可以利用源数据的少量标签数据，而ITSS?FPCM算法结合了标签数据与“代表点”两个有效信息，在数据信息匮乏、数据被污染的情况下得到较好的聚类结果。

关键词：聚类、迁移学习、半监督、可能性C均值、模糊C均值

所属期刊栏目：11

分类号：TP301(计算技术、计算机技术)

资助基金：国家自然科学基金项目61170111，61572407，61134002；四川省科技支撑计划项目2014SZ0207．

在线出版日期：2016-06-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：310-317

英文信息展示

期刊专题