一种基于少量标签的改进迁移模糊聚类
传统聚类算法难以利用已有的历史信息,尤其是数据被污染的情况下聚类结果不理想;半监督聚类常用于数据中有部分标签的情况。在源数据有少量标签的情况下,提出半监督混合C均值聚类算法( SS?FPCM);基于迁移学习框架,针对负迁移问题对算法进行修正,提出了防止负迁移的半监督迁移算法( TSS?FPCM);最后,为了充分借鉴源数据的信息,利用“代表点”来代替源数据类信息,融入算法中再次迁移得到改善的半监督迁移算法( ITSS?FPCM)。实验表明,3个算法能够有效的利用源数据提高聚类性能。 SS?FPCM与TSS?FPCM可以利用源数据的少量标签数据,而ITSS?FPCM算法结合了标签数据与“代表点”两个有效信息,在数据信息匮乏、数据被污染的情况下得到较好的聚类结果。
聚类、迁移学习、半监督、可能性C均值、模糊C均值
11
TP301(计算技术、计算机技术)
国家自然科学基金项目61170111,61572407,61134002;四川省科技支撑计划项目2014SZ0207.
2016-06-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
310-317