10.3778/j.issn.1673-9418.1806016
K-means型多视图聚类中的初始化问题研究
在K-means型多视图聚类算法中,最终的聚类结果会受到初始类中心的影响.因此研究了不同的初始中心选择方法对K-means型多视图聚类算法的影响,并提出一种基于采样的主动式初始中心选择方法(sampled-clustering by fast search and find of density peaks,SDPC).该方法通过对数据集进行均匀采样,利用密度峰值快速搜索聚类算法(clustering by fast search and find of density peaks,DPC),以及K-means再迭代策略,进一步改善多视图聚类中的初始中心选择效率和类个数问题.实验验证了不同初始化方法对K-means型多视图聚类算法的影响.多视图基准数据集上的实验结果表明:全局(核)K-means初始化方法存在时间复杂度过高的问题,AFKMC2(assumption-free K-Markov chain Monte Carlo)初始化适用于大规模数据,DPC可以主动选择类个数和初始类中心,SDPC较DPC而言,不仅能主动式获得类个数,还在聚类精度和效率上取得了较好的折衷.
多视图、类初始化、聚类
13
TP301(计算技术、计算机技术)
The General Program of the National Natural Science Foundation of China under Grant Nos. 61473030, 61632004;the Fundamental Research Funds for the Central Universities of China under Grant No. 2017JBM023
2019-05-16(万方平台首次上网日期,不代表论文的发表时间)
共12页
574-585