基于投影的鲁棒低秩子空间聚类算法
随着大数据时代的来临,如何对海量高维数据进行有效的聚类分析并充分利用,已成为当下的热门研究课题.传统的聚类算法在处理高维数据时,聚类结果的精确度和稳定性较低,而子空间聚类算法通过分割原始数据的特征空间来得到不同的特征子集,可以大幅减小数据之间不相关特征对聚类结果的影响,挖掘出高维数据中不易展现的信息,在处理高维数据时具有显著的优势.针对现有基于图的子空间聚类算法在处理未知类型噪声以及复杂的凸问题时存在局限性的问题,在子空间聚类算法的基础上,结合空间投影理论,提出了一种基于投影的鲁棒低秩子空间聚类算法.首先对原始数据进行投影,利用编码消除投影空间的噪声,并对缺失的数据进行弥补;然后利用一种新的方法l2图来构造稀疏相似图;最后在l2图的基础上进行子空间聚类.该算法不需要对噪声的类型具有先验知识,且l2图能够很好地描述高维数据稀疏性和空间分散的特征.选取3种人脸数据集作为实验数据集,首先确定影响聚类效果的最优参数,然后从准确度、鲁棒性、时间复杂度3个方面对算法进行验证.实验结果表明,在3种人脸数据集中混入未知类型的噪声时,该算法具有较高的准确率和较低的时间复杂度,并且具有好的鲁棒性.
高维数据、噪声、子空间聚类、空间投影、l2图
47
TP311(计算技术、计算机技术)
国家自然科学基金51307140
2020-07-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
92-97