10.11772/j.issn.1001-9081.2018020375
基于概率模型的非均匀数据聚类算法
针对传统K-means型算法的“均匀效应”问题,提出一种基于概率模型的聚类算法.首先,提出一个描述非均匀数据簇的高斯混合分布模型,该模型允许数据集中同时包含密度和大小存在差异的簇;其次,推导了非均匀数据聚类的目标优化函数,并定义了优化该函数的期望最大化(EM)型聚类算法.分析结果表明,所提算法可以进行非均匀数据的软子空间聚类.最后,在合成数据集与实际数据集上进行的实验结果表明,所提算法有较高的聚类精度,与现有K-means型算法及基于欠抽样的算法相比,所提算法获得了5%~50%的精度提升.
聚类、概率模型、非均匀数据、均匀效应
38
TP311(计算技术、计算机技术)
国家自然科学基金资助项目61672157;福建师范大学创新团队项目IRTL1704
2018-11-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
2844-2849,3029