10.3778/j.issn.1673-9418.1507102
复杂分布数据的半监督阶段聚类
半监督聚类是一种用先验信息完善聚类过程的机器学习方法。通过将元胞自动机(cellular automata, CA)距离变换算法引入到半监督聚类过程中,采用平面距离变换算法将数据集划分为若干子类,获得聚类数和约束信息,并作为下一阶段聚类的先验信息。利用半监督K-means聚类算法对第一阶段的聚类结果做进一步划分,可以获得完整的聚类中心和聚类数,并由此提出CA-K-means二阶段聚类算法。采用3组人工数据集和3组标准UCI数据集进行对比仿真实验,将CA-K-means二阶段聚类算法与半监督K-means聚类算法、遗传K-means聚类算法和单纯的CA层次聚类算法进行对比,结果显示,该算法对复杂分布数据的聚类准确率较高,聚类性能更加优良。
元胞自动机、半监督聚类、K-means聚类算法、CA-K-means二阶段聚类、复杂分布
10
TP181(自动化基础理论)
The Natural Science Foundation of Shaanxi Province under Grant No.2014JM8353
2016-08-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
1003-1009