适合大规模数据集的增量式模糊聚类算法
FCPM算法已被成功地应用到模糊系统建模上,但其在某一类的聚类中心已知的大规模数据上的聚类性能较差。为了避免这个缺点,参照单程模糊c均值( SPFCM)聚类算法、在线模糊c均值( OFCM)聚类算法,提出了适合大规模数据集的增量式模糊聚类算法(Incremental fuzzy (c+p)?means clustering ,IFCM(c+p))。通过在每个数据块中使用FCPM算法进行聚类,把每个数据块的聚类中心及其附近的一些样本点加入到下一个数据块参与聚类,同时添加平衡因子以提高算法聚类性能。同SPFCM、OFCM以及rseFCM算法相比,IFCM( c+p)对初始聚类中心不敏感。实验表明在没有花费很多运行时间的情况下,IFCM( c+p)算法的聚类性能比SPFCM算法和rseFCM算法更具优势,因此该算法更适合处理某一类聚类中心已知的大规模数据集。
增量式模糊聚类、FCPM、IFCM(c+p)、平衡因子、大规模数据集
11
TP391.4(计算技术、计算机技术)
国家自然科学基金项目61272210.
2016-05-23(万方平台首次上网日期,不代表论文的发表时间)
共12页
188-199