一种新的并行自动聚类算法:CGC-Cluster
针对基于基因表达式编程的自动聚类算法聚类速度较慢和聚簇质量较差的问题,提出一种新的并行自动聚类算法:基于统一计算设备架构和粗粒度并行模型的基因表达式编程自动聚类算法(CGC-Cluster).采用GRCM方法对基于基因表达式编程的自动聚类算法(GEP-Cluster)中聚类中心的筛选与聚合步骤进行了改进,基于统一计算设备架构以达到提高并行处理能力,基于粗粒度并行演化模型以提高并行度.选择了较知名的数据集,从算法的聚类速度和聚类质量两方面与GEP-Cluster算法进行了统计实验对比分析,实验结果表明,CGC-Cluster算法不仅获得了3倍左右的加速比,而且从簇内方差、Ocq指标和Dunn指标三种评判质量的指标进行比较,CGC-Cluster显著地改进了聚簇的质量.最后还通过实验分析了算法参数对并行算法的影响.
统一计算设备架构、基因表达式编程、聚类算法、并行演化算法
36
TP301(计算技术、计算机技术)
国家自然科学基金项目61305079,61203306,61305086,61165004;福建省杰出青年培育计划项目JA12471;福建师范大学青年骨干教师培育计划项目fjsdjk2012083;武汉大学软件工程国家重点实验室开放基金项目SKLSE2012-09-28;福建省教育厅项目JA13400
2016-09-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
1181-1187