将KFCM算法应用于源代码挖掘的研究
为解决软件工程数据量大、属性多且多为离散型数据的特点,提高软件工程数据的挖掘效率,寻求更快速、高效的聚类算法,提出了将基于核函数的模糊聚类算法应用于源代码挖掘;同时采用TF-IDF方法对离散型文本数据进行处理,解决了核模糊聚类算法不能对文本数据直接进行聚类的问题.将遗传算法与KFCM算法相结合,克服了KFCM只能求解局部极小值的问题.实验结果表明,改进的KFCM算法对软件工程数据的挖掘有很好的聚类效果,且有较高的效率.
源代码挖掘、特征空间、核函数、遗传算法、目标函数
31
TP301.6(计算技术、计算机技术)
2010-08-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
2249-2252