10.3969/j.issn.1672-9722.2018.08.005
混合条件属性的细化类别特征粒度系数聚类算法
混合条件属性对象的数据环境复杂.传统的聚类算法对分类和数值两类特征参数的相似性计算方法不存在任何相同或相关的处理点,且往往偏向于大幅度提取比例较高的条件属性的类别特征,而忽视存在更有价值的较低比例的一方.提出一种基于迭代的细化类别特征粒度系数聚类算法.根据分类条件属性的数量、特征参数的类别归属数量等,围绕熵的计算公式,细化它们在熵形态中对应的特征语义,进而定义分类条件属性针对不同类簇的粒度变量值;根据欧氏距离的计算形态,结合数值条件属性及其特征参数的数量因子,定义数值条件属性面向不同类簇的粒度变量值;融合描述特征参数的类别特性权重值,利用所得粒度值进行迭代,直至粒度系数稳定且获得最优聚类性能后结束.理论分析和多个UCI混合条件属性数据集实验表明,新算法能够较好地甄别出类别特征,有效地提高聚类性能.
混合条件属性、细化类别特征粒度系数、聚类
46
TP311(计算技术、计算机技术)
广东省茂名市科技计划项目2012B009
2018-09-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
1505-1510