10.3969/j.issn.1006-9348.2020.07.079
基于特征选择的混合属性数据聚类挖掘仿真
传统算法对混合属性数据做聚类处理时,会出现大量不重要特征,从而影响数据聚类质量,使挖掘结果准确率和聚类纯度下降,造成聚类效果较差.因此提出基于特征选择的混合属性数据聚类挖掘算法,对在线聚类和离线聚类进行分析,采用数值型和分类型两种数据度量方法构建混合属性数据聚类挖掘模型,在此基础上,对数据进行预处理,通过数据紧致性和离散性加强聚类的质量,根据特征选择数据聚类算法更新聚类中心,移除冗余特征,且迅速找到最优子集,实现混合属性数据聚类挖掘.实验结果表明,上述算法能够提高混合属性数据聚类挖掘的准确率和聚类纯度,具有较好的聚类效果,可以广泛应用在现实生活中.
特征选择、混合属性、数据聚类、冗余特征、最优子集
37
TP391(计算技术、计算机技术)
河南省自然基金面上项目F2016038
2020-08-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
399-403