10.16652/j.issn.1004-373x.2018.14.012
大数据集合中冗余特征排除的聚类算法设计
传统microRNA聚类算法对数据的新特征要求较高,未全面分析大数据集内的冗余特征,使得聚类结果均衡性差.因此,提出大数据集合中冗余特征排除的聚类算法,其采用聚类集成算法,在组构造时期通过使用一致的聚类算法抽取各种子集样本,实现大数据冗余特征的排除,获取排除冗余特征的大数据集聚类结果.对得到的大数据聚类特征分类能力以及特征关联性实施度量,采用基于特征聚类以及随机子空间的miRNA识别算法,实现大数据集合冗余特征的聚类.实验结果表明,所提算法具有较高的冗余数据排除性能,该算法下的大数据聚类效果优,具有较高的均衡性.
大数据集、冗余特征排除、聚类算法、特征关联性、随机子空间、miRNA识别算法
41
TN911-34;TP311
2014年度天津市教委科研计划项目20140811
2018-08-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
48-50,54