基于特征选择的数据流聚类
在数据流聚类时,冗余特征会影响数据的聚类质量,移除冗余特征以提高聚类质量就显得尤为重要.为解决此问题,提出一种基于特征选择的数据流聚类算法(DSCFC).该算法应用了特征排序、特征等级评定、探测冗余不重要的特征、移除冗余特征算法等.实验结果表明,DSCFC算法能探测出数据流中隐含的冗余特征并移除冗余特征,在对有冗余特征的数据流聚类时,比CluSteam算法更有效,聚类质量更好.
数据流聚类、特征选择、冗余特征、代价矩阵、特征移除
31
TP391(计算技术、计算机技术)
国家自然科学基金项目10871031、60474070;湖南省科技计划基金项目2008FJ3015
2010-12-02(万方平台首次上网日期,不代表论文的发表时间)
共4页
4235-4237,4241