10.3969/j.issn.1007-757X.2009.08.009
ISOMAP在中文文本聚类分析中的应用
文本聚类中,文本特征向量的高维性使得对样本统计特征的评估十分困难,所以有必要进行有效的维数约简.ISOMAP是一类新近出现的非线性维数约简方法,可以有效地对文本特征空间进行降维处理,该方法改进了样本向量之间的距离度量,用测地距离代替传统的欧式距离,将高维的文本特征数据映射到2~3维的低维可视化空间上,达到数据降维目的,实现文本数据特征可视化,并在一定程度上解决聚类数问题.最后通过实例,验证了方法的可行性.
文本聚类、等容特征映射、降维、数据可视化
25
TP393(计算技术、计算机技术)
2009-11-09(万方平台首次上网日期,不代表论文的发表时间)
共3页
25-26,29