10.3969/j.issn.1000-3428.2006.05.003
TGFCM:基于模糊聚类的中文文本挖掘的新方法
提出一种新的动态模糊聚类的方法,针对传统的模糊聚类需要预先确定聚类数的问题,提出采用动态自组织映射神经网络来确定聚类数,并通过文本向量空间模型和TFoIDF方法来确定文本的特征向量,再将动态自组织映射神经网络得到的聚类数,用模糊C均值算法(FCM)函数处理,得到聚类的结果.该算法同仅用动态自组织映射神经网络算法的运行结果相比,具有运行聚类结果精度高的优点,模糊聚类更适合处理语义的多样性和文本归属的模糊性,实验验证了算法的有效性.
自组织映射网络、文本特征向量、模糊聚类、聚类数
32
TP312(计算技术、计算机技术)
中国科学院资助项目60275020
2006-04-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
7-9