DOI：10.3969/j.issn.1000-3428.2006.05.003

TGFCM:基于模糊聚类的中文文本挖掘的新方法

引用

摘要：

提出一种新的动态模糊聚类的方法,针对传统的模糊聚类需要预先确定聚类数的问题,提出采用动态自组织映射神经网络来确定聚类数,并通过文本向量空间模型和TFoIDF方法来确定文本的特征向量,再将动态自组织映射神经网络得到的聚类数,用模糊C均值算法(FCM)函数处理,得到聚类的结果.该算法同仅用动态自组织映射神经网络算法的运行结果相比,具有运行聚类结果精度高的优点,模糊聚类更适合处理语义的多样性和文本归属的模糊性,实验验证了算法的有效性.

关键词：自组织映射网络、文本特征向量、模糊聚类、聚类数

所属期刊栏目：32

分类号：TP312(计算技术、计算机技术)

资助基金：中国科学院资助项目60275020

在线出版日期：2006-04-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：7-9

英文信息展示

期刊专题