10.3321/j.issn:1002-8331.2006.08.049
模糊聚类在中文文本分类中的应用研究
将基于等价关系的模糊聚类技术应用于中文文本分类,提出了基于模糊聚类的中文文本分类算法ATCFC.该算法利用基于二级字索引的正向最大匹配算法对文本分词,建立模糊特征向量空间模型,使用贴近度法刻划文本间的相似度.利用算法ATCFC对文本集合进行动态聚类实验,实验结果表明算法ATCFC对于中文文本分类是可行、有效的.
模糊聚类、文本分类、贴近度、模糊等价矩阵
42
TP311(计算技术、计算机技术)
江苏省重点实验室基金KJS03064
2006-04-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
170-172,177