基于粒子群算法的文档模糊均值聚类分析
文档聚类随着网上文本数量的激增以及实际应用中的需求,引起了人们广泛的关注,迅速发展成为人工智能领域的一个研究课题.以关键词在文档中出现的频度与文档长度之比作关键词隶属度,将M篇文档中前N个出现频率最大的关键词作为文档隶属度的特征属性,由M篇文档隶属度构成文档模糊聚类模式样品集.在模糊均值聚类算法中嵌入PSO算法,使得总的类内离散度达到最小,从而获取最佳文档聚类.实验结果表明,将PSO算法应用于文档聚类问题可以获得较佳的聚类结果.
关键词隶属度、文档隶属度、均值聚类、文档聚类、粒子群算法
30
TP301.6(计算技术、计算机技术)
湖南省自然科学基金项目06jj50109
2009-05-12(万方平台首次上网日期,不代表论文的发表时间)
共3页
1446-1448