DOI：10.3969/j.issn.1000-3428.2010.05.030

基于语义密度的文本聚类研究

引用

摘要：

结合文本数据的语义相似度,给出一种基于语义密度文本数据聚类的方法.根据文本数据的特点,从一个随机选定的文本对象出发,向文本数据最为密集的区域扩张,组织成一个能反映语料结构的有序序列进行聚类.在处理噪声文本数据的过程中,利用有效结果重组策略来辅助噪声文本数据重新定位.实验结果表明,该方法具有良好的聚类性能.

关键词：密度、簇、邻域、聚类

所属期刊栏目：36

分类号：TP311(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目60632050;2009年度淮安科技基金资助项目"基于语义的垃圾短信分类器设计与实现"HAG09061;淮阴工学院基金资助重点项目HGA0907

在线出版日期：2010-05-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：81-83

英文信息展示

期刊专题