10.3969/j.issn.1002-1965.2010.11.037
基于《现代汉语语义分类词典》的文本聚类方法
给出了一种基于语义概念的高效中文文本聚类方法,该方法是从文本的本身出发,利用<现代汉语语义分类词典>的级类主题词,在高维的文本向量集中提取概念元组,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个文本的聚类过程.试验结果表明,该聚类算法有较好的聚类结果且有较高的执行效率.
中文文本、概念元组、聚类
29
TP391(计算技术、计算机技术)
淮安市科技局计划项目"基于语义的垃圾短信分类器设计与实现"HAG09061;淮阴工学院重点基金项目"短信文本智能分类主题提取研究"HGA0907
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
170-173,199