10.11772/j.issn.1001-9081.2014.11.3144
基于主题的Web文本聚类方法
针对传统Web文本聚类算法没有考虑Web文本主题信息导致对多主题Web文本聚类结果准确率不高的问题,提出基于主题的Web文本聚类方法.该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题Web文本的聚类.相对于传统的Web文本聚类算法,所提方法充分考虑了Web文本的主题信息.实验结果表明,对多主题Web文本聚类,所提方法的准确率比基于K-means的文本聚类方法和基于《知网》的文本聚类方法要好.
多主题、Web文本、聚类、特征词、准确率
34
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目61272111,61202031,61273216,61202032;湖北省自然科学基金资助项目2013CFB002,2013CFA115;武汉市科技攻关计划项目201210621214,201210421132
2015-01-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
3144-3146,3151