10.3969/j.issn.1000-3428.2012.22.042
结合语义与统计的特征降维短文本聚类
为解决文本聚类时文本的高维稀疏性问题,提出一种语义和统计特征相结合的短文本聚类算法.该算法通过语义词典对词汇的语义相关性分析实现一次降维,结合统计方法进行特征选择实现二次降维,并融合二次降维特征实现短文本聚类.实验结果表明,该算法具有较好的短文本聚类效果和效率.
特征选择、聚类、短文本、向量空间模型、语义、降维
38
TP391(计算技术、计算机技术)
国家"863"计划基金资助项目2011AA010704,2012AA011004;清华大学自主科研基金资助项目"跨媒体分布式垂直搜索及舆情分析的关键技术"20111081023
2013-01-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
171-175