10.3969/j.issn.2095-476X.2012.06.001
基于语义的KNN短文本分类算法研究
针对短文本分类关键词特征稀疏和样本数量多,难以处理的技术难点,提出一种基于语义的KNN短文本分类算法.该算法采用基于字的分词策略提取出短文本的特征词,结合中国知网对关键词进行概念映射以提高短文本的语义表达,并针对短文本特点,通过使用LSA降维处理,对KNN分类算法加以改进.实验结果表明,该算法能够有效提高短文本的分类性能.
短文本、文本分类、语义扩展、KNN分类算法
27
TP391(计算技术、计算机技术)
郑州市科技攻关计划项目0910SGYG23259-3
2013-03-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
1-4