10.11896/j.issn.1002-137X.2016.9.015
融入内部语义关系对文本分类的影响研究
为了在不加入外部语义知识的前提下改善向量空间模型的文本分类效果,通过挖掘语料库内部蕴含的词间关系和文本间关系,并以不同的方式融入原始的词文本矩阵,然后选择常用的SVM和KNN算法,在领域性较强的法律语料库和领域性较宽泛的新闻语料库上进行文本分类的对比实验.实验证明,加入词间关系和文本间关系通常能有效改善文本分类的效果,但是对不同的分类方法和领域特征有不同的影响,在实际应用中应该区别对待.
向量空间模型、文本分类、语义挖掘、特征矩阵
43
TP391(计算技术、计算机技术)
国家自然科学基金71271209;北京市自然科学基金4132067;教育部人文社会科学青年基金11YJC630268;河北省自然科学基金项目A2013410011
2016-10-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
82-86