10.16508/j.cnki.11-5866/n.2018.01.014
一种基于word2vec的文本分类方法
提出一种基于word2 vec的文本分类方法,通过词向量进行文本特征表示,并通过相似度计算实现文本分类.通过大量实验对方法的性能和参数进行了分析,包括:1)基于word2vec解决传统词袋模型的降维问题的量化分析;2)关键词个数与相似度阈值的选取,对文本分类效果的影响;3)该方法与经典的KNN及其改进方法的效果对比.最终验证和分析了该方法的有效性与准确性.
word2vec、词向量、文本分类、降维、相似度阈值
33
TP391.1(计算技术、计算机技术)
北京市属高等学校高层次人才引进与培养计划项目CIT&TCD201504056;国家自然基金面上项目61672105
2018-04-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
71-75