10.19678/j.issn.1000-3428.0047596
基于卷积神经网络和KNN的短文本分类算法研究
为解决传统基于TF-IDF的K最近邻(KNN)分类算法在短文本分类时,出现特征维度过高和数据稀疏的问题,基于卷积神经网络和KNN,提出一种新的短文本分类算法.通过采用神经网络语言模型word2vec对短文本进行词向量的训练,并用训练好的词向量表示文本,使用卷积神经网络对短文本进行抽象特征的提取,在提取出抽象特征的基础上,运用KNN分类器进行短文本分类.分别在短文本中句子数目为2、4、6、8的数据集上进行测试,结果表明,与基于TF-IDF的KNN分类算法相比,该算法在准确率、召回率和FI值上平均提高了10.2%、21.1%和15.5%.
社交网络、卷积神经网络、K最近邻、短文本、机器学习、深度学习
44
TP391(计算技术、计算机技术)
国家重点基础研究发展计划项目2014CB340500;国家自然科学基金U1603115,61262087
2018-11-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
193-198