10.16208/j.issn1000-7024.2019.02.015
融合词向量及BTM模型的问题分类方法
针对传统短文本分类算法对问题分类效果不佳的问题,提出一种融合词向量及BTM模型的问题分类方法.使用Word2vec对问题语料库进行训练得到词向量;对语料进行基于吉布斯采样的BTM主题模型构建,得到文本主题扩展向量;将文本主题扩展向量与词向量拼接得到新的问句扩展文本,利用SVM进行文本分类.实验结果表明,该方法在准确率、召回率及F值上的表现均有提高.
问答系统、问题分类、词向量、BTM主题模型、问句扩展
40
TP391(计算技术、计算机技术)
国家社会科学基金项目17XXW004;重庆市教委基金项目15YJC790061
2019-05-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
384-388