问答系统中特征提取方法研究
问句特征是影响问句分类效果的关键因素,因此特征抽取是问句分类的关键步骤.该文提出了一种改进的基于信息增益模型的问句单词语义特征抽取方法.结合单词的语义相似度和信息增益模型计算单词的信息增益值.为了获取问句的词法特征,该文提出了一种基于序列模式挖掘的问句频繁模式挖掘方法,得到的频繁模式构成问句的词法特征空间.该文使用了三种分类器在公共的UIUC数据集上对所提方法进行了评测.优于现有的问句分类方法.
特征抽取、信息增益、特征空间、词法特征、句法特征
14
TP311(计算技术、计算机技术)
2018-07-03(万方平台首次上网日期,不代表论文的发表时间)
共2页
171-172