10.3969/j.issn.1001-0645.2012.06.009
基于词袋绑定的问句新特征自动生成
针对中文问句分类缺乏丰富的句法语义特征,提出一种基于词袋绑定的问句新特征自动生成方法.在词袋(BOW)、词性(POS)和词义(WS)等基本特征的基础上,通过将词性、词义等与词袋分别进行绑定,自动获取一类新的问句特征即词袋绑定特征.采用SVM分类器在哈工大中文问句集上实验,结果表明与原来单个的POS、WS等基本特征相比,对应的W/POS、W/WS等词袋绑定特征在分类精度上均获得了显著的提升;而且对这些词袋绑定特征进行启发式组合以后,在77个小类问题类别的总体分类精度达到82.333%,取得了较好的分类效果.说明在基本特征基础上借助词袋绑定操作进一步构造问句新特征的方法简单而有效.
问答系统、问句分类、特征提取、词袋绑定
32
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61003112;计算机软件新技术国家重点实验室南京大学开放课题基金KFKT2010B02;安徽省高校省级自然科学研究重点项目KJ2011A048
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
590-595