10.11896/j.issn.1002-137X.2017.12.035
基于三支决策的多粒度文本情感分类模型
文本情感分类是一项重要的自然语言处理任务,具有广泛的应用场景.以往的情感分类方法过于注重分类准确率,忽略了训练和分类过程的时间代价,而且使用的特征大多为词袋特征,存在维度高、可解释性差的缺点.针对这些问题,将粒计算的思想运用于文本数据的三层粒度结构(词-句-篇章),提出一种具有强可解释性的文本情感分类特征——SSS(Sentence-level Sentiment Strength)特征,SSS特征每一维度代表文章中每个句子的情感强度值;同时,在分类过程中,利用三支决策方法将待分类对象划分为3个区域,位于正域和负域的对象直接划分至正类和负类中,使用SVM(Support Vector Machine) +SSS特征对位于边界域的对象做进一步分类.实验结果显示,SSS特征由于自身的低维特性,能够大大降低特征提取和模型训练过程所耗费的时间成本,结合了三支决策方法的SVM能够进一步提高分类准确率,而且三支决策方法可以减少分类过程所耗费的时间.
情感分类、三支决策、多粒度、支持向量机
44
TP391(计算技术、计算机技术)
国家自然科学基金61273304,61673301;高等学校博士学科点专项科研基金20130072130004
2018-04-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
188-193,215