10.3969/j.issn.1003-0077.2020.08.012
基于粗糙集和多通道词向量的中文文本情感特征分析
粗糙集是一种能够有效处理不精确、不完备和不确定信息的数学工具,粗糙集的属性约简可以在保持文本情感分类能力不变的情况下对文本情感词特征进行约简.针对情感词特征空间维数过高、情感词特征表示缺少语义信息的问题,该文提出了RS-WvGv中文文本情感词特征表示方法.利用粗糙集决策表对整个语料库进行情感词特征建模,采用Johnson粗糙集属性约简算法对决策表进行化简,保留最小的文本情感词特征属性集,之后再对该集合中的所有情感特征词进行词嵌入表示,最后用逻辑回归分类器验证RS-WvGv方法的有效性.另外,该文还定义了情感词特征属性集覆盖力,用于表示文本情感词特征属性集合对语料库的覆盖能力.最后,在实验对比的过程中,用统计检验进一步验证了该方法的有效性.
属性约简、情感特征提取、词向量、情感分类
34
TP391(计算技术、计算机技术)
山西省应用基础研究项目201801D221190,201801D121144
2020-09-25(万方平台首次上网日期,不代表论文的发表时间)
共11页
94-104