10.3778/j.issn.1673-9418.1507034
Mixed-Fisher特征云模型聚类在文本情感分类中的应用
海量网络信息的出现,使得提取文本信息情感观点成为研究的热点.针对文本情感分类中文本信息模糊及分类准确率低的问题,提出了一种基于Mixed-Fisher特征选择的文本云向量模型聚类算法.该算法首先分别计算文档中各个词性特征项的Fisher判别比,根据Fisher判别比越大特征向量判别性越强的Fisher准则,选择Fisher比值较大的前q个特征,并按照词性进行组合生成文档的Mixed-Fisher特征向量.然后在Mixed-Fisher特征向量集上构建文档的云向量模型,根据云向量模型间的差异度对模型进行聚类和合并.将该算法应用于文本情感观点的分类,选择核Fisher判别技术用于最终文本观点的判定.仿真实验结果表明,基于Mixed-Fisher特征的云向量聚类模型的分类准确率明显优于传统向量空间模型,从而验证了核Fisher判别技术的有效性.
文本情感分类、Fisher判别比、词性特征、云向量模型、核Fisher判别
10
TP181(自动化基础理论)
The National Natural Science Foundation of China under Grant No.61461027;the Research Program of Education Department of Gansu Province under Grant No.2014A-125
2016-11-04(万方平台首次上网日期,不代表论文的发表时间)
共12页
1320-1331