10.11896/j.issn.1002-137X.2015.6.014
基于语义理解和机器学习的混合的中文文本情感分类算法框架
快速、准确和全面地从大量互联网文本信息中定位情感倾向是当前大数据技术领域面临的一大挑战.文本情感分类方法大致分为基于语义理解和基于有监督的机器学习两类.语义理解处理情感分类的优势在于其对不同领域的文本都可以进行情感分类,但容易受到中文存在的不同句式及搭配的影响,分类精度不高.有监督的机器学习虽然能够达到比较高的情感分类精度,但在一个领域方面得到较高分类能力的分类器不适应新领域的情感分类.在使用信息增益对高维文本做特征降维的基础上,将优化的语义理解和机器学习相结合,设计了一种新的混合语义理解的机器学习中文情感分类算法框架.基于该框架的多组对比实验验证了文本信息在不同领域中高且稳定的分类精度.
情感分类、语义、机器学习
42
TP391(计算技术、计算机技术)
本体学习与粒计算基金61070139
2015-07-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
61-66