10.3969/j.issn.1000-3428.2017.12.035
基于混合卡方统计量与逻辑回归的文本情感分析
针对文本情感分析中基于卡方统计量的特征提取方法容易忽略单个文本词频,导致文本分类准确率较低的问题,提出一种基于混合卡方统计量的特征提取方法.通过增加特征频率、逆文档频率和负相关性指标,选出集中在某个特定类别中的特征词,从而减少特征负相关性的干扰.采用基于随机梯度下降的逻辑回归方法进行文本情感分类,并利用模拟退火原理自适应选择步长,解决随机梯度下降算法中步长难以确定的问题.实验结果表明,与基于卡方统计量的特征提取方法相比,该方法具有更高的文本情感分类质量.
卡方统计量、特征提取、负相关性、随机梯度下降、逻辑回归、情感分类
43
TP391(计算技术、计算机技术)
国家自然科学基金61572238;江苏省杰出青年基金BK20160001
2018-04-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
192-196,202