10.13860/j.cnki.sltj.20161122-012
基于主题模型的半监督网络文本情感分类研究
针对网络评论文本的情感分类问题中存在的数据的不平衡性、无标记性和不规范性问题,提出一种基于主题的阈值调整的半监督学习模型,通过从非结构化文本中提取主题特征,对少量标注情感的文本训练分类器并优化指标调整阈值,达到识别用户评论的情感倾向的目的.仿真研究证明阈值调整的半监督模型对数据非平衡性和无标记性具有较强的适应能力.在实证研究中,对酒店评论文本数据构建的文本情感分类器显示该模型可以有效预测少数类评论样本的情感极性,证实了基于主题模型的阈值调整半监督网络评论文本情感分类模型在实际问题中的适用性与可行性.
情感分类、不平衡数据、半监督学习、主题模型
35
O212(概率论与数理统计)
中国人民大学科学研究基金中央高校基本科研业务费专项资金资助项目15XNI011
2017-05-18(万方平台首次上网日期,不代表论文的发表时间)
共11页
961-971