10.3772/j.issn.1000-0135.2016.004.001
基于迁移学习微博情绪分类研究——以H7N9微博为例
社交媒体的发展吸引大量用户,继而产生海量的用户生成内容.对用户生成内容的挖掘分析能够及时掌握用户的情绪动态,继而帮助事件处理、政策施行等.已有研究利用监督机器学习方法进行文本情绪分类,但是这类方法依赖于语料的标注、耗时耗力,并且存在领域适应性问题.迁移学习方法能够避免大量的语料标注、并且一定程度解决领域适应性问题.但是,目前迁移学习鲜有用于情绪分类任务.此外,情绪分类主要是针对博文等长文本,缺少针对微博短文本的相关实证研究.本文在主客观分类基础上,利用迁移学习方法对H7N9微博主观语料文本进行情感分类,并对结果进行情绪分类.实验结果表明,首先,设置形容词个数阈值为2时主客观分类效果最优;其次,利用迁移学习算法进行微博情感分类效果优于非迁移学习方法;最后,利用词频-相关频率作为特征权重计算方法时可以得到较好的情绪分类性能.
情感分类、情绪分类、迁移学习、微博挖掘
35
G63;TP3
国家社会科学基金重大项目“面向突发事件应急决策的快速响应情报体系研究”13&ZD174;国家社会科学基金项目“在线社交网络中基于用户的知识组织模式研究”14BTQ033;杭州师范大学阿里巴巴复杂科学研究中心开放基金项目“基于多语言产品本体的电商评价情感分析研究”PD12001003002003
2016-10-09(万方平台首次上网日期,不代表论文的发表时间)
共10页
339-348