10.3969/j.issn.1002-1965.2016.02.027
基于文档分布式表达的新浪微博情感分类研究
[目的/意义]拥有庞大用户群体的新浪微博每天都产生海量的文本数据,对其进行情感分类有助于分析社会的舆论走向,为舆情监测提供帮助。其中,如何挖掘微博中的文本特征与情感信息是微博情感分类研究的关键。[方法/过程]将能有效考察上下文语境的基于文档分布式的特征表达方法引入到微博情感分类研究中,通过综合考虑上下文的语义、语序和情感信息,将微博文本转化为高维空间的特征向量,然后利用SVM分类器判断文本的情感极性。[结果/结论]实验表明,对微博文本进行文档分布式特征表达后,其分类准确率可达90.46%,优于其他特征表达方法。
微博、情感分类、文档分布式表达、Doc2vec
35
TP391(计算技术、计算机技术)
中央高校基本科研业务费专项资金项目“基于社会网络特征提取的群体性突发事件预警方法研究”2572014DB05;国家自然科学基金项目“群体性突发事件预警的超网络方法研究”71473034。
2016-05-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
151-156