基于词向量技术与主题词特征的微博立场检测
微博话题随着移动互联网的发展变得火热起来, 单个热门话题可能有数万条评论, 微博话题的立场检测是针对某话题判断发言人对该话题的态度是支持的、反对的或中立的. 本文一方面由Word2Vec训练语料库中每个词的词向量获取句子的语义信息, 另一方面使用TextRank构建主题集作为话题的立场特征, 同时结合情感词典获取句子的情感信息, 最后将特征选择后的词向量使用支持向量机对其训练和预测完成最终的立场检测模型. 实验表明基于主题词及情感词相结合的立场特征可以获得不错的立场检测效果.
立场检测、主题词特征、词向量、立场特征
27
2018-09-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
118-123