10.11896/j.issn.1002-137X.2017.10.053
基于语义相似度的情感特征向量提取方法
针对现有情感特征在语义表达和领域拓展等方面的不足,提出了一种基于语义相似度的情感特征向量提取方法.利用25万篇sogou新闻语料和50万条微博语料,训练得到Word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec).将Senti2vec应用于情感近义词和反义词相似度分析、情感词极性分类和文本情感分析任务中,实验结果表明Senti2vec能实现情感词的语义表示和情感表示.基于大规模语料的语义相似计算,使得提取的情感特征更具有领域拓展性.
情感特征向量、语义相似度、情感词、Word2vec
44
TP391(计算技术、计算机技术)
国家社科基金项目12BYY045
2017-11-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
296-301