DOI：10.3969/j.issn.1000-5641.2014.04.008

基于词典与语料结合的中文微博主观句抽取方法

引用

摘要：

提出一种基于词典与语料结合的中文微博主观句抽取方法,通过判断句子中是否包含情感表达文本来判断句子是否为主观句.首先,从现有的情感词典中挑选出情感倾向较为固定的情感词构建了一个高可信情感词典,用于抽取句子中的情感表达文本,保证情感表达文本抽取的准确率;然后提出N-POSW模型,并基于2-POS W模型通过语料学习的方法较为准确地抽取句子中的剩余情感表达文本,保证了情感表达文本抽取的召回率.实验结果表明,相比于传统的基于大规模情感词典的方法,本文方法主观句抽取的F值提高了7％.

关键词：情感词典、高可信情感词典、N-POSW模型、主观句

分类号：TP39(计算技术、计算机技术)

在线出版日期：2014-09-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：62-68,87

英文信息展示

期刊专题