10.3969/j.issn.1003-0077.2020.09.005
细颗粒度汽车评论语料库的构建和分析
产品评论文本是情感分析的重要研究对象,目前已有的产品评论语料库大都较为粗疏,没有完整地标注出对象、属性、极性"三要素",影响自动分析的应用场景.对此,该文构建了细颗粒度评论语料库,共包含9343句汽车评论短文本,不仅人工标注了"三要素"的具体词语,而且将其对应到产品和属性的知识本体树上.此外,对无情感词的隐含表达、特殊文本(如建议文本、比较句等)也标注出对应的三元组并予以特殊标签.语料统计表明,对象和属性要素的共现率高达77.54%,验证了构建"三要素"齐全标注体系的必要性;基于该语料库的"三要素"自动标注实验F1值可达70.82%,验证了细颗粒度标注体系的可计算性以及语料库构建的规范性和应用价值.该语料库可以为细颗粒度情感分析研究提供基础数据.
情感分析、细颗粒度、语料库
34
TP391(计算技术、计算机技术)
国家社会科学基金;江苏省社科基金项目;国家语委科研项目
2020-11-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
28-35