10.3969/j.issn.1003-0077.2014.05.011
面向微博文本的情绪标注语料库构建
文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善.为了对微博文本情绪表达特点进行分析以及对情绪分析算法性能进行评估,该文在对微博文本情绪表达特点进行深入观察和分析的基础上,设计了一套完整的情绪标注规范.遵循这一规范,首先对微博文本进行了微博级情绪标注,对微博是否包含情绪及有情绪微博所包含的情绪类别进行多标签标注.而后,对微博中的句子进行有无情绪及情绪类别进行标注,并标注了各情绪类别对应的强度.目前,已完成14 000条微博,45 431句子的情绪标注语料库构建.应用该语料库组织了NLP&CC2013中文微博情绪分析评测,有力地促进了微博情绪分析相关研究.
情绪语料库、语料库构建、情绪标注、微博文本
28
TP391(计算技术、计算机技术)
国家自然科学基金61203378,61300112,61370165;高等院校博士学科点专项基金20122302120 070;广东省自然科学基金S2012040007390,S2013010014475;模式识别国家重点实验室开放课题基金;深圳市基础研究计划JCYJ20120613152557576,JC201005260118A;深圳市国际合作计划GJHZ201206131 106 1217;百度高校合作项目
2014-10-31(万方平台首次上网日期,不代表论文的发表时间)
共9页
83-91