DOI：10.3969/j.issn.1000-3428.2014.04.031

基于证据理论的多分类器中文微博观点句识别

引用

摘要：

随着新技术及社会网络的发展与普及,微博用户数据量剧增,与此相关的研究引起了学术界和工业界的关注.针对中文微博语句特点,通过对比多种特征选取方法,提出一种新的特征统计方法.根据构建的词语字典与词性字典,分析支持向量机、朴素贝叶斯、K最近邻等分类模型,并利用证据理论结合多分类器对中文微博观点句进行识别.采用中国计算机学会自然语言处理与中文计算会议(NLP&CC 2012)提供的数据,运用该方法得到的准确率、召回率和F值分别为70.6％、89.2％、78.9％,而NLP&CC2012公布的评测结果相应平均值分别为72.7％、61.5％、64.7％,该方法在召回率和F值2个指标上超过其平均值,而F值比NLP&CC2012评测结果的最好值高出0.5％.

关键词：微博、观点句、支持向量机、朴素贝叶斯、K近邻、证据理论

所属期刊栏目：40

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金资助项目61170192

在线出版日期：2014-06-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：159-163,169

英文信息展示

期刊专题