DOI：10.11992/tis.201809029

融合语义与语法信息的中文评价对象提取

引用

摘要：

鉴于常规的序列化标注方法提取中文评价对象准确率低,存在忽略中文语义与语法信息的缺陷,提出了融合语义与语法信息的中文评价对象提取模型.该模型在原始字向量的基础上通过优化字符含义策略强化语义特征,弥补忽略的字符与词语的内部信息;并通过词性序列标注,对句子的词性信息进行表征,深化输入的语法特征.网络训练使用双向长短期记忆网络并用条件随机场克服标注标签的偏差,提高了提取准确率.该模型在BDCI2017数据集上进行验证,与未融人语义和语法的提取模型相比,中文主题词与情感词提取准确率分别提高了2.1％与1.68％,联合提取的准确率为77.16％,具备良好的中文评价对象提取效果.

关键词：中文评价对象、语义、语法、序列标注、双向长短期记忆网络、条件随机场、提取模型

所属期刊栏目：14

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61872260;山西省重点研发计划国际合作项目201703D421013

在线出版日期：2019-03-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：171-178

英文信息展示

期刊专题