DOI：10.11992/tis.201910012

融合多层次特征的中文语义角色标注

引用

摘要：

随着人工智能和中文信息处理技术的迅猛发展,自然语言处理相关研究已逐步深入到语义理解层次上,而中文语义角色标注则是语义理解领域的核心技术.在统计机器学习仍占主流的中文信息处理领域,传统的标注方法对句子的句法及语义的解析程度依赖较大,因而标注准确率受限较大,已无法满足当前需求.针对上述问题,对基于Bi-LSTM的中文语义角色标注基础模型进行了改进研究,在模型后处理阶段结合了Max pooling技术,训练时融入了词法和句式等多层次的语言学特征,以实现对原有标注模型的深入改进.通过多组实验论证,结合语言学辅助分析,提出针对性的改进方法从而使模型标注准确率得到了显著提升,证明了结合Max pooling技术的Bi-LSTM语义角色标注模型中融入相关语言学特征能够改进模型标注效果.

关键词：自然语言处理、语义角色标注、深度学习、Bi-LSTM、语言学特征、后处理层、Maxpooling

所属期刊栏目：15

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61602387, 61762076

在线出版日期：2020-07-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：107-113

英文信息展示

期刊专题