10.19678/j.issn.1000-3428.0055986
基于膨胀卷积迭代与注意力机制的实体名识别方法
针对传统实体名识别方法无法兼顾文本序列提取特征的有效性和神经网络模型训练速度的问题,提出一种基于迭代膨胀卷积神经网络(IDCNN)与注意力机制(ATT)的实体名识别方法.IDCNN可利用GPU并行计算的优化能力,保留长短期记忆神经网络的特性,即用简单的结构记录尽可能多的输入信息,并在准确提取文本序列特征的同时加快神经网络模型的训练速度.通过引入ATT运用文本语法信息和单词词性信息,从众多文本特征中选择对实体名识别更关键的特征,从而提高文本特征提取的准确性.在新闻数据集和微博数据集上的实验结果表明,神经网络模型的训练速度比传统的双向长短期记忆神经网络有显著提升,基于注意力的实体名识别方法的评价指标比传统的无注意力机制方法提高2%左右.
实体名识别、注意力机制、膨胀卷积、长短期记忆网络、条件随机场
47
TP391(计算技术、计算机技术)
国家自然科学基金;广西科技重大专项
2021-01-20(万方平台首次上网日期,不代表论文的发表时间)
共9页
58-65,71