基于BiLSTM模型的定义抽取方法

引用

摘要：

定义抽取是从非结构化文本中自动识别定义句的任务,定义抽取问题可建模为句子中术语及相应定义的序列标注问题,并利用标注结果完成抽取任务.针对传统的定义抽取方法在抽取定义特征过程中费时且容易造成错误传播的不足,提出一个基于双向长短时记忆(BiLSTM)的序列标注神经网络模型,对输入文本进行自动化定义抽取.通过将原始数据输入到BiLSTM神经网络中,完成输入句的特征表示,并采用基于LSTM的解码器进行解码得到标注结果.在Wikipedia英文数据集上的实验结果表明,该方法的精确率、召回率和F1值分别为94.21％、90.10％和92.11％,有效提升了基准模型效果.

关键词：定义抽取、双向长短时记忆模型、序列标注、LSTM模型、深度神经网络

所属期刊栏目：46

分类号：TP18(自动化基础理论)

资助基金：国家重点研发计划2018YFC0830900

在线出版日期：2020-04-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：40-45

英文信息展示

期刊专题