融合字位置特征的铁路事故命名实体识别
铁路事故的相关信息以事故概况文本的形式存在,对于铁路安全工作有重要意义.但由于缺乏有效的信息抽取手段,导致分散在文本中的铁路事故知识没有得到充分的利用.命名实体识别是信息抽取的重要子任务,目前关于事故领域的命名实体识别问题研究较少.针对铁路事故命名实体识别问题,提出一种融合字位置特征的命名实体识别模型,该模型通过全连接神经网络获取字的位置特征,并与语义层面的字向量合并作为字的最终向量表示输入BiLSTM-CRF模型获取最优标签序列.实验结果表明,模型在铁路事故文本命名实体识别问题上的准确率、召回率和F1值分别为93.29%、94.77%和94.02%,相比于传统模型,取得了更好的效果,为铁路事故知识图谱的构建奠定基础.
命名实体识别、铁路事故、字位置特征、双向长短期记忆网络(BiLSTM)、条件随机场、知识图谱、自然语言处理
31
TP391;TN913;R311.13
中国国家铁路集团有限公司科技研究开发计划N2020S009
2023-01-03(万方平台首次上网日期,不代表论文的发表时间)
共9页
211-219