10.19713/j.cnki.43-1423/u.T20220637
基于BMBC模型的高速铁路道岔故障信息实体识别
随着铁路信号设备故障文本的不断积累,亟待构建集故障信息、专业知识、技术规则及其内在关联于一体的铁路信号设备故障知识图谱,为铁路运营及设备维修提供全面高效的辅助策略.故障信息实体识别是构建铁路信号设备故障知识图谱的核心.以高速道岔故障文本为基础,并针对此文本挖掘过程中使用传统方法导致知识获取不够全面以及文本语义稀疏等问题,提出一种用于高速道岔故障信息实体识别任务的BMBC多层级模型.首先,通过分析高速道岔故障文本的结构特征,从中提取出故障现象、故障定位和故障致因等7类实体;其次,利用B E RT预训练模型的迁移特性构建双向词表征并嵌入位置信息,引入多头注意力机制(MHA)使关键特征信息得到重点关注,随后依靠双向长短期记忆网络(BiLSTM)进行特征信息融合,从而充分获取全局语义信息以及更好表达序列间的长距离依赖关系;最后,依托条件随机场(CRF)赋予标签约束条件,从而获得最佳识别结果.以各铁路局近5年的高速铁路道岔故障文本为基础进行实验,实验结果表明,BMBC模型能够精确识别各类故障信息实体,有效缓解实体边界不清晰问题,模型识别精确率、召回率和F1值分别可达91.43%,93.15%和92.31%.实验完成后进行案例识别测试,证明所构建的BMBC多层级道岔故障信息实体识别模型具有良好的识别性能.
道岔、故障文本、迁移学习、命名实体识别、BMBC多层级模型
20
U284(铁路通信、信号)
中国铁道科学研究院集团有限公司科研项目2021YJ184
2023-05-16(万方平台首次上网日期,不代表论文的发表时间)
共11页
1149-1159