10.16265/j.cnki.issn1003-3033.2022.06.2732
多维字符特征表示的铁路设备事故信息抽取方法
为解决铁路设备事故调查报告数据分析困难的问题,提出基于多维字符特征表示设备事故信息抽取方法,在数据预处理阶段,提出主题模式匹配方法,抽取命名实体所属的主题段落;在文本特征表示中,提出多维特征表示方法将文本转化为特征向量;采用长短时记忆网络(BiLSTM)与条件随机场(CRF)神经网络实现铁路设备事故命名实体识别模型训练;采用铁路设备事故调查报告进行试验验证.结果表明:通过主题模式匹配预处理,多维字符特征+BiLSTM+CRF模型的综合评价指标提升22.86%,多维字符特征表示方法相比word2vec特征表示方法,能够使BiLSTM+CRF模型的综合评价指标提升4.89%.
多维字符特征、铁路设备事故、信息抽取、主题模式匹配、命名实体识别
32
X928.02(安全管理(劳动保护管理))
2022-09-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
109-114