10.3969/j.issn.1004-132X.2023.08.012
多尺度核电质量文本故障信息语义抽取方法
提出了多尺度核电质量文本故障信息语义抽取方法,从核电质量文本描述中获取了存在质量缺陷的故障设备与所属阶段的信息.针对故障设备与正常设备并存,以及所属设计、采购、施工和调试的全价值链阶段未描述的问题,提出了多尺度故障信息抽取策略.基于Transformer双向编码的预训练语言模型将核电质量文本转化为文本向量;采用注意力机制的双向门控循环神经网络挖掘出质量缺陷的关键语义特征;采用条件随机场对关键语义特征进行实体预测,输出故障设备;通过多层感知机对提取的关键语义特征进行微调及推理,解译出故障设备所属阶段.最后,在真实的核电质量文本数据集上进行验证,F1值达到94.3%,表明提出的方法具有较好可行性和有效性.
多尺度、核电质量文本、语义抽取、预训练语言模型、条件随机场
34
TP391.1(计算技术、计算机技术)
国家重点研发计划2020YFB1711700
2023-05-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
976-981,992