10.13335/j.1000-3673.pst.2020.1678
基于深度学习的电力实体信息识别方法
电力设备在长期运行与维护过程中积累了大量电力文本,文本中含有常见的故障部位、故障现象与故障检修方法,由于电力文本常采用非结构化的形式进行记录,所以电力信息的自动挖掘难以准确实现.提出了一种新的电力实体信息识别方法(PowerBERT+Bi-LSTM+CRF,PBERTBiLC).该方法首先采用预训练方式对通用BERT进行参数初置,形成PowerBERT(电力BERT),再将PowerBERT作为文本的字向量语义编码层,以Bi-LSTM作为字符实体信息标签预测层,CRF作为全局标签优化层,共同构建电力实体信息识别模型,实现了电力文本信息的高准确率识别.对现场560份电力设备故障检修文本进行实体识别,在不同实体信息类别上,基于PBERTBiLC的实体信息识别方法比基于词典和最大后向匹配算法的F1值高15.75%~34.38%;且比目前常用的word2vec+Bi-LSTM+CRF的F1值高2.33%~11.25%.
深度学习、双向语言编码、电力实体识别、双向长短时记忆、自然语言处理
45
TM721(输配电工程、电力网及电力系统)
国家电网公司总部科技项目5500-202019090A-0-0-00
2021-06-21(万方平台首次上网日期,不代表论文的发表时间)
共9页
2141-2149