10.11996/JG.j.2095-302X.2021020307
基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究
建筑施工安全事故分析是施工安全管理的重要环节,但分散在事故报告中的施工安全知识不能得到良好的复用,无法为施工安全管理提供充分的借鉴作用.知识图谱是结构化存储和复用知识的工具,可以用于事故案例快速检索、事故关联路径分析及统计分析等,从而更好地提高施工安全管理水平.命名实体识别(NER)是自动构建知识图谱的关键工作,目前主要研究集中于医疗、金融、军事等领域,而在建筑施工安全领域,尚未见到NER的相关研究.根据建筑施工安全领域知识图谱的应用需求,定义了该领域5类概念,并明确了实体标注规范.采用改进的基于Transformer的双向编码表征器(BERT)预训练语言模型获取动态字向量,并采用双向长短期记忆-条件随机场(BiLSTM-CRF)模型获取实体最优标签序列,提出了适用于建筑施工安全领域的NER模型.为了训练该模型并验证其实体识别效果,收集、整理和标注了1000篇施工安全事故报告作为实验语料.实验表明,相比于传统模型,该模型在建筑施工安全事故文本中具有更优的识别效果.
知识图谱、命名实体识别、施工安全、预训练语言模型、事故报告
42
TP391(计算技术、计算机技术)
广东省自然科学基金项目;广州市科技计划重点项目
2021-05-19(万方平台首次上网日期,不代表论文的发表时间)
共9页
307-315