基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11996/JG.j.2095-302X.2021020307

基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究

引用
建筑施工安全事故分析是施工安全管理的重要环节,但分散在事故报告中的施工安全知识不能得到良好的复用,无法为施工安全管理提供充分的借鉴作用.知识图谱是结构化存储和复用知识的工具,可以用于事故案例快速检索、事故关联路径分析及统计分析等,从而更好地提高施工安全管理水平.命名实体识别(NER)是自动构建知识图谱的关键工作,目前主要研究集中于医疗、金融、军事等领域,而在建筑施工安全领域,尚未见到NER的相关研究.根据建筑施工安全领域知识图谱的应用需求,定义了该领域5类概念,并明确了实体标注规范.采用改进的基于Transformer的双向编码表征器(BERT)预训练语言模型获取动态字向量,并采用双向长短期记忆-条件随机场(BiLSTM-CRF)模型获取实体最优标签序列,提出了适用于建筑施工安全领域的NER模型.为了训练该模型并验证其实体识别效果,收集、整理和标注了1000篇施工安全事故报告作为实验语料.实验表明,相比于传统模型,该模型在建筑施工安全事故文本中具有更优的识别效果.

知识图谱、命名实体识别、施工安全、预训练语言模型、事故报告

42

TP391(计算技术、计算机技术)

广东省自然科学基金项目;广州市科技计划重点项目

2021-05-19(万方平台首次上网日期,不代表论文的发表时间)

共9页

307-315

相关文献
评论
暂无封面信息
查看本期封面目录

图学学报

2095-302X

10-1034/T

42

2021,42(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn