混凝土坝施工文档实体知识智能挖掘方法

引用

摘要：

混凝土坝施工信息多以文档文本的形式呈现,其体量大、分布广、内在关系复杂,人工操作难以准确、高效地提取信息知识内容,理清错综复杂的施工信息关系.在自然语言处理技术中,命名实体是文本信息知识的载体,实现精确快速的实体识别是施工知识挖掘的重要前提.本文提出一种融合深度学习与关联规则技术的混凝土坝施工文档知识智能识别及挖掘分析方法.该方法耦合双向长短期记忆神经网络(bi-directional long-short term memory,Bi-LSTM)与条件随机场(conditional random field,CRF),定义混凝土坝施工实体类型,构建命名实体识别模型,形成混凝土坝施工实体知识集合;在此基础上,考虑施工文本表达规律及实体类型,预定义实体之间关系,确定施工实体组合形式,形成实体关联规则提取技术;以实体关联规则提取技术为导向,改进Apriori算法计算频繁项集,获得实体间的强关联规则.该方法应用于实际混凝土坝施工监理周报中,经过计算得到命名实体识别的精确率为86.42％,验证了该方法的准确性.利用改进Apriori算法分析实体间的关联规则,证明了改进算法的优势,有助于提升混凝土坝施工文档知识分析的智能化与精细化水平.

关键词：混凝土坝、施工文档、命名实体、智能识别、深度学习、知识挖掘

所属期刊栏目：40

分类号：TV512;TP391.1(水利工程施工)

资助基金：国家自然科学基金;国家重点研发计划;湖北省水电工程施工与管理重点实验室开放基金

在线出版日期：2021-07-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：139-151

英文信息展示

期刊专题