10.3969/j.issn.1008-0821.2022.03.004
基于数据增强的领域知识图谱构建方法研究
[目的/意义]探究使用大数据技术解决传统制造业知识管理问题的方法,实现对专利知识的自动抽取和结构化构建,提高信息检索效率和利用率.[方法/过程]结合深度学习技术,提出了一种面向非结构化专利信息的知识图谱自动构建方法,在BiLSTM-CRF的基础上引入预训练模型实现对实体和开放式关系的自动抽取,并基于迁移学习进行数据增强提升抽取效果;改进实体关系抽取模型提升三元组结构识别的准确率;最后将其存储到Neo4j图数据库中进行领域知识图谱的构建.[结果/结论]本文提出的方法解决了信息抽取在专业领域样本量少的问题,对专利三元组识别的准确率达到了 94.71%,构建的知识图谱能够满足企业创新知识管理和竞争情报获取的需求,提升企业知识的可重用性.
专利、数据增强、信息抽取、三元组识别、新能源汽车电池技术领域
42
TP393(计算技术、计算机技术)
国家社会科学基金;国家社会科学基金;南京航空航天大学研究生创新基地实验室开放基金
2022-04-27(万方平台首次上网日期,不代表论文的发表时间)
共9页
31-39