10.3969/j.issn.1673-629X.2020.08.016
GSGD:一种基于BERT与本体推理的自动分级系统
政府数据资源分级管理是政府数据共享开放和数据治理的关键性工作.由于数据资源规模大,分级体系不完善,工具缺乏,使得该工作多由人工进行,导致支撑依据不足、主观性强、精确性差、成效不足.文中设计并实现了基于政策法规、典型案例的政府数据自动分级系统—GSGD(grading system for government data).首先,利用政策法规以及典型案例构建本体库,根据分级目标以及构建的本体特性,构建自定义推理规则;再通过BERT获得输入数据与关键词的语义特征词/句向量,并计算向量之间的余弦相似度;最后对相似度较高的关键词,采用Jena对政策法规库以及典型案例库进行查询推理得到分级结果以及分级依据,以实现对政府数据的自动化分级,提高分级工作效率.通过实验对比分析,验证了该方法的有效性.
数据分级、政府数据、BERT、法律本体、余弦相似度
30
TP39(计算技术、计算机技术)
天津市新一代人工智能科技重大专项18ZXZNGX00370
2020-08-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
97-102