面向多源异质数据源的学科知识图谱构建方法
针对以分散形式存储学科信息导致资源难以统计的问题,基于计算机学科领域本体模型,融合多源异质的学科数据构建高校计算机学科知识图谱.首先通过网络爬虫等技术从相关网站和已有文档中获取领域知识,并基于BERT模型对数据进行清洗;然后利用Word2Vec判断人物研究方向之间的相似度,解决实体对齐问题;最终将数据导入Neo4j图数据库中实现知识的存储.根据构建好的知识图谱建立计算机学科可视化系统,能够提供信息检索与图形显示等多种功能,实现计算机学科基础数据的快捷查询和资源统计,以期促进后续的学科评估工作更加高效地完成.
知识图谱;计算机学科;图数据库;可视化系统
30
国家自然科学基金;中国石油大学华东研究生创新工程
2021-12-21(万方平台首次上网日期,不代表论文的发表时间)
共9页
59-67