10.3969/j.issn.1004-8626.2022.06.014
基于BERT和TransE的众筹众创教育资源实体对齐研究
随着计算机技术与网络技术的发展,数字教育资源众筹众创成为可能,质量是众筹众创数字教育资源服务的重要一环,是发挥众筹众创数字教育资源价值的基础.高质量知识图谱是数字教育资源生成的重要工具,实体对齐是知识图谱构建的关键环节.在众筹众创教育资源生成环节,多源知识图谱的命名空间异构性较高,采用已有的实体对齐方法消除实体异构,存在自动程度不高,没有充分利用知识图谱属性信息的问题.对于包含丰富属性信息的众筹众创教育资源知识图谱,如何利用这些属性信息提高实体对齐的效率及准确度是众筹众创教育资源生成的核心问题.提出一种利用关系三元组及属性三元组向量表示实体的方法,采用预训练语言模型和知识表示技术训练迭代,针对关系三元组,将BERT(Bidirectional Encoder Representation from Transformers)的语义表示能力迁移到TransE(Translating Embeddings)模型的初始化阶段,对原始向量空间,通过TransE模型迭代训练,提高结构层面的效率和准确率,针对属性三元组,基于BERT进行向量表示,根据翻译模型和TF-IDF权重分配策略得到属性层面的实体向量,最后联合得出实体向量.实验表明,方法具有更好的实体对齐性能.
众筹众创、教育资源、实体对齐、TransH预训练语言模型、知识表示
30
TP391(计算技术、计算机技术)
江苏省高等教育教改研究立项课题;南京邮电大学通达学院教学改革研究项目
2022-09-06(万方平台首次上网日期,不代表论文的发表时间)
共10页
58-67