10.3969/j.issn.1672-9722.2023.05.012
基于带噪声数据集的强鲁棒性隐含三元组质检算法
知识图谱三元组质检的难点是区分真实三元组和噪声三元组,常用开源知识图谱不包含噪声三元组,目前已有三元组质检算法极少考虑到知识图谱中由于关系传递存在的大量隐含三元组对质检效果的影响,且没有有效利用实体之间的空间语义关联导致对实体特征提取不充分.针对以上问题,提出带噪声数据集的强鲁棒性隐含三元组质检算法(Im-plied triplet quality inspection,ITQI),首先基于开源数据集制作Neo4J知识图谱;然后基于有向图最长路径搜索算法搜索所有可能的搜索路径,根据知识图谱的关系传递性来构建具有隐含关系的三元组,对源三元组进行扩充能够极大增加有效三元组的个数;最后通过随机采样构建三种类型的噪声三元组.采用TransR预训练得到扩充后的真实三元组的初始特征,然后使用残差网络提取三元组的静态特征、并使用多层BiLSTM提取三元组的内部关联特征,将以上三种特征聚合,得到三元组的融合特征对三元组进行二分类达到三元组质检的目的.论文算法在FB15K数据集上进行实验,实验结果表明论文算法质检效果优于对比算法且鲁棒性最强.
三元组质检、噪声数据集、知识图谱、预训练、特征融合
51
TP391(计算技术、计算机技术)
辽宁省教育厅高等学校基本科研项目;计算机体系结构国家重点实验室开放课题
2023-08-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
1042-1047