10.3969/j.issn.1000-5641.2022.06.009
基于影响函数的远程监督关系抽取
远程监督的标注方法在关系抽取任务中被广泛应用,其在减小人工标注负担的同时,也引入了大量噪声样本,影响了模型的训练.针对这个问题,提出了一种基于影响函数的去噪方法.通过影响函数衡量训练集中每一条训练样本对模型预测的影响,并在建立噪声样本与其的关系后,设计了1个判断样本是否是错误标注的打分函数.基于此打分函数的值,从初始的1个小的无噪声集合出发,通过自举法迭代式地获得最后的去噪数据集.该去噪方法作为一种对数据的前处理方法,在公开数据集上取得了良好的效果.
远程监督、关系抽取、影响函数、自举法
TP391.1(计算技术、计算机技术)
2022-12-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
79-86