基于机器阅读理解模型与众包验证的属性值抽取方法

引用

摘要：

由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题.提出一种新的实体属性值抽取方法.利用机器阅读理解模型,从互联网语料中抽取出高质量的候选属性值,通过高效的众包验证机制调整各候选属性值的权重,得到最终抽取结果.实验结果表明,与OpenTag、QANET等模型相比,该机器阅读理解模型有效提升了候选属性值抽取的准确性,抽取准确率提升10％左右,同时通过众包验证方法,能够以较低的众包成本提高属性值抽取的整体性能.

关键词：属性值抽取、机器阅读理解模型、知识图谱、众包、序列标注

所属期刊栏目：47

分类号：TP18(自动化基础理论)

资助基金：上海市科技创新行动计划19511120400

在线出版日期：2021-05-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：97-103

英文信息展示

期刊专题