10.19678/j.issn.1000-3428.0057666
基于机器阅读理解模型与众包验证的属性值抽取方法
由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题.提出一种新的实体属性值抽取方法.利用机器阅读理解模型,从互联网语料中抽取出高质量的候选属性值,通过高效的众包验证机制调整各候选属性值的权重,得到最终抽取结果.实验结果表明,与OpenTag、QANET等模型相比,该机器阅读理解模型有效提升了候选属性值抽取的准确性,抽取准确率提升10%左右,同时通过众包验证方法,能够以较低的众包成本提高属性值抽取的整体性能.
属性值抽取、机器阅读理解模型、知识图谱、众包、序列标注
47
TP18(自动化基础理论)
上海市科技创新行动计划19511120400
2021-05-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
97-103