10.16535/j.cnki.dlhyxb.2022-305
基于规则匹配与深度学习AbTransformer的渔业标准表格信息抽取方法
为解决渔业标准文本中表格结构多样、表头位置不固定导致抽取效果不佳的问题,提出一种结合规则匹配(rule-based-matching,RBM)与AbTransformer(Absolute Transformer)深度学习模型的表格信息抽取方法,该方法对规则类表格信息采用规则模板与BERT-BiLSTM-CRF模型进行信息抽取,对非规则类表格信息采用改进的Transformer进行抽取,即在位置编码模块中引入行位置编码,与特征向量拼接以获取表格行列位置.结果表明:本文中提出的 AbTransformer 模型相较于机器学习 MLP 模型,AUC 值提升了1.46%,相较于TabTransformer模型,AUC值提高了 1.18%;本文中提出的RBM-AbTransformer模型与Ab-Transformer模型相比,准确率、召回率和 F1 值分别提高了 7.78%、4.19%和 5.27%.研究表明,结合RBM与 AbTransformer的渔业标准表格信息抽取方法,有效解决了表格结构多样、表头位置不固定的问题,提升了渔业标准表格信息抽取的整体效果.
渔业标准、实体识别、表格信息抽取、深度学习、Transformer模型
38
S932.2;TP391(水产资源)
教育部重点实验室开放基金;国家自然科学基金
2023-03-23(万方平台首次上网日期,不代表论文的发表时间)
共9页
140-148