10.11772/j.issn.1001-9081.2022010053
融合边特征与注意力的表格结构识别模型
针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR.首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测.在SciTSR-COMP数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR的召回率与F1值分别提升2.5与1.4个百分点.在消融实验中,GEAN-TSR采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性.实验结果表明,GEAN-TSR能够有效提升网络性能,更好地完成表格结构识别任务.
图神经网络、图注意力网络、特征融合、表格结构识别、表格解析
43
TP391.4(计算技术、计算机技术)
国家自然科学基金62171043
2023-03-30(万方平台首次上网日期,不代表论文的发表时间)
共7页
752-758