DOI：10.3969/j.issn.1672-9722.2022.09.027

融合标签信息的裁判文书证据抽取方法研究

引用

摘要：

针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法.首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引.实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93％.

关键词：标签信息、裁判文书、机器阅读理解、证据抽取

所属期刊栏目：50

分类号：TP391(计算技术、计算机技术)

资助基金：贵州大学大学生创新创业训练计划项目

在线出版日期：2022-11-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：2025-2029

英文信息展示

期刊专题