10.12146/j.issn.2095-3135.20230209001
面向中文法律裁判文书的抽取式摘要算法
裁判文书自动摘要的目的在于让计算机能够自动选择、抽取和压缩法律文本中的重要信息,从而减轻法律从业者的工作量.目前,大多数基于预训练语言模型的摘要算法对输入文本的长度存在限制,因此无法对长文本进行有效摘要.为此,该文提出了一种新的抽取式摘要算法,利用预训练语言模型生成句子向量,并基于 Transformer 编码器结构融合包括句子向量、句子位置和句子长度在内的信息,完成句子摘要.实验结果显示,该算法能够有效处理长文本摘要任务.此外,在 2020 年中国法律智能技术评测(CAIL)摘要数据集上进行测试的结果表明,与基线模型相比,该模型在 ROUGE-1、ROUGE-2 和 ROUGE-L 指标上均有显著提升.
抽取式摘要模型、法律裁判文书、文本自动摘要、深度神经网络
13
TP399(计算技术、计算机技术)
2024-01-26(万方平台首次上网日期,不代表论文的发表时间)
共10页
62-71