三元组深度哈希学习的司法案例相似匹配方法
在数量庞大的司法案例文书中进行相似案例匹配可以有效地提升司法部门的工作效率.但司法案件文本不仅长,而且文本自身还具有一定程度的结构复杂性,因此司法案例文本匹配与传统自然语言处理任务相比,具有较高的难度.为解决上述问题,本文基于三元组深度哈希学习模型提出了一种司法案例相似匹配方法,首先使用预训练的BERT中文模型分组提取文书的特征;再利用文书三元组相似性关系,训练深度神经网络模型,用于生成文书的哈希码表示;最后,基于文书哈希码的海明距离来判断是否为相似案例.实验结果表明,本文采用哈希学习方法极大地降低了文书特征表示的存储开销,提高了相似案例匹配的速度.
司法案例、案例匹配、相似检索、哈希学习、深度学习、神经网络、BERT模型、三元组
15
TP391(计算技术、计算机技术)
国家重点研发计划项目2018YFC0830100,2018YFC0830102
2021-05-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
1147-1153