DOI：10.11925/infotech.2096-3467.2020.1302

一对多实体关系少样本持续学习方法研究

引用

摘要：

[目的]在少量样本情况下识别句中一对多实体关系(如包含关系、并列关系等)实例,在新增类别后保持识别效果,实现持续学习.[方法]以LaserTagger模型为基础,利用文本生成的方法识别句子中包含、并列关系实体,并通过位置特征编码、加权Loss计算的方式增强模型在少样本情况下的特征学习能力,通过模型的压缩、扩展实现多个类别的持续学习.[结果]在少量训练样本的情况下,本文方法在5个类别上的SARI值均比基线模型提高1％以上;多类别依次学习的情况下,通过模型的压缩、扩展能够较好地保留模型已学习到的知识,SARI值最高能提升16.92％.[局限]仅选取包含关系、并列关系中的5种句式类别进行实验,数据类别较少,句式结构比较简单,暂未考虑模型在更多类别、更复杂句式情况下的性能.[结论]所提方法在一定程度上能满足少样本、多类别依次学习的应用场景,具有一定优越性.

关键词：实体关系;文本生成;少样本;持续学习

所属期刊栏目：5

分类号：TP391(计算技术、计算机技术)

在线出版日期：2021-11-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：45-53

英文信息展示

期刊专题