10.16652/j.issn.1004-373x.2023.19.017
结合近邻分析的小样本命名实体识别方法
小样本命名实体识别通过少量标注样本构建可应用于未知类别的实体识别模型,是命名实体识别的新兴研究方向.小样本实体识别具有实体边界检测不准确以及训练数据数量少、可见实体类别少的特点,导致模型性能表现不佳,模型极易过拟合.针对这个问题,提出结合近邻分析的小样本命名实体识别方法,将命名实体识别任务分成实体范围检测和实体类别预测两部分完成,其中实体范围检测部分使用片段打分的方法,实体类别预测部分使用近邻分析的方法.此外,为了缓解训练数据少带来的模型过拟合问题,还在实体特征的隐空间上进行Mixup数据增强以扩增伪样本.实验结果表明,所提出的结合近邻分析的小样本命名实体识别方法有效地提高了小样本实体识别的性能.
小样本、实体识别、实体分类、过拟合、近邻分析算法、数据增强、泛化性能、深度神经网络
46
TN911.1-34;TP391.1
国家自然科学基金;云南省重大科技专项计划项目
2023-10-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
88-94