10.6041/j.issn.1000-1298.2021.06.028
家禽诊疗文本多实体关系联合抽取模型研究
针对传统实体关系抽取方法中主体特征与句向量难以有效融合、现有BIO标注策略难以有效处理重叠关系的问题,提出一种基于BERT和双重指针标注的家禽疾病诊疗文本实体关系联合抽取模型(Joint extraction of entity relationship of poultry disease diagnosis and treatment text,JEER_PD).JEER_PD使用双重指针标注(Dual-pointer labeling,DPL)策略,建立头、尾2个指针标注器,一次性标注出所有实体的开始和结束位置;引入CLN(Conditional layer normalization)网络层,强化主体抽取任务与客体关系联合抽取任务之间的联系;利用概率平衡策略PBS对抗正负类标签类别失衡,以加速模型收敛.实验表明,JEER_PD准确率、召回率和F1分别为97.69%、97.59%和97.64%,3项指标较现有方法均有显著提升,说明JEER_PD能够快速、准确地抽取家禽疾病诊疗复杂知识文本中的实体关系三元组.
家禽疾病诊疗文本、实体关系抽取、关系重叠、BERT语言模型、双重指针标注
52
TP391(计算技术、计算机技术)
国家重点研发计划2016YFD0300607
2021-07-26(万方平台首次上网日期,不代表论文的发表时间)
共9页
268-276