10.3969/j.issn.1672-9722.2022.04.030
基于自注意力机制的中文医疗命名实体识别
运用命名实体识别算法从海量医疗文本中抽取信息,对于构建知识图谱、对话系统等具有重要意义.然而医疗实体间存在嵌套、歧义和专业术语缩写多样性的问题,传统的基于统计的方法对于实体边界的定位存在较大偏差.考虑到医疗文本的复杂性,提出了多层Transformer模型,基于其multi-head和self-attention机制提取医疗文本多个语义空间的特征,结合CNN-BiLSTM-CRF对提取的多维度特征序列做标注.实验使用CCKS任务二开源的病历数据,重点识别身体部位、症状体征、检查检验、疾病、药品五类医疗实体,平均F1值达到94%.
Transformer、命名实体识别、自注意力机制、自然语言处理
50
TP183(自动化基础理论)
2022-05-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
839-842,848