DOI：10.3969/j.issn.1003-0077.2021.05.010

深度生成式模型在临床术语标准化中的应用

引用

摘要：

临床术语标准化任务是医学统计中不可或缺的一部分.在实际应用中,一个标准的临床术语可能有数种口语化和非标准化的描述,而对于一些应用例如临床知识库的构建而言,如何将这些描述进行标准化是必须要面对的问题.该文主要关注中文临床术语的标准化任务,即将非标准的中文临床术语的描述文本和给定的临床术语库中的标准词进行对应.尽管一些深度判别式模型在简单文本结构的医疗术语,例如,疾病、药品名等的标准化任务上取得了一定成效,但对于中文临床术语标准化任务而言,其带标准化的描述文本中经常包含的信息缺失、"一对多"等情况,仅依靠判别式模型无法得到完整的语义信息,因而导致模型效果欠佳.该文将临床术语标准化任务类比为翻译任务,引入深度生成式模型对描述文本的核心语义进行生成并得到标准词候选集,再利用基于BERT的语义相似度算法对候选集进行重排序得到最终标准词.该方法在第五届中国健康信息处理会议(CHIP2019)评测数据中进行了实验并取得了很好的效果.

关键词：术语标准化、核心语义、生成式模型

所属期刊栏目：35

分类号：TP391(计算技术、计算机技术)

在线出版日期：2021-05-27（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：77-85

英文信息展示

期刊专题