基于预训练语言模型的中医症状标准化方法-期刊-万方数据知识服务平台

搜索

DOI: 10.13190/j.jbupt.2021-191

基于预训练语言模型的中医症状标准化方法

1.北京科技大学计算机与通信工程学院, 北京100083;材料领域知识工程北京市重点实验室,北京1000832.材料领域知识工程北京市重点实验室,北京100083

引用

打印

摘要：为了解决中医症状描述词的异名同义、一对多的问题,提出了一种基于预训练语言模型的2阶段症状标准化框架:第1阶段,生成候选标准症状词,参考中医症状词的定义与分类,利用多标签分类思想对原始症状词进行语义划分,进而得到相应语义标签下的候选标准症状词;第2阶段,对候选标准症状词进行排序,使用匹配模型对第1阶段得到的候选标准症状词集进行评分与排序,同时用策略对结果进行二次召回以提高症状标准化框架的性能,由此得到最终的标准化结果.实验结果表明,提出的症状标准化方法与传统方法相比能够更有效地处理症状标准化的问题.通过对比分析不同预训练语言模型在症状标准化任务上的性能,进一步说明了所提框架和策略的有效性.

关键词：

中医症状标准化实体匹配语义分类预训练语言模型

分类号：

TP391.1(计算技术、计算机技术)

资助基金：

国家重点研发计划 ( 2018YFC1707410 )

在线出版日期：

2022-09-09 （万方平台首次上网日期，不代表论文的发表时间）

页数：

7 (13-18,57)

英文信息

北京邮电大学学报

EI CSTPCD 北大核心

ISSN：1007-5321

年,卷(期)：2022,45(4)

所属栏目：智慧医疗