基于预训练语言模型的中医症状标准化方法
为了解决中医症状描述词的异名同义、一对多的问题,提出了一种基于预训练语言模型的2阶段症状标准化框架:第1阶段,生成候选标准症状词,参考中医症状词的定义与分类,利用多标签分类思想对原始症状词进行语义划分,进而得到相应语义标签下的候选标准症状词;第2阶段,对候选标准症状词进行排序,使用匹配模型对第1阶段得到的候选标准症状词集进行评分与排序,同时用策略对结果进行二次召回以提高症状标准化框架的性能,由此得到最终的标准化结果.实验结果表明,提出的症状标准化方法与传统方法相比能够更有效地处理症状标准化的问题.通过对比分析不同预训练语言模型在症状标准化任务上的性能,进一步说明了所提框架和策略的有效性.
中医、症状标准化、实体匹配、语义分类、预训练语言模型
45
TP391.1(计算技术、计算机技术)
国家重点研发计划2018YFC1707410
2022-09-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
13-18,57