10.11925/infotech.2096-3467.2021.0671
利用Text-CNN改进PubMedBERT在化学诱导性疾病实体关系分类效果的尝试
[目的]改进PubMedBERT在化学诱导性疾病(CID)实体关系分类的效果.[方法]提出一种基于PubMedBERT并结合Text-CNN的实体关系分类方法.该方法以实体对和文本组成句子对进行输入,利用PubMedBERT预训练模型对化学诱导性疾病相关文本进行编码获取全局特征,通过Text-CNN捕捉文本局部重要信息,判断实体对是否具有CID关系.[结果]在BioCreative V CDR数据集中,该方法的精确率、召回率和F1值分别达到78.3%、73.5%和75.8%,较其他方法最少提升了 3.1%、1.5%和3.3%.[局限]仅考虑了化学诱导性疾病文本语料,在临床等其他语料上的效果有待检验.[结论]该方法能够捕捉化学诱导性疾病文本特征,提升实体关系分类的效果.
CID实体关系分类;PubMedBERT;Text-CNN;句子对
5
TP391(计算技术、计算机技术)
2022-02-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
145-152