10.3969/j.issn.1672-9722.2023.04.010
融合偏旁特征的化学命名实体识别研究
化学实体识别是构建化学学科知识图谱,形成学科知识体系的基础步骤.中学化学课程语料多为非结构化文本数据,且具有语料少、相同词根相似语义的特性.传统的小规模特定领域的实体识别多基于规则和统计机器学习模型,需要大量的专家辅助和筛选,存在着可移植性弱,扩展维护难的问题.论文针对领域特性构建了基于BiLSTM-CRF的改进模型,融合了偏旁部首的词根向量特征进行化学实体识别.在人教版高中化学教材上进行对比实验,实验表明该方法在F1度量上高于实验中的基准模型,证明了此方法在中学化学知识点实体识别上的有效性.
深度学习、命名实体识别、偏旁特征、非结构化文本
51
TP391.1(计算技术、计算机技术)
国家重点研发计划2018YFB1004904
2023-08-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
809-813,892