10.3969/j.issn.1001-4616.2022.01.018
基于组合深度模型的现代汉语数量名短语识别
数量名短语的识别是识别由数量短语修饰的名词短语左右边界的研究.以往研究中,基于统计学习模型的数量短语识别方法依赖人工特征,需要通过专家知识构建知识库来实现对"数词+量词"短语的识别.本文在以往研究基础上纳入"名词"形成"数词+量词+名词"等八类数量名短语,并采用深度学习方法解决这一边界识别任务.通过BERT模型对原始文本进行上下文特征表示,利用Lattice LSTM模型字词结合的思想将标准分词作为软特征融入文本字符级的特征表示中,最后通过CRF全局约束识别数量名短语边界.实验结果表明,本文方法在AMR语料上达到较优结果,精确率、召回率、F1值分别为80.83%,89.78%,85.07%.
数量名短语识别,BERT,Lattice LSTM;CRF
45
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家社会科学基金
2022-03-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
127-135