10.3969/j.issn.1003-0077.2019.03.009
基于深度神经网络的维吾尔文命名实体识别研究
现有的维吾尔文命名实体识别主要采用基于条件随机场的统计学习方法,但依赖于人工提取的特征工程和领域知识.针对该问题,该文提出了一种基于深度神经网络的学习方法,并引入不同的特征向量表示.首先利用大规模未标注语料训练的词向量模型获取每个单词具有语义信息的词向量;其次,利用Bi-LSTM提取单词的字符级向量;然后,利用直接串联法或注意力机制处理词向量和字符级向量,进一步获取联合向量表示;最后,用Bi-LSTM-CRF深度神经网络模型进行命名实体标注.实验结果表明,以基于注意力机制的联合向量表示作为输入的Bi-LSTM-CRF方法在维吾尔文命名实体识别上F值达到90.13%.
维吾尔文命名实体识别、长短时记忆网络、条件随机场、注意力机制
33
TP391(计算技术、计算机技术)
国家973计划2014CB340506;国家自然科学基金61462083 ,61262060 ,61662077 ,61331011;新疆多语种信息技术实验室开放课题2016D03023
2019-04-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
64-70