10.19678/j.issn.1000-3428.0060062
基于有向图模型的旅游领域命名实体识别
旅游领域命名实体识别是旅游知识图谱构建过程中的关键步骤,与通用领域的实体相比,旅游文本的实体具有长度长、一词多义、嵌套严重的特点,导致命名实体识别准确率低.提出一种融合词典信息的有向图神经网络(L-CGNN)模型,用于旅游领域中的命名实体识别.将预训练词向量通过卷积神经网络提取丰富的字特征,利用词典构造句子的有向图,以生成邻接矩阵并融合字词信息,通过将包含局部特征的词向量和邻接矩阵输入图神经网络(GNN)中,提取全局语义信息,并引入条件随机场(CRF)得到最优的标签序列.实验结果表明,相比Lattice LSTM、ID-CNN+CRF、CRF等模型,L-CGNN模型在旅游和简历数据集上具有较高的识别准确率,其F1值分别达到86.86%和95.02%.
知识图谱;命名实体识别;卷积神经网络;图神经网络;条件随机场
48
TP391(计算技术、计算机技术)
国家自然科学基金;新疆大学基金
2022-02-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
306-313