10.3969/j.issn.1672-9722.2021.08.017
基于词聚类CNN和Bi-LSTM的汉语复句关系识别方法
复句关系识别是对分句间语义关系的甄别,是复句语义分析的关键.由于非充盈态汉语复句存在隐式关系的特点,给语义关系识别造成了困难.因此,为了深度挖掘复句中隐含的语义信息实现正确的关系分类,该文提出了一种基于词聚类的CNN与Bi-LSTM相结合的网络结构BCCNN.其中,通过使用词聚类算法对单词向量建模提取单词间的语义相似特征,并在此基础上使用CNN对复句进行深度建模以获得复句的局部特征.另外,该文将CNN中的池化层替换为Bi-LSTM网络层,在减少池化操作所带来语义信息丢失的同时又得到了全局的长距离语义依赖特征.与其他基于汉语复句语料库(CCCS)和清华汉语树库(TCT)的实验结果对比,论文的方法达到了较好的识别效果,其准确率分别达到了92.4%和90.7%.
复句关系识别;非充盈态复句;词聚类算法;卷积神经网络(CNN);双向长短时记忆网络(Bi-LSTM)
49
TP391.1(计算技术、计算机技术)
国家社会科学基金项目;教育部人文社会科学研究规划基金项目
2021-09-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
1588-1593