10.11772/j.issn.1001-9081.201711112631
基于改进的多层BLSTM的中文分词和标点预测
目前主流的序列标注问题是基于循环神经网络(RNN)实现的.针对RNN和序列标注问题进行研究,提出了一种改进型的多层双向长短时记忆(BLSTM)网络,该网络每层的BLSTM都有一次信息融合,输出包含更多的上下文信息.另外找到一种基于序列标注的可以并行执行中文分词和标点预测的联合任务方法.在公卉的数据集上的实验结果表明,所提出的改进型的多层BLSTM网络模型性能优越,提升了中文分词和标点预测的分类精度;在需要完成中文分词和标点预测两项任务时,联合任务方法能够大幅地降低系统复杂度;新的模型及基于该模型的联合任务方法也可应用到其他序列标注任务中.
中文分词、标点预测、序列标注、双向长短时记忆网络
38
TP391.1(计算技术、计算机技术)
2018-06-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
1278-1282,1314